Luận văn Nghiên cứu công nghệ Olap và ứng dụng

Mục lục

 

Lời cảm ơn. .2 

Mục lục . 3 

Bảng các kí hiệu, chữviết tắt . 6 

Bảng danh mục các bảng biểu . 7 

Bảng danh mục các hình vẽ. 8 

Tóm tắt nội dung luận văn . 10 

Mở đầu . 11 

Cơsởlý thuyết . 15 

Chương 1  Công nghệOLAP . 15 

1.1 Giới thiệu vềData Warehouse . 15 

1.1.1 Định nghĩa. 15 

1.1.2 Ý nghĩa của Data Warehouse . 16 

1.1.3 Đặc điểm của Data Warehouse . 16 

1.1.4 Cấu trúc của Data Warehouse . 19 

1.2 Tổng quan vềOLAP . 19 

1.2.1 Giới thiệu . 19 

1.2.2 Đặc điểm của OLAP: . 21 

1.3 Các mô hình OLAP. 21 

1.3.1 MOLAP (Multidimensional OLAP) . 21 

1.3.2 ROLAP (Relational OLAP) . 22 

1.3.3 HOLAP (Hybrid OLAP) . 25 

1.3.4 So sánh các mô hình . 26 

Chương 2  OLAP trong MS SQL Server Analysis Service (SSAS) . 27 

2.1. Kiến trúc các thành phần OLAP trong SSAS . 27 

2.1.1 Cube . 27 

2.1.2 Dimension . 29 

2.1.3 Measure . 31 

2.1.4 Fact table (Fact) . 31 

2.1.5 Slice . 32 

2.1.6 Partition . 33 

4

2.1.7 Role . 33 

2.1.8 Schedule (Lập lịch) . 34 

2.2. Quy trình thiết kếcác đối tượng trong SSAS . 35 

2.2.1 Sơlược vềquy trình xây dựng Data Warehouse . 35 

2.2.1.1 Quy trình chung . 35 

2.2.1.2 Công cụthực hiện: . 37 

2.2.2 Quy trình tạo Cube: . 37 

Chương 3  Component Pivot Table trong Excel . 43 

3.1. Pivot Table . 43 

3.1.1 Giới thiệu . 43 

3.1.2 Cách sửdụng . 43 

3.2. PivotChart . 46 

3.3. Giới thiệu một sốcông cụhỗtrợOLAP tương tựnhưPivot Table của Excel . 47 

3.3.1 RadarCube OLAP . 47 

3.3.2 Data Dynamics Analysis . 48 

3.3.3 ComponentOne OLAP for WinForm . 49 

3.3.4 Devexpress ASPxPivotGrid . 49 

3.4 So sánh Pivot Table với các công cụkhác:. 50 

Ưu điểm: . 50 

Nhược điểm: . 50 

Kết luận: . 51 

Chương 4  Các thưviện lập trình liên quan đến SSAS . 52 

4.1. AMO . 52 

4.2. ADOMD.NET. 53 

4.3. SMO .53 

4.4. MDX . 55 

4.4.1 Cấu trúc chung . 55 

4.4.2 Ví dụmẫu. 55 

4.4.3 Lưu ý . 56 

Chương 5  Xây dựng công cụWeb hỗtrợphân tích dữliệu cho các ứng dụng OLTP58 

5.1. Phân tích, thiết kế. 58 

5.1.1 Phân tích . 58 

5.1.1.1 Quy trình xửlý nghiệp vụ: . 58 

5.1.1.2 Yêu cầu chức năng: . 60 

5.1.1.3 Mô hình quan niệm dữliệu: . 66 

5

5.1.2 Thiết kế. 72 

5.1.2.1 Dữliệu: . 72 

5.1.2.2 Kiến trúc module: . 79 

5.1.2.3 Hệthống giao diện: . 80 

5.2. Cài đặt, lập trình. 88 

Đánh giá, bàn luận vềkết quả. 89 

Kết luận - Hướng phát triển . 91 

Các kết quả đã đạt được . 91 

1. Vềlý thuyết . 91 

2. Vềthực nghiệm . 91 

Danh mục tài liệu tham khảo . 93

pdf94 trang | Chia sẻ: netpro | Lượt xem: 6712 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu công nghệ Olap và ứng dụng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
an cho phép dễ dàng lựa chọn, định hướng và khám phá dữ liệu. • Cung cấp một ngôn ngữ truy vấn phân tích, cung cấp sức mạnh để khám phá các mối quan hệ trong dữ liệu kinh doanh phức tạp. • Dữ liệu được tính toán trước đối với các truy vấn thường xuyên nhằm làm cho thời gian trả lời rất nhanh đối với các truy vấn đặc biệt. 21 • Cung cấp các công cụ mạnh giúp người dùng tạo các khung nhìn mới của dữ liệu dựa trên một tập các hàm tính toán đặc biệt. • Hỗ trợ tạo mô hình chức năng để dự báo, phân tích xu thế phát triển và phân tích thống kê. • Tìm kiếm và hiển thị dữ liệu dưới dạng biểu đồ, không gian 2D, 3D, … ¾ OLAP được đặt ra để xử lý các truy vấn liên quan đến lượng dữ liệu rất lớn mà nếu cho thực thi các truy vấn này trong hệ thống OLTP sẽ không thể cho kết quả hoặc sẽ mất rất nhiều thời gian. 1.2.2 Đặc điểm của OLAP: ¾ Được biết đến như là một phần của kho dữ liệu ¾ Cung cấp các báo cáo, phân tích tiền tính toán, các đồ thị, biểu đồ ¾ Cho phép phân tích trực tuyến dữ liệu ¾ Thăm dò sự tương tác dữ liệu ¾ Cung cấp các giao diện đa dạng cho người dùng ¾ Cung cấp khả năng phân tích dữ liệu phức tạp bằng phương thức đơn giản 1.3 Các mô hình OLAP 1.3.1 MOLAP (Multidimensional OLAP) ¾ Mô hình MOLAP lưu trữ dữ liệu cơ sở (là dữ liệu từ các bảng của kho dữ liệu) và thông tin tổng hợp (là các độ đo được tính toán từ các bảng) trong các khối ¾ ¾ ¾ 1 ¾ Dữ liệu đ Dữ liệu t nhật lại n MOLAP Ví dụ: tổ .3.2 RO Mô hình trong các ược tìm th rong MOL hững dữ l thích hợ ng hợp do LAP (R OLAP qu bảng qua Hình 8 ấy tại điểm AP cần ph iệu mới tro p cho các anh thu củ elationa an hệ (RO n hệ 22 : Mô hình d giao của ải được p ng Data W truy vấn t a từng chi l OLAP LAP) lưu ữ liệu MO các chiều rocess sau arehouse ổng hợp d nhánh tron ) trữ dữ liệ LAP một thời g . ữ liệu the g vòng 2 n u cơ sở và ian nhất đ o thời gia ăm trở lại thông tin ịnh để cập n dài. . tổng hợp ¾ ¾ Dữ liệu đ Có 2 kiể • L ch ược tìm th u mô hình ược đồ hìn iều Hình 9 ấy tại điểm dữ liệu: h sao (sta 23 : Mô hình giao của r): mỗi mộ dữ liệu RO 1 cột và 1 t chiều ch LAP một hàng ỉ được xâ y dựng từ một bảng 24 Hình 10: Lược đồ hình sao • Lược đồ hình bông tuyết (snowflake): mỗi chiều được xây dựng từ nhiều bảng chiều Hình 11: Lược đồ hình bông tuyết ¾ ROLAP thích hợp cho các truy vấn dữ liệu theo thời gian thực (xảy ra thường xuyên và đòi hỏi độ chính xác tức thời). Ví dụ: xem thông tin chứng khoán 25 1.3.3 HOLAP (Hybrid OLAP) ¾ Là mô hình OLAP lai (HOLAP) là sự kết hợp giữa MOLAP và ROLAP. Hình 12: Mô hình dữ liệu HOLAP ¾ HOLAP là mô hình lai giữa MOLAP và HOLAP, kết hợp những ưu điểm và loại bỏ những khuyết điểm của 2 mô hình trên nhằm tạo ra một mô hình tối ưu ¾ Lợi ích của việc lưu trữ trong cấu trúc HOLAP là: • Lưu dữ liệu tổng hợp trong Cube (theo MOLAP) để tăng tốc độ xử lý các truy vấn phức tạp • Lưu trữ dữ liệu cơ sở trong các bảng quan hệ (theo ROLAP) nhằm tiết kiệm không gian lưu trữ Ví dụ: Trong một công ty chứng khoán: ƒ Dữ liệu về thông tin nhân viên, doanh thu của 2 năm trở về trước => lưu trong cube ƒ Dữ liệu về thông tin chứng khoán, giá cổ phiếu hằng ngày => lưu trong bảng quan hệ Ö Tối ưu hóa được vấn đề lưu trữ và xử lý của hệ thống. 26 1.3.4 So sánh các mô hình MOLAP ROLAP HOLAP Số chiều >2 2 >2 Lưu trữ dữ liệu cơ sở Khối Bảng quan hệ Bảng quan hệ Lưu trữ thông tin tổng hợp Khối Bảng quan hệ Khối Hiệu suất thực hiện truy vấn Nhanh nhất Chậm nhất Nhanh Tiêu thụ không gian lưu trữ Nhiều Thấp Trung bình Chi phí bảo trì Cao Thấp Trung bình Bảng 1: So sánh các mô hình OLAP Î KẾT LUẬN: Chọn mô hình nào cần dựa vào hiệu suất, mục đích khai thác, và lượng dữ liệu,… (ví dụ MOLAP: thích hợp với data marts <50 GB, ROLAP: lượng dữ liệu có thể lớn hơn) 27 Chương 2 OLAP trong MS SQL Server Analysis Service (SSAS) Giới thiệu sơ lược về SSAS ¾ Từ trước đến nay, SQL Server được biết đến với vai trò là một hệ quản trị cơ sở dữ liệu có trách nhiệm hỗ trợ quản lí, lưu trữ dữ liệu với Database Engine. Tuy nhiên, từ phiên bản SQL Server 2005 đến SQL Server 2008 và mới nhất là SQL Server 2008 R2, thì bộ SQL Server đã được tích hợp nhiều gói dịch vụ hỗ trợ việc tích hợp và khai thác khả năng tiềm tàng của một cơ sở dữ liệu như SQL Server Integrating Services, SQL Server Analysis Services và SQL Server Reporting Services. ¾ Analysis Services là một dịch vụ hỗ trợ mạnh mẽ việc phân tích, khai thác thông tin tiềm tàng bên trong của một hệ cơ sở dữ liệu. ¾ Analysis Services là công cụ dễ sử dụng, tích hợp và linh động giúp định nghĩa các chiều, xây dựng các khối dữ liệu đa chiều và cung cấp các chương trình ứng dụng truy xuất tới các khối này. 2.1. Kiến trúc các thành phần OLAP trong SSAS 2.1.1 Cube ¾ Cube (Khối) là phần tử chính trong xử lý phân tích trực tuyến, là tập con (subset) dữ liệu từ kho dữ liệu, được tổ chức và tổng hợp trong các cấu trúc đa chiều. ¾ Cube dùng các dimensions, fact table và các measure để mô tả dữ liệu trong cube. Ví dụ : một cube 3 chiều ¾ ¾ Một cub • N • V • T Một cub • L • M • K • K V e có thể có ếu có nhiề ề mặt lý th hường thì e bao gồm à một liên ột ô có thể hối thưa (s hối dày đặ í dụ về ô rỗ Hình nhiều chi u hơn 3 ch uyết thì số số chiều là nhiều ô dữ kết giữa cá là rỗng (k parsecube c (densecu ng: 28 13: Ví dụ v ều iều sẽ đượ chiều là k từ 4 đến 1 liệu c giá trị củ hông có d ): có nhiều be): có ít ô ề Khối (Cu c gọi là ‘si hông hạn 2 a chiều ữ liệu cho ô rỗng rỗng be) êu khối’ ( chế liên kết nà ”hypercub y) e”) 29 Hình 14: Ví dụ về ô rỗng trong khối ¾ Cube biễu diễn dữ liệu dưới dạng tổng hợp nhiều hơn là chi tiết như khi dùng bảng thông thường. Do đó, cube cho người dùng thấy được cái nhìn tóm tắt, tổng hợp của toàn bộ dữ liệu. ¾ Một cube có thể chứa toàn bộ hoặc một phần của dữ liệu nguồn (Data source view). Vì vậy các cube chỉ được lưu trữ và truy cập qua giới hạn riêng của nó. Dữ liệu được chuyển từ nguồn đến các cube qua công cụ ETL (Extract, Transform, and Load). 2.1.2 Dimension ¾ Các chiều là cách mô tả chủng loại mà theo đó các dữ liệu trong Cube được phân chia để phân tích ¾ Mỗi chiều có thể được xây dựng trên một hoặc nhiều bảng chiều (dimension table) nhằm mô tả cho chiều đó ¾ Các chiều được ánh xạ từ thông tin của các bảng chiều trong kho dữ liệu vào các mức phân cấp, ví dụ như chiều Địa lý thì gồm các mức như Lục địa, Quốc gia, Tỉnh-Thành phố. Trong ví dụ mô hình kinh doanh ở trên, chiều Thời gian có thể được mô tả bởi các thuộc tính như Năm, Quý, Tháng và Ngày. ¾ ¾ ph m th sả kh ph kh củ Các chiề nhằm xâ phân tích Chiều có Phân cấp ân cấp mà ột cấu trúc Ví dụ: N ì chúng ta n phẩm, tứ ác thì chú Như vậy ải được th ông hoạch a những p u được tạ y dựng cá luôn ổn đ Hình sự phân c là cột sốn việc gộp đa mức h ếu chúng cần quan c là chúng ng ta cần t có thể có ực hiện m định trướ hân cấp rộ o một các c Cube dễ ịnh. 15: Ví dụ v ấp : g của việc dữ liệu mớ ay phân cấ ta làm nhữ sát ở nhữn ta đã thự hực hiện n quá nhiều ột cách d c. Điều n ng và sâu. 30 h độc lập dàng và đ ề các Dime gộp dữ li i có thể th p. ng quyết g dữ liệu v c hiện một hững phép tiến trình ễ dàng, lin ày có thể đ và có thể ể chắc chắ nsion (Ch ệu hay nói ực hiện đư định về giá ề doanh th cách gộp. gộp tươn gộp. Thế h hoạt để ược giải q chia sẻ gi n rằng thô iều) khác n một cách ợc. Phần sản phẩm u sản phẩ Khi cần là g ứng khác nên các tiế có thể hỗ uyết trên ữa các OL ng tin tổn hau khác là dự lớn các ch để tối đa m được gộ m những q . n trình gộ trợ những cơ sở có s AP Cube g hợp cho a vào các iều đều có doanh thu p theo giá uyết định p này cần phân tích ự trợ giúp 2 ¾ ¾ 2 ¾ ¾ ¾ .1.3 Me Các đơn những g hoặc số l Là đơn v .1.4 Fac Fact là dimensio Một fact đồng thờ Fact đượ asure vị đo của iá trị số từ ượng bán. ị đo để đán t table ( bảng mô n đã được gồm các i chứa các c lưu tại m khối là các bảng Fact h giá, phâ Fact) tả sự kiện xây dựng trường ch measure c ột cấp dữ H 31 cột trong mà được n tích dữ l mà hệ th sẵn nhằm ứa khoá c ủa cube. M liệu thô nà ình 16: F bảng Fact tổng hợp iệu. ống muố tổ chức dữ hính của c ỗi fact có o đó act Table . Các đơn phân tích n n phân tíc liệu một c ác dimen các measu vị đo lườn hư định g h, kết hợ ách có hệ sion mà nó re khác nh g xác định iá, trị giá, p với các thống. kết hợp, au. 32 2.1.5 Slice ¾ Slice là một “lát cắt”, tương ứng một giá trị duy nhất cho chiều “được chiếu” với các giá trị thành viên của các chiều khác. Hình 17: Slice 33 2.1.6 Partition ¾ Tất cả các khối đều có tối thiểu một phân hoạch (Partition) để chứa dữ liệu của nó. Một partition đơn được tự động tạo ra khi khối được định nghĩa. ¾ Khi ta tạo một partition mới cho một khối, partition mới này được thêm vào trong tập hợp các partition đã tồn tại đối với khối. ¾ Khối phản ánh dữ liệu đã được kết nối có trong tất cả các partition của nó. Một bảng partition của khối là vô hình đối với người dùng. ¾ Các partition tiêu biểu cho một công cụ mạnh, mềm dẻo cho việc quản trị các khối OLAP, đặc biệt các khối lớn. Ví dụ: Một khối chứa thông tin thương mại có thể chứa trong một hoặc nhiều partition cho dữ liệu của những năm trước và các partition cho mỗi quý của năm hiện tại. Cuối năm các bảng partition của bốn quý có thể được hợp nhất trong một partition đơn cho năm đó. Các bảng partition có thể được lưu trữ với các sự lựa chọn kết hợp khác nhau theo phương thức lưu trữ, định vị dữ liệu nguồn và thiết kế kết hợp. Tính mềm dẻo này cho phép ta thiết kế các chiến lược lưu trữ khối thích hợp với các yêu cầu của ta. 2.1.7 Role ¾ Bảo mật trong Analysis Services được tích hợp sẵn và dựa trên bảo mật của Microsoft Windows. Để Analysis Services được bảo mật, ta tạo các role trong database OLAP. Mỗi role có thế chứa một hoặc nhiều user (group) được tạo trong hệ điều hành. Mỗi role được tạo ra sẽ liên kết với các cube trong database OLAP. Nhờ vậy, ta có thể quản lý sự bảo mật của cube bằng cách hạn chế truy cập metadata (các member trong dimemsion) cũng như truy cập data (các giá trị lưu trữ trong cube). ¾ Analysis Services có một role cố định được tạo sẵn, bao gồm các thành viên của group Administrators trên máy chủ server, được gọi là server role. ¾ Để có thể thực thi mọi tác vụ trong hệ thống Analysis Services, user đang dùng 34 phải là thành viên của group Administrators. Tất cả thành viên trong group này được toàn quyền trên các cube và các database của server. ¾ Trong thực tế, người ta tạo ra các role trên mỗi database, gọi là database role, cho phép một user chỉ được quyền quản trị trên một database. ¾ Ngoài ra, ta còn có thể tạo các role ở cấp độ cube (truy cập toàn bộ một số cube quy định) hoặc ở cấp độ dimension (truy cập data ở một số dimension của một số cube nhất định) 2.1.8 Schedule (Lập lịch) ¾ Tại một thời điểm nào đó, hệ thống OLAP server cần phải process lại để update những thay đổi từ phía Database Server, đảm bảo cho Client có thể truy xuất được những dữ liệu mới nhất và đầy đủ của hệ thống. ¾ Có 2 cách process: thủ công và tự động • Thủ công: có thể tiến hành process thủ công khi cần thiết ( có sự thay đổi dữ liệu hay cấu trúc hệ thống). • Tự động: có thể lập lịch cho hệ thống tự động process sau một khoảng thời gian quy định trước. 35 2.2. Quy trình thiết kế các đối tượng trong SSAS Hình 18: Các đối tượng trong SSAS 2.2.1 Sơ lược về quy trình xây dựng Data Warehouse 2.2.1.1 Quy trình chung ¾ Nhận dạng dữ liệu nguồn (Identify the data source): • Một trong những bước đầu tiên để xây dựng Data Warehouse là phải nhận biết các nguồn dữ liệu. Ta cần phải tính toán và xem xét những dữ liệu nào cần thiết để đưa vào Data Warehouse. • Trong một Data Warehouse, có hai loại nguồn dữ liệu cần xem xét, đó là nguồn dữ liệu bên trong (internal data source) và bên ngoài (external data source). Dữ liệu bên trong là những dữ liệu đã có sẵn trong hệ thống hiện tại. Dữ liệu bên ngoài là những dữ liệu từ nhiều nguồn khác nhau ngoài hệ thống. ¾ Chọn lọc dữ liệu (Extracting Transactional Data): 36 • Đây là bước chi phối hầu hết thời gian của quy trình, vì chúng ta cần phải lấy dữ liệu từ nhiều nguồn đã nhận dạng ra để đưa vào kho lưu trữ trung tâm. • Do các nguồn dữ liệu xuất phát từ nhiều hệ thống khác nhau nên các hệ quản trị CSDL của chúng cũng khác nhau, chẳng hạn như MS Access, MS SQL Server, Oracle, Sybase, hoặc cũng có thể là flat files, spreadsheets, mail systems và nhiều dạng lưu trữ dữ liệu khác. Vì thế, ta cần quyết định sẽ sử dụng hệ CSDL nào cho việc tổ chức kho dữ liệu. ¾ Chuyển đổi dữ liệu (Transforming Transactional Data): • Là quá trình chuyển đổi nhằm đảm bảo tính nhất quản của dữ liệu sau khi đã được chọn lọc từ nhiều nguồn khác nhau. • Để có thể chuyển đổi dữ liệu vào Data Warehouse một cách chính xác, ta cần phải xác định ánh xạ của các trường (field) từ nguồn dữ liệu bên ngoài đến các trường của data warehouse. • Sự chuyển đổi này có thể được thực hiện trong quá trình chọn lọc (extracting) hoặc trong khi dữ liệu được đưa vào data warehouse. ¾ Tải dữ liệu (Loading the Data): • Khi quá trình chọn lọc, chuyển đổi và làm sạch đã hoàn tất, dữ liệu sẽ được tải vào data warehouse. • Việc tải dữ liệu có thể phân thành hai loại: tải toàn bộ dữ liệu đang có trong CSDL nguồn và tải những dữ liệu có sự thay đổi trong CSDL nguồn vào data warehouse. • Dữ liệu trong data warehouse phải luôn được làm tươi, có nghĩa phải cập nhật những thay đổi của dữ liệu. • Trong khi cập nhật data warehouse cần phải đảm bảo không có dữ liệu nào bị mất, đồng thời chi phí cho quá trình duyệt các file đã tồn tại phải đạt mức thấp nhất. 37 2.2.1.2 Công cụ thực hiện: ¾ Extract-Transform-Load (ETL): điển hình như DTS (Data Transformation Services) trong SQL Server, Informatica,... Về công cụ ETL dạng Open source có thể kể đến Talend, Kettle… ¾ Lập lịch: SQL Server Agent dùng để lập lịch cho việc tự động chuyển đổi từ CSDL nguồn vào data warehouse. 2.2.2 Quy trình tạo Cube: ¾ Công cụ và database mẫu sử dụng: • Business Intelligence Studio (đi kèm với MS SQL Sever) • Adventure Work Cycle Sample Database (có thể download tại ) ¾ Để tạo một Cube, trước tiên ta cần phải có những thành phần sau: DataSource, DataSource View, Dimension, ... 2.2.2.1 Tạo DataSource Các bước như sau: 1. Trong khung Solution Explorer, phải chuột Data Sources và chọn New Data Source 2. Tại màn hình Welcome to Data Source Wizard, nhấn Next để chuyển sang cửa sổ Select how to define the connection 3. Tại cửa sổ Select how to define the connection page, ta có thể định nghĩa một data source bằng cách tạo mới connection hoặc trên một connection đã có sẵn. Trong bài hướng dẫn này, ta sẽ định nghĩa một data source bằng cách tạo mới một connection, kiểm tra checkbox Create a data source based on an existing or new connection được chọn và nhấn New 38 4. Trong dialog box Connection Manager, ta sẽ định nghĩa giá trị thuộc tính cho Data Source. Trong danh sách Provider, chọn Native OLE DB\SQL Server Native Client 10.0 5. Trong Server Name, gõ vào localhost 6. Kiểm tra giá trị Use Windows Authentication được chọn, trong danh sách Select or enter a database name, ví dụ ở đây ta chọn database Adventure Works DW2008 7. Nhấn Test Connection để kiếm tra kết nối đến với SQL Server 8. Chọn OK và nhấn Next 9. Tại cửa sổ Impersonation Information, ta sẽ thiết lập Security Credential cho SSAS để kết nối tới Data Sources, ta chọn Use the Service account, và nhấn Next. 10. Tại màn hình Completing the wizard, thiết lập tên của Data Source là Adventure Work DW và chọn Finish. 2.2.2.2 Tạo DataSource View Các bước như sau: 1. Trong khung Solution Explorer, phải chuột Data Sources Views, và chọn New Data Source Views 2. Cửa số Welcome to Data Source View Wizard xuất hiện, nhấn Next 3. Dialog Select data source xuất hiện, tại mục Relational Data Sources, chọn Adventure Work DW mà ta đã tạo như trên rồi chọn Next. 4. Tại Dialog Select Tables and Views, ta sẽ chọn các bảng dữ liệu và views từ danh sách đối tượng, ta sẽ chọn các đối tượng sau: ƒ DimCustomer (dbo) ƒ DimDate (dbo) ƒ DimGeography (dbo) ƒ DimProduct (dbo) 39 ƒ FactInternetSales (dbo) 5. Nhấn nút “>” để thêm các bảng vào danh sách Included Objects 6. Nhấn Next 7. Tại thuộc tính Name, ta thiết lập là Adventure Wordk DW và nhấn Finish để hoàn tất việc đĩnh nghĩa một data source view. Data Source View Adventure Work DW sẽ hiển thị tại Data Source View Designer trong Business Intelligence Development Studio và gồm các thành phần sau: o Diagram Pane thể hiện mối quan hệ giữa các bảng dữ liệu trực quan o Tables Pane: các bảng dữ liệu và schema được thể hiện theo tree view o Diagram Organizer Pane hỗ trợ tạo các subdiagram mà thông qua đó ta có thể có dc các subsets của data source view Sau khi hoàn tất bước này, ta sẽ có khung nhìn toàn diện về các bảng dữ liệu và mối quan hệ của chúng. 2.2.2.3 Tạo Dimension Các bước như sau: 1. Trong pane Solution Explorer, phải chuột Dimentsions, chọn New Dimensions. 2. Tại cửa sổ Welcome to Dimension Wizard, chọn Next 3. Tại cửa số Select Creation Method, đảm bảo tùy chọn Use an Existing Table được chọn, chọn Next. 4. Tại cửa sổ Specify Source Information, đảm bảo data source Adventure Works DW được chọn. 5. Trong danh sách Main Table, chọn Date 6. Tại trang Select Dimension Attributes, chọn các Attributes sau: ƒ Date Key 40 ƒ Full Date Alternate Key ƒ English Month Name ƒ Calendar Quarter ƒ Calendar Year ƒ Calendar Semester 7. Thay đổi Attribute Type của cho thuộc tính Full Date Alternate Key từ Regular sang Date bằng cách chọn vào Regular và tiến hành thay đổi. Thực hiện tương tự cho các thuộc tính khác. ƒ English Month Name –> Month ƒ Calendar Quarter –> Quarter ƒ Calendar Year –> Year ƒ Calendar Semester –> Half Year 8. Nhấn Next 9. Tại màn hình Completing the Wizard, trong Preview Pane, ta có thể thấy dimension Date và các thuộc tính của nó. 10. Nhấn Finish để hoàn tất việc định nghĩa Dimension 11. Tiến hành Save All Project 2.2.2.4 Tạo Cube Các bước như sau: 1. Trong Solution Explorer Pane, phải chuột Cubes, chọn New Cubes 2. Tại cửa sổ Welcome to the Cube Wizard, chọn Next 3. Tại cửa sổ Select Creation Method, chọn Use existing tables và nhấn Next 4. tại cửa sổ Select Measure Group Tables, đảm bảo Adventure Works DW data source view được chọn, và nhấn Next. 41 5. Nhấn Suggest để cửa số Suggest Table hiển thị và đề xuất các table cần thiết để xây dựng các measure group. 6. Nhấn Next 7. tại cửa sổ Select Measure, xem lại InternetSales measure group và deselect các checkbox cho các giá trị sau a. Promotion Key b. Currency Key c. Sales Territory Key d. Revision Number 8. Chọn Next 9. tại cửa sổ Selecting Existing Dimensions, chọn Date dimension đã dc định nghĩa và chọn Next 10. Trong cửa sổ Select New Dimension, chọn các dimension mới để thiết lập, đảm bảo Customer, Geography và Product được chọn và deselect InternetSales. 11. Nhấn Next 12. tại cửa sổ Completing the Wizard, thiết lập name của Cube là Analysis Services Tutorial, 13. Chọn Finish để hoàn tất 14. Tiến hành Save All Deploy Cube lên server 1. Trong Solution Explorer Pane, phải chuột Analysis Services Tutorial và chọn Properties. 2. tại Configuration Properties tại pane bên trái, chọn Deployment 3. Chọn OK 4. Phải chuột Analysis Service Tutorial project và chọn Deploy 5. Review lại cửa sổ Output và Deployment Progress – Analysis Service Tutorial để đảm bảo cube được build không có lỗi khi build 42 6. Như vậy project SSAS đã được deploy lên server Browsing Cube : 1. Chuyển sang Dimension Designer cho Product Dimension trong Business Intelligence Studio bằng cách double click vào Product dimension trong Dimension Node 2. Click Browse để hiển thị cây cấu trúc của Product Key 3. Chuyển sang Cube Designer trong Business Intelligence Development Studio bằng cách double click vào Analysis Service Tutorial trong cube node. 4. Chuyển sang Browse tab và nhấn vào biểu tượng reconnect, cửa sổ Browse tab gồm 2 phần ƒ Left Pane: thể hiện các đối tượng của Analysis Service Tutorial Cube ƒ Right Pane gồm 2 phần: phần trên là Filter Pane, phần dưới là Data Pane và việc phân tích, thể hiện dữ liệu sẽ được thực hiện tại đây. 43 Chương 3 Component Pivot Table trong Excel 3.1. Pivot Table 3.1.1 Giới thiệu ¾ Pivot Table là một công cụ rất mạnh của Excel trong việc tạo ra các báo cáo phân tích dữ liệu. Dùng kết hợp 2 công cụ Pivot Table và PivotChart sẽ tạo ra các báo cáo phân tích số liệu hết sức sinh động và hiệu quả. Hình 19: Pivot Table 3.1.2 Cách sử dụng ¾ Tạo một Pivot Table Để tạo một Pivot Table sử dụng PivotTable Wizard bạn cần cho Excel biết tổng hợp trường nào theo cột và trường nào theo hàng. Bạn cũng có thể chỉ định trường trang để xếp các nhóm theo trang. Bạn có thể đảo lại vị trí của các trường để có một bảng tổng hợp khác. 44 Bạn có thể tạo một pivot table từ nhiều nguồn dữ liệu khác nhau. Thường nguồn dữ liệu là các bảng của Excel. Bạn cũng có thể tạo Pivot Table từ nguồn dữ liệu ngoại, từ nhiều vùng hợp lại, hay từ chính các Pivot Table khác. Các bước 1. Chọn một ô bất kỳ trong danh sách cần tổng hợp; gọi Data> PivotTable Report. 2. Trong bước 1 của PivotTable Wizard, chọn nguồn dữ liệu ( Microsoft Excel List hay từ các cơ sở dữ liệu khác); sau đó nhấn nút Next. 3. Trong bước 2 của PivotTable Wizard, vùng địa chỉ của danh sách xuất hiện trong hộp Range. Nếu địa chỉ sai hãy chỉnh lại. Sau đó nhấn Next. 4. Trong bước 3 của PivotTable Wizard, bạn trình bày bố cục của pivot table. Các trường trở thành các nút nằm bên phải của cửa sổ. Kéo nút ứng với trường dữ liệu vào vùng DATA. Để sắp xếp một trường theo cột, kéo nút của trường đó len vùng COLUMN. Để sắp xếp một trường theo hàng, kéo đến vùng ROW. Nhấn nút Next. 5. Trong bước 4 của PivotTable Wizard, bạn chỉ định ô để đặt pivot table. Nếu muốn đặt thêm các tuỳ chọn khác cho pivot table, nhấn nút Options, đặt các tuỳ chọn khác, và nhấn OK. sau đó nhấn Finish. ¾ Các hiệu chỉnh trên một Pivot Table : Thay đổi tên trường Vì pivot tables chỉ là bảng hiển thị thông tin nên bạn không thể thay đổi thông tin trên bảng. Bạn chỉ có thể thay tên của các trường. 1. Để hiệu chỉnh tên trường, chọn trường 2. nhập tên mới. 45 TIP: Để thay đổi các tuỳ chọn khác cho một trường, nhấn kép lên nút của trường đó. Chọn các tuỳ chọn. Thêm trường dữ liệu 1. Để thêm trường dữ liệu, chọn một ô trong bảng pivot table. 2. Nhấn nút PivotTable Wizard trên thanh PivotTable. (Nhấn chuột phải lên vùng thanh công cụ, chọn PivotTable để hiển thị thanh này nếu chưa hiện) 3. Trong bước 3 của PivotTable Wizard, kéo thêm nút của trường bạn muốn thêm vào vùng DATA; nhấn nút Finish. Thêm trường Rows, Columns, hay Pages 1. Để thêm trường hàng, cột hay trang, chọn một ô bất kỳ trong pivot table. 2. Nhấn nút PivotTable Wizard trên thanh PivotTable. 3. Trong bước 3 của PivotTable Wizard, kéo các nút cần thiết vào vùng ROW, COLUMN, hay PAGE; sau đó nhấn Finish. TIP: Để bỏ một trường hàng, cột hay trang, kéo nút trường ra khỏi pivot table. Định dạng Pivot Table Bạn có thể sử dụng tính năng AutoFormat để định dạng 1. Chọn một ô trong bảng pivot table. Chọn Format, AutoFormat. 2. Trên Table Format , chọn định dạng mong muốn, nhấn OK. Chú ý: Để định dạng không bị mất khi ta thay đổi hay cập nhật lại bảng PivotTable cần đảm bảo mục Enable Selection trên PivotTable menu của thanh PivotTable được chọn. Cập nhật Pivot Table Một pivot table không tự cập nhật khi bạn thay đổi dữ liệu nguồn. 46 1. Để cập nhật pivot table, chọn một ô bất kỳ trong pivot table. 2. Nhấn nút Refresh Data trên thanh PivotTable. 3.2. PivotChart ¾ Là công cụ của Excel, đi chung với Pivot Table, giúp người dùng xem dữ liệu theo nhiều dạng biểu đồ khác nhau một cách trực quan Hình 20: PivotChart 47 3.3. Giới thiệu một số công cụ hỗ trợ OLAP tương tự như Pivot Table của Excel 3.3.1 RadarCube OLAP ¾ Là .NET component phục vụ cho việc phân tích dữ liệu được thiết kế cho Windows Forms và cả ASP.NET applications: ƒ RadarCube OLAP Grid cho ASP.NET ƒ RadarCube OLAP Chart cho Windows Form ¾ Tham khảo:

Các file đính kèm theo tài liệu này:

  • pdf73632325-Bao-Cao-Luan-Van-OLAP.pdf