Mục lục
Lời cảm ơn. .2
Mục lục . 3
Bảng các kí hiệu, chữviết tắt . 6
Bảng danh mục các bảng biểu . 7
Bảng danh mục các hình vẽ. 8
Tóm tắt nội dung luận văn . 10
Mở đầu . 11
Cơsởlý thuyết . 15
Chương 1 Công nghệOLAP . 15
1.1 Giới thiệu vềData Warehouse . 15
1.1.1 Định nghĩa. 15
1.1.2 Ý nghĩa của Data Warehouse . 16
1.1.3 Đặc điểm của Data Warehouse . 16
1.1.4 Cấu trúc của Data Warehouse . 19
1.2 Tổng quan vềOLAP . 19
1.2.1 Giới thiệu . 19
1.2.2 Đặc điểm của OLAP: . 21
1.3 Các mô hình OLAP. 21
1.3.1 MOLAP (Multidimensional OLAP) . 21
1.3.2 ROLAP (Relational OLAP) . 22
1.3.3 HOLAP (Hybrid OLAP) . 25
1.3.4 So sánh các mô hình . 26
Chương 2 OLAP trong MS SQL Server Analysis Service (SSAS) . 27
2.1. Kiến trúc các thành phần OLAP trong SSAS . 27
2.1.1 Cube . 27
2.1.2 Dimension . 29
2.1.3 Measure . 31
2.1.4 Fact table (Fact) . 31
2.1.5 Slice . 32
2.1.6 Partition . 33
4
2.1.7 Role . 33
2.1.8 Schedule (Lập lịch) . 34
2.2. Quy trình thiết kếcác đối tượng trong SSAS . 35
2.2.1 Sơlược vềquy trình xây dựng Data Warehouse . 35
2.2.1.1 Quy trình chung . 35
2.2.1.2 Công cụthực hiện: . 37
2.2.2 Quy trình tạo Cube: . 37
Chương 3 Component Pivot Table trong Excel . 43
3.1. Pivot Table . 43
3.1.1 Giới thiệu . 43
3.1.2 Cách sửdụng . 43
3.2. PivotChart . 46
3.3. Giới thiệu một sốcông cụhỗtrợOLAP tương tựnhưPivot Table của Excel . 47
3.3.1 RadarCube OLAP . 47
3.3.2 Data Dynamics Analysis . 48
3.3.3 ComponentOne OLAP for WinForm . 49
3.3.4 Devexpress ASPxPivotGrid . 49
3.4 So sánh Pivot Table với các công cụkhác:. 50
Ưu điểm: . 50
Nhược điểm: . 50
Kết luận: . 51
Chương 4 Các thưviện lập trình liên quan đến SSAS . 52
4.1. AMO . 52
4.2. ADOMD.NET. 53
4.3. SMO .53
4.4. MDX . 55
4.4.1 Cấu trúc chung . 55
4.4.2 Ví dụmẫu. 55
4.4.3 Lưu ý . 56
Chương 5 Xây dựng công cụWeb hỗtrợphân tích dữliệu cho các ứng dụng OLTP58
5.1. Phân tích, thiết kế. 58
5.1.1 Phân tích . 58
5.1.1.1 Quy trình xửlý nghiệp vụ: . 58
5.1.1.2 Yêu cầu chức năng: . 60
5.1.1.3 Mô hình quan niệm dữliệu: . 66
5
5.1.2 Thiết kế. 72
5.1.2.1 Dữliệu: . 72
5.1.2.2 Kiến trúc module: . 79
5.1.2.3 Hệthống giao diện: . 80
5.2. Cài đặt, lập trình. 88
Đánh giá, bàn luận vềkết quả. 89
Kết luận - Hướng phát triển . 91
Các kết quả đã đạt được . 91
1. Vềlý thuyết . 91
2. Vềthực nghiệm . 91
Danh mục tài liệu tham khảo . 93
94 trang |
Chia sẻ: netpro | Lượt xem: 6712 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu công nghệ Olap và ứng dụng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
an cho phép dễ dàng lựa chọn,
định hướng và khám phá dữ liệu.
• Cung cấp một ngôn ngữ truy vấn phân tích, cung cấp sức mạnh để khám
phá các mối quan hệ trong dữ liệu kinh doanh phức tạp.
• Dữ liệu được tính toán trước đối với các truy vấn thường xuyên nhằm
làm cho thời gian trả lời rất nhanh đối với các truy vấn đặc biệt.
21
• Cung cấp các công cụ mạnh giúp người dùng tạo các khung nhìn mới của
dữ liệu dựa trên một tập các hàm tính toán đặc biệt.
• Hỗ trợ tạo mô hình chức năng để dự báo, phân tích xu thế phát triển và
phân tích thống kê.
• Tìm kiếm và hiển thị dữ liệu dưới dạng biểu đồ, không gian 2D, 3D, …
¾ OLAP được đặt ra để xử lý các truy vấn liên quan đến lượng dữ liệu rất lớn mà
nếu cho thực thi các truy vấn này trong hệ thống OLTP sẽ không thể cho kết quả
hoặc sẽ mất rất nhiều thời gian.
1.2.2 Đặc điểm của OLAP:
¾ Được biết đến như là một phần của kho dữ liệu
¾ Cung cấp các báo cáo, phân tích tiền tính toán, các đồ thị, biểu đồ
¾ Cho phép phân tích trực tuyến dữ liệu
¾ Thăm dò sự tương tác dữ liệu
¾ Cung cấp các giao diện đa dạng cho người dùng
¾ Cung cấp khả năng phân tích dữ liệu phức tạp bằng phương thức đơn giản
1.3 Các mô hình OLAP
1.3.1 MOLAP (Multidimensional OLAP)
¾ Mô hình MOLAP lưu trữ dữ liệu cơ sở (là dữ liệu từ các bảng của kho dữ liệu)
và thông tin tổng hợp (là các độ đo được tính toán từ các bảng) trong các khối
¾
¾
¾
1
¾
Dữ liệu đ
Dữ liệu t
nhật lại n
MOLAP
Ví dụ: tổ
.3.2 RO
Mô hình
trong các
ược tìm th
rong MOL
hững dữ l
thích hợ
ng hợp do
LAP (R
OLAP qu
bảng qua
Hình 8
ấy tại điểm
AP cần ph
iệu mới tro
p cho các
anh thu củ
elationa
an hệ (RO
n hệ
22
: Mô hình d
giao của
ải được p
ng Data W
truy vấn t
a từng chi
l OLAP
LAP) lưu
ữ liệu MO
các chiều
rocess sau
arehouse
ổng hợp d
nhánh tron
)
trữ dữ liệ
LAP
một thời g
.
ữ liệu the
g vòng 2 n
u cơ sở và
ian nhất đ
o thời gia
ăm trở lại
thông tin
ịnh để cập
n dài.
.
tổng hợp
¾
¾
Dữ liệu đ
Có 2 kiể
• L
ch
ược tìm th
u mô hình
ược đồ hìn
iều
Hình 9
ấy tại điểm
dữ liệu:
h sao (sta
23
: Mô hình
giao của
r): mỗi mộ
dữ liệu RO
1 cột và 1
t chiều ch
LAP
một hàng
ỉ được xâ
y dựng từ một bảng
24
Hình 10: Lược đồ hình sao
• Lược đồ hình bông tuyết (snowflake): mỗi chiều được xây dựng từ nhiều
bảng chiều
Hình 11: Lược đồ hình bông tuyết
¾ ROLAP thích hợp cho các truy vấn dữ liệu theo thời gian thực (xảy ra
thường xuyên và đòi hỏi độ chính xác tức thời).
Ví dụ: xem thông tin chứng khoán
25
1.3.3 HOLAP (Hybrid OLAP)
¾ Là mô hình OLAP lai (HOLAP) là sự kết hợp giữa MOLAP và ROLAP.
Hình 12: Mô hình dữ liệu HOLAP
¾ HOLAP là mô hình lai giữa MOLAP và HOLAP, kết hợp những ưu điểm và
loại bỏ những khuyết điểm của 2 mô hình trên nhằm tạo ra một mô hình tối ưu
¾ Lợi ích của việc lưu trữ trong cấu trúc HOLAP là:
• Lưu dữ liệu tổng hợp trong Cube (theo MOLAP) để tăng tốc độ xử lý các
truy vấn phức tạp
• Lưu trữ dữ liệu cơ sở trong các bảng quan hệ (theo ROLAP) nhằm tiết
kiệm không gian lưu trữ
Ví dụ: Trong một công ty chứng khoán:
Dữ liệu về thông tin nhân viên, doanh thu của 2 năm trở về trước
=> lưu trong cube
Dữ liệu về thông tin chứng khoán, giá cổ phiếu hằng ngày
=> lưu trong bảng quan hệ
Ö Tối ưu hóa được vấn đề lưu trữ và xử lý của hệ thống.
26
1.3.4 So sánh các mô hình
MOLAP ROLAP HOLAP
Số chiều >2 2 >2
Lưu trữ dữ liệu cơ sở Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thông tin tổng hợp Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn Nhanh nhất Chậm nhất Nhanh
Tiêu thụ không gian lưu trữ Nhiều Thấp Trung bình
Chi phí bảo trì Cao Thấp Trung bình
Bảng 1: So sánh các mô hình OLAP
Î KẾT LUẬN:
Chọn mô hình nào cần dựa vào hiệu suất, mục đích khai thác, và lượng dữ
liệu,… (ví dụ MOLAP: thích hợp với data marts <50 GB, ROLAP: lượng dữ liệu
có thể lớn hơn)
27
Chương 2 OLAP trong MS SQL Server Analysis
Service (SSAS)
Giới thiệu sơ lược về SSAS
¾ Từ trước đến nay, SQL Server được biết đến với vai trò là một hệ quản trị cơ sở
dữ liệu có trách nhiệm hỗ trợ quản lí, lưu trữ dữ liệu với Database Engine. Tuy
nhiên, từ phiên bản SQL Server 2005 đến SQL Server 2008 và mới nhất là SQL
Server 2008 R2, thì bộ SQL Server đã được tích hợp nhiều gói dịch vụ hỗ trợ
việc tích hợp và khai thác khả năng tiềm tàng của một cơ sở dữ liệu như SQL
Server Integrating Services, SQL Server Analysis Services và SQL Server
Reporting Services.
¾ Analysis Services là một dịch vụ hỗ trợ mạnh mẽ việc phân tích, khai thác thông
tin tiềm tàng bên trong của một hệ cơ sở dữ liệu.
¾ Analysis Services là công cụ dễ sử dụng, tích hợp và linh động giúp định nghĩa
các chiều, xây dựng các khối dữ liệu đa chiều và cung cấp các chương trình ứng
dụng truy xuất tới các khối này.
2.1. Kiến trúc các thành phần OLAP trong SSAS
2.1.1 Cube
¾ Cube (Khối) là phần tử chính trong xử lý phân tích trực tuyến, là tập con
(subset) dữ liệu từ kho dữ liệu, được tổ chức và tổng hợp trong các cấu trúc đa
chiều.
¾ Cube dùng các dimensions, fact table và các measure để mô tả dữ liệu trong
cube.
Ví dụ : một cube 3 chiều
¾
¾
Một cub
• N
• V
• T
Một cub
• L
• M
• K
• K
V
e có thể có
ếu có nhiề
ề mặt lý th
hường thì
e bao gồm
à một liên
ột ô có thể
hối thưa (s
hối dày đặ
í dụ về ô rỗ
Hình
nhiều chi
u hơn 3 ch
uyết thì số
số chiều là
nhiều ô dữ
kết giữa cá
là rỗng (k
parsecube
c (densecu
ng:
28
13: Ví dụ v
ều
iều sẽ đượ
chiều là k
từ 4 đến 1
liệu
c giá trị củ
hông có d
): có nhiều
be): có ít ô
ề Khối (Cu
c gọi là ‘si
hông hạn
2
a chiều
ữ liệu cho
ô rỗng
rỗng
be)
êu khối’ (
chế
liên kết nà
”hypercub
y)
e”)
29
Hình 14: Ví dụ về ô rỗng trong khối
¾ Cube biễu diễn dữ liệu dưới dạng tổng hợp nhiều hơn là chi tiết như khi dùng
bảng thông thường. Do đó, cube cho người dùng thấy được cái nhìn tóm tắt,
tổng hợp của toàn bộ dữ liệu.
¾ Một cube có thể chứa toàn bộ hoặc một phần của dữ liệu nguồn (Data source
view). Vì vậy các cube chỉ được lưu trữ và truy cập qua giới hạn riêng của nó.
Dữ liệu được chuyển từ nguồn đến các cube qua công cụ ETL (Extract,
Transform, and Load).
2.1.2 Dimension
¾ Các chiều là cách mô tả chủng loại mà theo đó các dữ liệu trong Cube được
phân chia để phân tích
¾ Mỗi chiều có thể được xây dựng trên một hoặc nhiều bảng chiều (dimension
table) nhằm mô tả cho chiều đó
¾ Các chiều được ánh xạ từ thông tin của các bảng chiều trong kho dữ liệu vào
các mức phân cấp, ví dụ như chiều Địa lý thì gồm các mức như Lục địa, Quốc
gia, Tỉnh-Thành phố. Trong ví dụ mô hình kinh doanh ở trên, chiều Thời gian có
thể được mô tả bởi các thuộc tính như Năm, Quý, Tháng và Ngày.
¾
¾
ph
m
th
sả
kh
ph
kh
củ
Các chiề
nhằm xâ
phân tích
Chiều có
Phân cấp
ân cấp mà
ột cấu trúc
Ví dụ: N
ì chúng ta
n phẩm, tứ
ác thì chú
Như vậy
ải được th
ông hoạch
a những p
u được tạ
y dựng cá
luôn ổn đ
Hình
sự phân c
là cột sốn
việc gộp
đa mức h
ếu chúng
cần quan
c là chúng
ng ta cần t
có thể có
ực hiện m
định trướ
hân cấp rộ
o một các
c Cube dễ
ịnh.
15: Ví dụ v
ấp :
g của việc
dữ liệu mớ
ay phân cấ
ta làm nhữ
sát ở nhữn
ta đã thự
hực hiện n
quá nhiều
ột cách d
c. Điều n
ng và sâu.
30
h độc lập
dàng và đ
ề các Dime
gộp dữ li
i có thể th
p.
ng quyết
g dữ liệu v
c hiện một
hững phép
tiến trình
ễ dàng, lin
ày có thể đ
và có thể
ể chắc chắ
nsion (Ch
ệu hay nói
ực hiện đư
định về giá
ề doanh th
cách gộp.
gộp tươn
gộp. Thế
h hoạt để
ược giải q
chia sẻ gi
n rằng thô
iều) khác n
một cách
ợc. Phần
sản phẩm
u sản phẩ
Khi cần là
g ứng khác
nên các tiế
có thể hỗ
uyết trên
ữa các OL
ng tin tổn
hau
khác là dự
lớn các ch
để tối đa
m được gộ
m những q
.
n trình gộ
trợ những
cơ sở có s
AP Cube
g hợp cho
a vào các
iều đều có
doanh thu
p theo giá
uyết định
p này cần
phân tích
ự trợ giúp
2
¾
¾
2
¾
¾
¾
.1.3 Me
Các đơn
những g
hoặc số l
Là đơn v
.1.4 Fac
Fact là
dimensio
Một fact
đồng thờ
Fact đượ
asure
vị đo của
iá trị số từ
ượng bán.
ị đo để đán
t table (
bảng mô
n đã được
gồm các
i chứa các
c lưu tại m
khối là các
bảng Fact
h giá, phâ
Fact)
tả sự kiện
xây dựng
trường ch
measure c
ột cấp dữ
H
31
cột trong
mà được
n tích dữ l
mà hệ th
sẵn nhằm
ứa khoá c
ủa cube. M
liệu thô nà
ình 16: F
bảng Fact
tổng hợp
iệu.
ống muố
tổ chức dữ
hính của c
ỗi fact có
o đó
act Table
. Các đơn
phân tích n
n phân tíc
liệu một c
ác dimen
các measu
vị đo lườn
hư định g
h, kết hợ
ách có hệ
sion mà nó
re khác nh
g xác định
iá, trị giá,
p với các
thống.
kết hợp,
au.
32
2.1.5 Slice
¾ Slice là một “lát cắt”, tương ứng một giá trị duy nhất cho chiều “được chiếu”
với các giá trị thành viên của các chiều khác.
Hình 17: Slice
33
2.1.6 Partition
¾ Tất cả các khối đều có tối thiểu một phân hoạch (Partition) để chứa dữ liệu của
nó. Một partition đơn được tự động tạo ra khi khối được định nghĩa.
¾ Khi ta tạo một partition mới cho một khối, partition mới này được thêm vào
trong tập hợp các partition đã tồn tại đối với khối.
¾ Khối phản ánh dữ liệu đã được kết nối có trong tất cả các partition của nó. Một
bảng partition của khối là vô hình đối với người dùng.
¾ Các partition tiêu biểu cho một công cụ mạnh, mềm dẻo cho việc quản trị các
khối OLAP, đặc biệt các khối lớn.
Ví dụ: Một khối chứa thông tin thương mại có thể chứa trong một hoặc nhiều
partition cho dữ liệu của những năm trước và các partition cho mỗi quý của năm
hiện tại. Cuối năm các bảng partition của bốn quý có thể được hợp nhất trong
một partition đơn cho năm đó. Các bảng partition có thể được lưu trữ với các sự
lựa chọn kết hợp khác nhau theo phương thức lưu trữ, định vị dữ liệu nguồn và
thiết kế kết hợp. Tính mềm dẻo này cho phép ta thiết kế các chiến lược lưu trữ
khối thích hợp với các yêu cầu của ta.
2.1.7 Role
¾ Bảo mật trong Analysis Services được tích hợp sẵn và dựa trên bảo mật của
Microsoft Windows. Để Analysis Services được bảo mật, ta tạo các role trong
database OLAP. Mỗi role có thế chứa một hoặc nhiều user (group) được tạo
trong hệ điều hành. Mỗi role được tạo ra sẽ liên kết với các cube trong database
OLAP. Nhờ vậy, ta có thể quản lý sự bảo mật của cube bằng cách hạn chế truy
cập metadata (các member trong dimemsion) cũng như truy cập data (các giá trị
lưu trữ trong cube).
¾ Analysis Services có một role cố định được tạo sẵn, bao gồm các thành viên của
group Administrators trên máy chủ server, được gọi là server role.
¾ Để có thể thực thi mọi tác vụ trong hệ thống Analysis Services, user đang dùng
34
phải là thành viên của group Administrators. Tất cả thành viên trong group này
được toàn quyền trên các cube và các database của server.
¾ Trong thực tế, người ta tạo ra các role trên mỗi database, gọi là database role,
cho phép một user chỉ được quyền quản trị trên một database.
¾ Ngoài ra, ta còn có thể tạo các role ở cấp độ cube (truy cập toàn bộ một số cube
quy định) hoặc ở cấp độ dimension (truy cập data ở một số dimension của một
số cube nhất định)
2.1.8 Schedule (Lập lịch)
¾ Tại một thời điểm nào đó, hệ thống OLAP server cần phải process lại để update
những thay đổi từ phía Database Server, đảm bảo cho Client có thể truy xuất
được những dữ liệu mới nhất và đầy đủ của hệ thống.
¾ Có 2 cách process: thủ công và tự động
• Thủ công: có thể tiến hành process thủ công khi cần thiết ( có sự thay đổi
dữ liệu hay cấu trúc hệ thống).
• Tự động: có thể lập lịch cho hệ thống tự động process sau một khoảng
thời gian quy định trước.
35
2.2. Quy trình thiết kế các đối tượng trong SSAS
Hình 18: Các đối tượng trong SSAS
2.2.1 Sơ lược về quy trình xây dựng Data Warehouse
2.2.1.1 Quy trình chung
¾ Nhận dạng dữ liệu nguồn (Identify the data source):
• Một trong những bước đầu tiên để xây dựng Data Warehouse là phải
nhận biết các nguồn dữ liệu. Ta cần phải tính toán và xem xét những dữ
liệu nào cần thiết để đưa vào Data Warehouse.
• Trong một Data Warehouse, có hai loại nguồn dữ liệu cần xem xét, đó là
nguồn dữ liệu bên trong (internal data source) và bên ngoài (external data
source). Dữ liệu bên trong là những dữ liệu đã có sẵn trong hệ thống hiện
tại. Dữ liệu bên ngoài là những dữ liệu từ nhiều nguồn khác nhau ngoài
hệ thống.
¾ Chọn lọc dữ liệu (Extracting Transactional Data):
36
• Đây là bước chi phối hầu hết thời gian của quy trình, vì chúng ta cần phải
lấy dữ liệu từ nhiều nguồn đã nhận dạng ra để đưa vào kho lưu trữ trung
tâm.
• Do các nguồn dữ liệu xuất phát từ nhiều hệ thống khác nhau nên các hệ
quản trị CSDL của chúng cũng khác nhau, chẳng hạn như MS Access,
MS SQL Server, Oracle, Sybase, hoặc cũng có thể là flat files,
spreadsheets, mail systems và nhiều dạng lưu trữ dữ liệu khác. Vì thế, ta
cần quyết định sẽ sử dụng hệ CSDL nào cho việc tổ chức kho dữ liệu.
¾ Chuyển đổi dữ liệu (Transforming Transactional Data):
• Là quá trình chuyển đổi nhằm đảm bảo tính nhất quản của dữ liệu sau khi
đã được chọn lọc từ nhiều nguồn khác nhau.
• Để có thể chuyển đổi dữ liệu vào Data Warehouse một cách chính xác, ta
cần phải xác định ánh xạ của các trường (field) từ nguồn dữ liệu bên
ngoài đến các trường của data warehouse.
• Sự chuyển đổi này có thể được thực hiện trong quá trình chọn lọc
(extracting) hoặc trong khi dữ liệu được đưa vào data warehouse.
¾ Tải dữ liệu (Loading the Data):
• Khi quá trình chọn lọc, chuyển đổi và làm sạch đã hoàn tất, dữ liệu sẽ
được tải vào data warehouse.
• Việc tải dữ liệu có thể phân thành hai loại: tải toàn bộ dữ liệu đang có
trong CSDL nguồn và tải những dữ liệu có sự thay đổi trong CSDL
nguồn vào data warehouse.
• Dữ liệu trong data warehouse phải luôn được làm tươi, có nghĩa phải cập
nhật những thay đổi của dữ liệu.
• Trong khi cập nhật data warehouse cần phải đảm bảo không có dữ liệu
nào bị mất, đồng thời chi phí cho quá trình duyệt các file đã tồn tại phải
đạt mức thấp nhất.
37
2.2.1.2 Công cụ thực hiện:
¾ Extract-Transform-Load (ETL): điển hình như DTS (Data Transformation
Services) trong SQL Server, Informatica,... Về công cụ ETL dạng Open
source có thể kể đến Talend, Kettle…
¾ Lập lịch: SQL Server Agent dùng để lập lịch cho việc tự động chuyển đổi từ
CSDL nguồn vào data warehouse.
2.2.2 Quy trình tạo Cube:
¾ Công cụ và database mẫu sử dụng:
• Business Intelligence Studio (đi kèm với MS SQL Sever)
• Adventure Work Cycle Sample Database (có thể download tại
)
¾ Để tạo một Cube, trước tiên ta cần phải có những thành phần sau:
DataSource, DataSource View, Dimension, ...
2.2.2.1 Tạo DataSource
Các bước như sau:
1. Trong khung Solution Explorer, phải chuột Data Sources và chọn New Data
Source
2. Tại màn hình Welcome to Data Source Wizard, nhấn Next để chuyển sang
cửa sổ Select how to define the connection
3. Tại cửa sổ Select how to define the connection page, ta có thể định nghĩa
một data source bằng cách tạo mới connection hoặc trên một connection đã
có sẵn. Trong bài hướng dẫn này, ta sẽ định nghĩa một data source bằng cách
tạo mới một connection, kiểm tra checkbox Create a data source based on
an existing or new connection được chọn và nhấn New
38
4. Trong dialog box Connection Manager, ta sẽ định nghĩa giá trị thuộc tính cho
Data Source. Trong danh sách Provider, chọn Native OLE DB\SQL Server
Native Client 10.0
5. Trong Server Name, gõ vào localhost
6. Kiểm tra giá trị Use Windows Authentication được chọn, trong danh sách
Select or enter a database name, ví dụ ở đây ta chọn database Adventure
Works DW2008
7. Nhấn Test Connection để kiếm tra kết nối đến với SQL Server
8. Chọn OK và nhấn Next
9. Tại cửa sổ Impersonation Information, ta sẽ thiết lập Security Credential cho
SSAS để kết nối tới Data Sources, ta chọn Use the Service account, và nhấn
Next.
10. Tại màn hình Completing the wizard, thiết lập tên của Data Source là
Adventure Work DW và chọn Finish.
2.2.2.2 Tạo DataSource View
Các bước như sau:
1. Trong khung Solution Explorer, phải chuột Data Sources Views, và chọn
New Data Source Views
2. Cửa số Welcome to Data Source View Wizard xuất hiện, nhấn Next
3. Dialog Select data source xuất hiện, tại mục Relational Data Sources, chọn
Adventure Work DW mà ta đã tạo như trên rồi chọn Next.
4. Tại Dialog Select Tables and Views, ta sẽ chọn các bảng dữ liệu và views từ
danh sách đối tượng, ta sẽ chọn các đối tượng sau:
DimCustomer (dbo)
DimDate (dbo)
DimGeography (dbo)
DimProduct (dbo)
39
FactInternetSales (dbo)
5. Nhấn nút “>” để thêm các bảng vào danh sách Included Objects
6. Nhấn Next
7. Tại thuộc tính Name, ta thiết lập là Adventure Wordk DW và nhấn Finish
để hoàn tất việc đĩnh nghĩa một data source view. Data Source View
Adventure Work DW sẽ hiển thị tại Data Source View Designer trong
Business Intelligence Development Studio và gồm các thành phần sau:
o Diagram Pane thể hiện mối quan hệ giữa các bảng dữ liệu trực quan
o Tables Pane: các bảng dữ liệu và schema được thể hiện theo tree view
o Diagram Organizer Pane hỗ trợ tạo các subdiagram mà thông qua đó
ta có thể có dc các subsets của data source view
Sau khi hoàn tất bước này, ta sẽ có khung nhìn toàn diện về các bảng dữ liệu
và mối quan hệ của chúng.
2.2.2.3 Tạo Dimension
Các bước như sau:
1. Trong pane Solution Explorer, phải chuột Dimentsions, chọn New
Dimensions.
2. Tại cửa sổ Welcome to Dimension Wizard, chọn Next
3. Tại cửa số Select Creation Method, đảm bảo tùy chọn Use an Existing Table
được chọn, chọn Next.
4. Tại cửa sổ Specify Source Information, đảm bảo data source Adventure
Works DW được chọn.
5. Trong danh sách Main Table, chọn Date
6. Tại trang Select Dimension Attributes, chọn các Attributes sau:
Date Key
40
Full Date Alternate Key
English Month Name
Calendar Quarter
Calendar Year
Calendar Semester
7. Thay đổi Attribute Type của cho thuộc tính Full Date Alternate Key từ
Regular sang Date bằng cách chọn vào Regular và tiến hành thay đổi. Thực
hiện tương tự cho các thuộc tính khác.
English Month Name –> Month
Calendar Quarter –> Quarter
Calendar Year –> Year
Calendar Semester –> Half Year
8. Nhấn Next
9. Tại màn hình Completing the Wizard, trong Preview Pane, ta có thể thấy
dimension Date và các thuộc tính của nó.
10. Nhấn Finish để hoàn tất việc định nghĩa Dimension
11. Tiến hành Save All Project
2.2.2.4 Tạo Cube
Các bước như sau:
1. Trong Solution Explorer Pane, phải chuột Cubes, chọn New Cubes
2. Tại cửa sổ Welcome to the Cube Wizard, chọn Next
3. Tại cửa sổ Select Creation Method, chọn Use existing tables và nhấn Next
4. tại cửa sổ Select Measure Group Tables, đảm bảo Adventure Works DW
data source view được chọn, và nhấn Next.
41
5. Nhấn Suggest để cửa số Suggest Table hiển thị và đề xuất các table cần thiết
để xây dựng các measure group.
6. Nhấn Next
7. tại cửa sổ Select Measure, xem lại InternetSales measure group và deselect
các checkbox cho các giá trị sau
a. Promotion Key
b. Currency Key
c. Sales Territory Key
d. Revision Number
8. Chọn Next
9. tại cửa sổ Selecting Existing Dimensions, chọn Date dimension đã dc định
nghĩa và chọn Next
10. Trong cửa sổ Select New Dimension, chọn các dimension mới để thiết lập,
đảm bảo Customer, Geography và Product được chọn và deselect
InternetSales.
11. Nhấn Next
12. tại cửa sổ Completing the Wizard, thiết lập name của Cube là Analysis
Services Tutorial,
13. Chọn Finish để hoàn tất
14. Tiến hành Save All
Deploy Cube lên server
1. Trong Solution Explorer Pane, phải chuột Analysis Services Tutorial và chọn
Properties.
2. tại Configuration Properties tại pane bên trái, chọn Deployment
3. Chọn OK
4. Phải chuột Analysis Service Tutorial project và chọn Deploy
5. Review lại cửa sổ Output và Deployment Progress – Analysis Service
Tutorial để đảm bảo cube được build không có lỗi khi build
42
6. Như vậy project SSAS đã được deploy lên server
Browsing Cube :
1. Chuyển sang Dimension Designer cho Product Dimension trong Business
Intelligence Studio bằng cách double click vào Product dimension trong
Dimension Node
2. Click Browse để hiển thị cây cấu trúc của Product Key
3. Chuyển sang Cube Designer trong Business Intelligence Development
Studio bằng cách double click vào Analysis Service Tutorial trong cube
node.
4. Chuyển sang Browse tab và nhấn vào biểu tượng reconnect, cửa sổ Browse
tab gồm 2 phần
Left Pane: thể hiện các đối tượng của Analysis Service Tutorial Cube
Right Pane gồm 2 phần: phần trên là Filter Pane, phần dưới là Data
Pane và việc phân tích, thể hiện dữ liệu sẽ được thực hiện tại đây.
43
Chương 3 Component Pivot Table trong Excel
3.1. Pivot Table
3.1.1 Giới thiệu
¾ Pivot Table là một công cụ rất mạnh của Excel trong việc tạo ra các báo cáo
phân tích dữ liệu. Dùng kết hợp 2 công cụ Pivot Table và PivotChart sẽ tạo ra
các báo cáo phân tích số liệu hết sức sinh động và hiệu quả.
Hình 19: Pivot Table
3.1.2 Cách sử dụng
¾ Tạo một Pivot Table
Để tạo một Pivot Table sử dụng PivotTable Wizard bạn cần cho Excel biết tổng hợp
trường nào theo cột và trường nào theo hàng. Bạn cũng có thể chỉ định trường trang
để xếp các nhóm theo trang. Bạn có thể đảo lại vị trí của các trường để có một bảng
tổng hợp khác.
44
Bạn có thể tạo một pivot table từ nhiều nguồn dữ liệu khác nhau. Thường nguồn dữ
liệu là các bảng của Excel. Bạn cũng có thể tạo Pivot Table từ nguồn dữ liệu ngoại,
từ nhiều vùng hợp lại, hay từ chính các Pivot Table khác.
Các bước
1. Chọn một ô bất kỳ trong danh sách cần tổng hợp; gọi Data> PivotTable
Report.
2. Trong bước 1 của PivotTable Wizard, chọn nguồn dữ liệu ( Microsoft Excel
List hay từ các cơ sở dữ liệu khác); sau đó nhấn nút Next.
3. Trong bước 2 của PivotTable Wizard, vùng địa chỉ của danh sách xuất hiện
trong hộp Range. Nếu địa chỉ sai hãy chỉnh lại. Sau đó nhấn Next.
4. Trong bước 3 của PivotTable Wizard, bạn trình bày bố cục của pivot table.
Các trường trở thành các nút nằm bên phải của cửa sổ. Kéo nút ứng với
trường dữ liệu vào vùng DATA. Để sắp xếp một trường theo cột, kéo nút của
trường đó len vùng COLUMN. Để sắp xếp một trường theo hàng, kéo đến
vùng ROW. Nhấn nút Next.
5. Trong bước 4 của PivotTable Wizard, bạn chỉ định ô để đặt pivot table. Nếu
muốn đặt thêm các tuỳ chọn khác cho pivot table, nhấn nút Options, đặt các
tuỳ chọn khác, và nhấn OK. sau đó nhấn Finish.
¾ Các hiệu chỉnh trên một Pivot Table :
Thay đổi tên trường
Vì pivot tables chỉ là bảng hiển thị thông tin nên bạn không thể thay đổi thông tin
trên bảng. Bạn chỉ có thể thay tên của các trường.
1. Để hiệu chỉnh tên trường, chọn trường
2. nhập tên mới.
45
TIP: Để thay đổi các tuỳ chọn khác cho một trường, nhấn kép lên nút của trường đó.
Chọn các tuỳ chọn.
Thêm trường dữ liệu
1. Để thêm trường dữ liệu, chọn một ô trong bảng pivot table.
2. Nhấn nút PivotTable Wizard trên thanh PivotTable. (Nhấn chuột phải lên
vùng thanh công cụ, chọn PivotTable để hiển thị thanh này nếu chưa hiện)
3. Trong bước 3 của PivotTable Wizard, kéo thêm nút của trường bạn muốn
thêm vào vùng DATA; nhấn nút Finish.
Thêm trường Rows, Columns, hay Pages
1. Để thêm trường hàng, cột hay trang, chọn một ô bất kỳ trong pivot table.
2. Nhấn nút PivotTable Wizard trên thanh PivotTable.
3. Trong bước 3 của PivotTable Wizard, kéo các nút cần thiết vào vùng ROW,
COLUMN, hay PAGE; sau đó nhấn Finish.
TIP: Để bỏ một trường hàng, cột hay trang, kéo nút trường ra khỏi pivot table.
Định dạng Pivot Table
Bạn có thể sử dụng tính năng AutoFormat để định dạng
1. Chọn một ô trong bảng pivot table. Chọn Format, AutoFormat.
2. Trên Table Format , chọn định dạng mong muốn, nhấn OK.
Chú ý: Để định dạng không bị mất khi ta thay đổi hay cập nhật lại bảng PivotTable
cần đảm bảo mục Enable Selection trên PivotTable menu của thanh PivotTable
được chọn.
Cập nhật Pivot Table
Một pivot table không tự cập nhật khi bạn thay đổi dữ liệu nguồn.
46
1. Để cập nhật pivot table, chọn một ô bất kỳ trong pivot table.
2. Nhấn nút Refresh Data trên thanh PivotTable.
3.2. PivotChart
¾ Là công cụ của Excel, đi chung với Pivot Table, giúp người dùng xem dữ liệu
theo nhiều dạng biểu đồ khác nhau một cách trực quan
Hình 20: PivotChart
47
3.3. Giới thiệu một số công cụ hỗ trợ OLAP tương tự
như Pivot Table của Excel
3.3.1 RadarCube OLAP
¾ Là .NET component phục vụ cho việc phân tích dữ liệu được thiết kế cho
Windows Forms và cả ASP.NET applications:
RadarCube OLAP Grid cho ASP.NET
RadarCube OLAP Chart cho Windows Form
¾ Tham khảo:
Các file đính kèm theo tài liệu này:
- 73632325-Bao-Cao-Luan-Van-OLAP.pdf