Thuật toán kiểm tra dạng chuẩn 3
Output: khẳng định Q đạt chuẩn 3 hay không đạt chuẩn 3
Thuật toán:
- Bước 1: tìm tất cả khóa của Q
- Bước 2: từ F tạo tập phụ thuộc hàm tương đương F’ có vế phải
một thuộc tính
- Bước 3: Kiểm tra
Nếu mọi phụ thuộc hàm XA F’ với A X đều có X là khóa hoặc A là
thuộc tính khóa thì Q đạt chuẩn 3
ngược lại Q không đạt chuẩn 3 ( X → A mà X không là khóa và A không
là thuộc tính khóa
Nhận xét: quan hệ R là ở dạng 3NF khi và chỉ khi không tồn tại
phụ thuộc hàm bắc cầu X → Y và Y → A với:
- X là khóa
- Y không là siêu khóa
- A là thuộc tính không khóa và A XYCơ sở dữ liệu 26
Ví dụ 1: Cho lược đồ quan hệ Q(A,B,C,D) và
F = { AB C, D B, C ABD}. Hỏi Q có đạt chuẩn 3
không?
K
1 = AB K2 = AD K3 = C là các khóa
mọi pth XA đều có A là thuộc tính khóa
Vậy đạt chuẩn 3NFCơ sở dữ liệu 27
Ví dụ 2: Xét quan hệ CNHAN nhu sau:
- CNHAN(MACN, LOAINGHE, HESOTHUONG)
- Khóa của quan hệ là MACN
- thấy có các pth trong quan hệ:
MACN → LOAINGHE
MACN → HESOTHUONG
LOAINGHE → HESOTHUONG
- Có tồn tại Pth bắt cầu: MACN → LOAINGHE và
LOAINGHE → HESOTHUONG
- Thuộc tính không khóa HESOTHUONG phụ thuộc bắc
cầu vào thuộc tính khóa MACN, do đó quan hệ CNHAN
không phải là 3NF.
67 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 555 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Cơ sở dữ liệu - Chương 6: Chuẩn hóa Cơ sở dữ liệu - Nguyễn Thị Tâm, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG VI:
CHUẨN HÓA CSDL
Cơ sở dữ liệu 2
NỘI DUNG
Nguyên tắc thiết kế CSDL
Phép tách các lược đồ quan hệ
Các dạng chuẩn của lược đồ quan hệ
I. Nguyên tắc thiết kế CSDL
Cơ sở dữ liệu 3
Cơ sở dữ liệu 4
Cơ sở dữ liệu 5
II. Các dạng chuẩn của lược đồ quan hệ
Chuẩn hóa là quá trình phân tích các quan hệ cho trước dựa trên
tập phụ thuộc hàm và khóa chính để:
- Tối thiểu việc dư thừa thông tin
- Tránh dị thường thông tin
- Truy cập nhanh
Chuẩn hóa các bảng: là việc áp dụng một số quy tắc để đưa các
bảng từ dạng chuẩn thấp lên dạng chuẩn cao hơn quá trình
này thực hiện theo phương pháp trên xuống bằng việc đánh
giá mối quan quan hệ và tách quan hệ nếu cần
Cơ sở của chuẩn hóa dựa trên: phụ thuộc hàm, phụ thuộc đầy
đủ, khóa, thuộc tính không khóa,
Cơ sở dữ liệu 6
Các loại dạng chuẩn gồm:
- Dạng chuẩn 1 (1NF – First Normal Form)
- Dạng chuẩn 2 (2NF – Second Normal Form)
- Dạng chuẩn 3 (3NF)
- Dạng chuẩn Boye Code (BCNF)
Cơ sở dữ liệu 7
1. Một số khái niệm cơ bản
Thuộc tính khoá và không khoá: Cho lược đồ quan
hệ R trên tập thuộc tính U={A1, .., An}.
- Thuộc tính A U được gọi là thuộc tính khoá nếu A là một
thành phần thuộc một khoá tối thiểu nào đó của R
- ngược lại A được gọi là thuộc tính không khóa
- Ví dụ: Cho lược đồ R =
U = { A, B, C, D }
F = { AB C, B D, BC A }
Ta thấy AB và BC là khoá.
A, B, C là thuộc tính khoá
D là thuộc tính không khoá
Cơ sở dữ liệu 8
Phụ thuộc hàm đầy đủ: Cho lược đồ quan hệ R(U) với U
= { A1, ... ,Ak}. X,Y U, và X ≠ Y. Nói rằng, Y là phụ thuộc
hàm đầy đủ vào X nếu:
- X Y thuộc F+
- với mọi tập con thực sự X’ của X thì X’ Y không thuộc
F+
Y phụ thuộc hàm đầy đủ vào X nếu Y phụ thuộc
hàm vào X nhưng không phụ thuộc hàm vào
bất kỳ một tập con thực sự nào của X
Ví dụ: Cho tập F={AB->C; A->C} thì ta thấy AB->C
là phụ thuộc hàm không đầy đủ vì C còn phụ thuộc
hàm vào A.
Cơ sở dữ liệu 9
Phụ thuộc bắc cầu: Cho lược đồ quan hệ R(U); X
U, A U, F là phụ thuộc hàm trên R
A được gọi là phụ thuộc bắc cầu vào X trên R nếu Y, Y
U sao cho X Y, Y A thuộc F+ nhưng Y X
không thuộc F+
Ngược lại, nói rằng A không phụ thuộc bắc cầu vào X hay
A phụ thuộc trực tiếp vào X
Ví dụ: Cho tập F={A->B; B->C; A->D}
=>C phụ thuộc bắc cầu vào A
Và D phụ thuộc trực tiếp vào A
Cơ sở dữ liệu 10
2. Dạng chuẩn 1NF
Định nghĩa: Quan hệ được gọi là ở chuẩn 1NF nếu
các giá trị của tất cả các thuộc tính đều phải là nguyên
tử (đơn, không phân chia được) => không chứa các
thuộc tính có giá trị lặp hoặc đa trị
Cách khác: bảng ở dạng 1NF là bảng có tồn tại PTH
có nguồn là một phần của khóa (phụ thuộc bộ
phận) .
Chú ý: khi xét dạng chuẩn nếu không nói gì thêm thì
dạng chuẩn đang xét ít nhất là đạt dạng chuẩn một
Biểu diễn sơ đồ:
R(A1,A2,A3, A4, A5)
Cơ sở dữ liệu 11
VD: Cho bảng quan hệ GD (Ten_GV, MON_GD)
C, VISUAL BASIC, TK WEP Hà
PASCAL, NM CSDN Lan
Mon_GD Ten_GV
Không ở 1NF
TK WEP Hà
VISUAL BASIC Hà
NM CSDN Lan
C Hà
PASCAL Lan
Mon_GD Ten_GV
ở 1NF
Cơ sở dữ liệu 12
Kết luận: Để kiểm tra một lược đồ có là dạng
1NF không thực hiện kiểm tra nếu thỏa mãn:
- Không có thuộc tính là thuộc tính đa trị
- Không có thuộc tính là thuộc tính phức hợp
Cơ sở dữ liệu 14
2. Dạng chuẩn 2NF
Định nghĩa: Lược đồ quan hệ R ở 2NF khi và chỉ khi
- R đã là 1NF
- Mọi thuộc tính không khóa của R là phụ thuộc hàm đầy
đủ vào khóa chính
Cách khác: lược đồ quan hệ R được gọi là 2NF nếu tồn tại
phụ thuộc hàm bắc cầu vào khóa
Biểu diễn sơ đồ:
Mục đích:
- giản ước sự dư thừa dữ liệu
- tránh các dị thường cập nhật gây nên do sự dư thừa dữ
liệu này
R(A1,A2,A3, A4, A5)
Cơ sở dữ liệu 15
Cơ sở dữ liệu 16
Thuật toán kiểm tra dạng chuẩn 2
Bước 1: Tìm tất cả các khóa của quan hệ
Bước 2: Với mỗi khóa K, tìm bao đóng của tất cả các tập con
thực sự S của K
- Chú ý: nếu khóa có một thuộc tính đơn thì không cần phải
kiểm tra
Bước 3: nếu có bao đóng S+ chứa thuộc tính không khóa thì
quan hệ không đạt chuẩn 2 ngược lại thì quan hệ đạt chuẩn 2
Nhận xét:
- Nếu mọi khóa của lược đồ quan hệ R chỉ có 1 thuộc tính thì
R là 2NF
- R là 2NF X → A F+, với X K (K là khóa của R) thì:
hoặc A là thuộc tính khóa
hoặc A X (X → A là phụ thuộc hàm tầm thường)
Cơ sở dữ liệu 17
Ví dụ 1: Cho LĐQH R = {A,B,C,D,E,G} và
- F = { A → BC, C → DE, E → G }
Ta thấy A là khóa vì A+ = R (tập thuộc tính của quan
hệ).
Các thuộc tính không khóa là {B,C,D,E,G}.
Do khóa chỉ có một thuộc tính (các thuộc tính khác
phụ thuộc đầy đủ vào khóa) => quan hệ R ở 2NF.
Cơ sở dữ liệu 18
Ví dụ 2: Cho lược đồ quan hệ Q(A,B,C,D) và tập phụ
thuộc hàm F = {AB C, B D, BC A}. Hỏi Q có đạt
chuẩn 2 không?
Khóa là K1 = AB và K2 = BC
Ta thấy B+ = BD
Vậy:
- D là thuộc tính không khóa
- thuộc tính không khóa D không phụ thuộc đầy đủ vào khóa
=> Q không đạt chuẩn 2
Cơ sở dữ liệu 19
Chú ý: nếu quan hệ không thỏa mãn điều kiện 2NF có thể chuẩn hóa
để có 2NF như sau:
- nhóm vào một quan hệ gồm các thuộc tính phụ thuộc hoàn toàn vào
khoá và giữ lại khoá của quan hệ đó
- nhóm vào một quan hệ khác các thuộc tính phụ thuộc vào một phần
của khoá, lấy phần đó làm khoá chính cho quan hệ .
Ví dụ 1:
- Cho lược đồ quan hệ Q(A,B,C,D) và tập phụ thuộc hàm F = {AB C, B D,
BC A} => Không đạt chuẩn 2
- Tách thành: Q1( B,D) và Q2( A, B, C)
Ví dụ 2:
- trong quan hệ R2 (Số hoá đơn, Số sản phẩm, Tên sản phẩm, Lượng yêu
cầu) có phụ thuộc hàm : Số sản phẩmTên sản phẩm trong đó Số sản
phẩm là một phần của khoá => quan hệ chưa ở dạng chuẩn 2
- ta tách R2 thành R3 và R4 như sau :
R3 (Số hoá đơn, Số sản phẩm, Lượng yêu cầu)
R4 (Số sản phẩm, Tên sản phẩm)
Cơ sở dữ liệu 20
Ví dụ: xét lược đồ quan hệ:
NHÂNVIÊN_DỰÁN( MãsốNV, MãsốDA, Sốgiờ, HọtênNV, TênDA,
ĐịađiểmDA)
với các phụ thuộc hàm:
- MãsốNV, MãsốDA → Sốgiờ
- MãsốNV → HọtênNV
- MãsốDA →TênDA, ĐịađiểmDA
NX: có những thuộc tính không khoá phụ thuộc vào một bộ phận
của khoá chính, như vậy nó không thoả mãn điều kiên 2NF.
Áp dụng phương pháp chuẩn hoá trên, lược đồ được tách thành
các lược đồ như sau:
- N_D1(MãsốDA, TênDA, ĐịađiểmDA)
- N_D2(MãsốNV , HọtênNV)
- N_D3(MãsốNV, MãsốDA, Sốgiờ)
Cơ sở dữ liệu 21
Ví dụ 3: cho R = {A, B, C, D, E, G}
F = { ABC, DEG, CA,BEC, BCD, CGBD,
ACDB, CEAG }
Kiểm tra lược đồ có ở dạng 2NF
Nếu chưa ở dạng chuẩn 2NF thì đưa về dạng 2NF
Cơ sở dữ liệu 22
Ví dụ 4: Cho R. U = { A, B, C, D }
F= { B D, AC, C ABD }
Thực hiện:
- Thuộc tính khóa là A và C.
- Thuộc tính không khóa là B,D
- Khóa chỉ có một thuộc tính B, D phụ thuộc đầy đủ vào
khóa
- Vậy R ở 2NF
Cơ sở dữ liệu 23
3. Dạng chuẩn 3NF
Định nghĩa: Lược đồ quan hệ R được gọi là ở dạng chuẩn
3NF nếu:
- R đã ở 2NF
- Mọi thuộc tính không khóa ĐỀU không phụ thuộc bắc cầu
vào bất kỳ khóa của quan hệ
Cách khác: lược đồ ở dạng 3NF nếu:
- xét mọi pth X A thì:
X là một khóa của R
hay A là thuộc tính khóa của R(có nguồn X là thuộc tính không
khóa mà thuộc tính đích A là thuộc tính khóa)
Sơ đồ:
R(A1,A2,A3, A4, A5)
Nhận xét:
Nếu tồn tại phụ thuộc hàm Giáo viên-> Tên môn thì mỗi
giáo viên chỉ dạy một môn – chưa giải quyết được bài
toán tổng quát – giáo viên dạy nhiều môn
Cơ sở dữ liệu 24
Cơ sở dữ liệu 25
Thuật toán kiểm tra dạng chuẩn 3
Output: khẳng định Q đạt chuẩn 3 hay không đạt chuẩn 3
Thuật toán:
- Bước 1: tìm tất cả khóa của Q
- Bước 2: từ F tạo tập phụ thuộc hàm tương đương F’ có vế phải
một thuộc tính
- Bước 3: Kiểm tra
Nếu mọi phụ thuộc hàm XA F’ với A X đều có X là khóa hoặc A là
thuộc tính khóa thì Q đạt chuẩn 3
ngược lại Q không đạt chuẩn 3 ( X → A mà X không là khóa và A không
là thuộc tính khóa
Nhận xét: quan hệ R là ở dạng 3NF khi và chỉ khi không tồn tại
phụ thuộc hàm bắc cầu X → Y và Y → A với:
- X là khóa
- Y không là siêu khóa
- A là thuộc tính không khóa và A XY
Cơ sở dữ liệu 26
Ví dụ 1: Cho lược đồ quan hệ Q(A,B,C,D) và
F = { AB C, D B, C ABD}. Hỏi Q có đạt chuẩn 3
không?
K1 = AB K2 = AD K3 = C là các khóa
mọi pth XA đều có A là thuộc tính khóa
Vậy đạt chuẩn 3NF
Cơ sở dữ liệu 27
Ví dụ 2: Xét quan hệ CNHAN nhu sau:
- CNHAN(MACN, LOAINGHE, HESOTHUONG)
- Khóa của quan hệ là MACN
- thấy có các pth trong quan hệ:
MACN → LOAINGHE
MACN → HESOTHUONG
LOAINGHE → HESOTHUONG
- Có tồn tại Pth bắt cầu: MACN → LOAINGHE và
LOAINGHE → HESOTHUONG
- Thuộc tính không khóa HESOTHUONG phụ thuộc bắc
cầu vào thuộc tính khóa MACN, do đó quan hệ CNHAN
không phải là 3NF.
Cơ sở dữ liệu 28
Chú ý: nếu quan hệ không thỏa mãn điều kiện 3NF, ta có thể
chuẩn hóa thành 3NF như sau:
- giữ lại trong quan hệ ban đầu các thuộc tính phụ thuộc trực
tiếp vào khoá
- nhóm vào một quan hệ khác các thuộc tính bắc cầu, lấy
thuộc tính bắc cầu làm khoá
- thuộc tính bắc cầu nằm ở hai quan hệ
Ví dụ 3:
trong quan hệ R1 (Số hoá đơn, Ngày bán, Số khách hàng, Tên
khách hàng, Số sản phẩm)
Có các phụ thuộc hàm bắc cầu :
Số hoá đơn --> Số khách hàng --> Tên khách hàng
Ta có thể tách R1 thành R5 và R6 như sau :
- R5 (Số hoá đơn, Ngày bán, Số khách hàng, Số sản phẩm)
- R6 (Số khách hàng,Tên khách hàng)
Cơ sở dữ liệu 29
Ví dụ 4: Xét lược đồ quan hệ
NHÂNVIÊN_ĐƠNVỊ( HọtênNV, MãsốNV, Ngàysinh, Địachỉ,
MãsốĐV, TênĐV, MãsốNQL)
Với các phụ thuộc hàm:
- MãsốNV→HọtênNV, Ngàysinh,Địachỉ,MãsốĐV,TênĐV, MãsốNQL
- MãsốĐV→ TênĐV, Mã sốNQL
Các thuộc tính TênĐV, MãsốNQL phụ thuộc bắc cầu vào khoá
chính, lược đồ quan hệ không thoả mãn điều kiện 3NF.
Áp dụng phương pháp chuẩn hoá ở trên, lược đồ được tách ra
như sau:
- NV_DV1(HọtênNV, MãsốNV, Ngàysinh, Địachỉ, MãsốĐV)
- NV_DV2(MãsốĐV, TênĐV, MãsốNQL)
Cơ sở dữ liệu 30
Ví dụ 5: Xét LĐQH r(R) với R=ABCDE và tập
pth F = {AB->CE, E->AB, C->D}
Với khóa của lược đồ là: AB và E
Dạng chuẩn cao nhất của quan hệ này là gì ?
Cơ sở dữ liệu 31
Tìm khóa: AB, E
- AB+ = ABCDE và E+ = ABCDE
- Thuộc tính không khóa {C,D}
Xác định dạng chuẩn 2: Các thuộc tính không khóa
phải phụ thuộc đầy đủ vào khóa. Đúng nên ở DC2
Xác định dạng chuẩn 3: Các thuộc tính không khóa
phải không được phụ thuộc bắc cầu vào khóa Hoặc
nếu có PTH X->A thì X phải là siêu khóa hoặc A là
thuộc tính khóa
- Ta có AB->C và C-> D, vậy D phụ thuộc bắc cầu vào khóa
AB => lược đồ không ở dạng 3NF
Vậy dạng chuẩn cao nhất là 2NF
Cơ sở dữ liệu 32
Ví dụ 6: Cho LĐQH r(R) với R=ABCD, F= {A->C, D->B, C->ABD}
Xác định dạng chuẩn cao nhất? Đưa về dạng 3NF
Giải:
Xác định khóa: A, C
- A+ = ACBD
- C+ = ACBD
Do tất cả các PTH đều có vế trái chỉ chứa 1 thuộc tính nên ở
dạng chuẩn 2
- Các thuộc tính khóa A,C
- Các thuộc tính không khóa B,D
- Ta có C->D và D->B phụ thuộc bắc cầu: không ở DC3
Dạng chuẩn cao nhất là DC2
Cơ sở dữ liệu 33
4. Dạng chuẩn BCNF
Định nghĩa: Lược đồ quan hệ R ở dạng chuẩn BCNF
nếu với mọi pth X A của R, A X thì X là một siêu
khóa hay tất cả các thuộc tính phụ thuộc trực tiếp vào
khóa.
Sơ đồ:
Ví dụ:
Sinhvien(MaSV, TenSV, Ngaysinh)
R(A1,A2,A3, A4, A5)
Cơ sở dữ liệu 34
Thuật toán kiểm tra dạng chuẩn BCNF
Bước 1: Tìm tất cả các khóa của quan hệ Q
Bước 2: Từ tập pth F tạo tập pth tương đương với F
gọi là F’ có vế phải một thuộc tính
Bước 3:
- nếu mọi pth X A F’ đều có X là siêu khóa thì Q đạt chuẩn
BCNF
- ngược lại Q không đạt chuẩn BCNF ( X → A mà X không
là siêu khóa)
mọi pth đều có vế trái là siêu khóa thì đạt chuẩn
BCNF ngược lại thì không
siêu khóa: là một khóa nhỏ nhất
Cơ sở dữ liệu 35
Ví dụ 1: Cho R = { C, S, Z}, Phụ thuộc hàm: CS Z, Z
C
- Có khóa tối thiểu: CS, SZ => không có thuộc tính không
khóa => đã ở dạng chuẩn ba
- Không ở dạng chuẩn BCNF vì có PTH: Z C nhưng Z
không phải là một khóa
Cơ sở dữ liệu 36
Chú ý: Nếu một lược đồ quan hệ không thoả mãn điều
kiện BCNF, ta có thể chuẩn hoá nó để có được các
lược đồ BCNF như:
- Loại bỏ các thuộc tính khóa phụ thuộc hàm vào thuộc
tính không khóa ra khỏi quan hệ và
- tách chúng thành một quan hệ riêng có khoá chính là
thuộc tính không khóa gây ra phụ thuộc.
Cơ sở dữ liệu 37
Ví dụ: Cho lược đồ quan hệ R = {A,B,C,D,E,F,G,H,I,J} có khóa
chính là A,B Với tập các phụ thuộc hàm :
- A,B → C,D,E,F,G,H,I,J
- A→ E,F,G,H,I,J
- F → I, J
- D →B
có pth A→ E,F,G,H,I,J mà A là một bộ phận của khóa chính nên
quan hệ R là vi phạm 2NF => tách R thành R1(A,E,F,G,H,I,J) và
R2(A,B,C,D).
Trong R1, do có phụ thuộc hàm F→ I, J nên có I,J phụ thuộc bắc
cầu vào khóa chính, R1 là quan hệ vi phạm 3NF.
Trong R2 ta có phụ thuộc hàm D → B trong đó B là một thuộc
tính khóa, R2 vi phạm BCNF.
Tách R1 và R2 ta có:
R11( F,I,J) , R12( A,E,F,G,H), R21(D,B), R22( A,D,C)
Cơ sở dữ liệu 38
* Quá trình chuẩn hóa
Cơ sở dữ liệu 39
Chuẩn hóa: đưa bảng chuẩn thấp lên
chuẩn cao hơn (1NF)
Ví dụ:
Kết quả là gì?
NV(MaNV,MaPhong,TenNV,Gioitinh,Diachi,TenPhong)
R(A1,A2,A3, A4, A5)
R1(A2, A4)
R(A1,A2,A3, A5)
Cơ sở dữ liệu 40
Chuẩn hóa: đưa bảng chuẩn thấp lên
chuẩn cao hơn (2NF)
Ví dụ:
Kết quả là gì?
NV(MaNV,MaPhong,TenNV,Gioitinh,Diachi,TenPhong)
R(A1,A2,A3, A4, A5)
R1(A2, A4)
R(A1,A2,A3, A5)
Cơ sở dữ liệu 41
Chuẩn hóa: đưa bảng chuẩn thấp lên
chuẩn cao hơn (3NF)
Ví dụ:
Kết quả là gì?
Hoc(MaSV,MaMon,Diem,MaGV)
R(A1,A2,A3, A4, A5)
R1(A4, A2)
R(A1,A4,A3, A5)
Cơ sở dữ liệu 42
III. Phép tách các lược đồ quan hệ
Định nghĩa: Phép tách các lược đồ quan hệ R=
{A1, A2, .. An} là việc thay thế lược đồ quan hệ R
bằng tập các lược đồ con {R1, R2, .., Rk}, trong đó
Ri R, i= 1,..,k - Ri là các lược đồ con
và R = R1 R2 ... Rk
Tính chất:
- Bảo toàn thuộc tính
- Bảo toàn phụ thuộc hàm
Mục đích: Loại bỏ các dị thường dữ liệu
Cơ sở dữ liệu 43
Ví dụ
Cho lược đồ quan hệ:
S(MCTY, ĐC, MH, GIA) và tập pth:
F = {MCTY ĐC; MCTY, MH GIA}
dị thường: địa chỉ một công ty phải lưu nhiều lần
Có thể được tách thành 2 lược đồ khác là:
S1( MCTY, ĐC ) và
S2 ( MCTY, MH, GIA )
như vậy sẽ không lưu địa chỉ của một công ty
nhiều lần
Cơ sở dữ liệu 44
Cơ sở dữ liệu 45
1. Tách-Kết nối không mất mát thông tin
Nếu R là một lược đồ quan hệ được tách thành
các lược đồ con R1, R2, .., Rk và F là một tập
pth.
Nói rằng phép tách R thành R1, R2, , Rk là
tách - kết nối không mất mát thông tin đối với
F nếu với mỗi quan hệ r trên R thoả F:
r = R1(r) * R2 (r) * ... * Rk(r)
tức là r được tạo nên từ phép kết nối tự nhiên
của các hình chiếu của nó trên các Ri, i= 1..,k
Cơ sở dữ liệu 46
Thuật toán kiểm tra phép tách-kết
nối không mất thông tin
Input:
- R ={A1, A2, .., An} – n thuộc tính tập pth F và
- phép tách p = (R1, R2, .., Rk) – k lược đồ con
Output: Phép tách có phải là không mất mát thông tin
hay không ?
Cơ sở dữ liệu 47
Thuật toán:
Bước 1: Tạo bảng với n+1 cột và k+1 hàng
- cột thứ j tương ứng với thuộc tính Aj
- hàng thứ i tương ứng với lược đồ Ri.
- Tại ô (i,j) điền kí hiệu aj nếu Aj Ri, ngược lại điền kí hiệu bij
Bước 2: Lần lượt xét các pth (X Y) F, áp dụng trên bảng
- Nếu tồn tại các hàng mà tất cả các cột tương ứng với thuộc tính của X
có giá trị như nhau thì làm cho các cột tương ứng với thuộc tính của Y
cũng có giá trị như nhau theo nguyên tắc: nếu có một giá trị aj trong
các cột tương ứng với các thuộc tính của Y thì đồng nhất các ký
hiệu thành aj, nếu không đồng nhất thay bằng ký hiệu bij với bij nhỏ
nhất
- Tiếp tục áp dụng tất cả các phụ thuộc hàm cho bảng (kể cả lặp lại các
phụ thuộc hàm đã áp dụng) cho tới khi không làm thay đổi bảng
Bước 3: Xem xét kết quả
- Nếu xuất hiện một hàng gồm toàn kí hiệu a1, a2, .. , an thì phép tách-
kết nối là không mất mát thông tin,
- ngược lại là phép tách-kết nối mất mát thông tin.
Cơ sở dữ liệu 48
Ví dụ 1:
Cho quan hệ: CC(S#, Sname, Add, Item, Price)
Ký hiệu: S S, N Sname, A Add,
I Item, P Price
Tập phụ thuộc hàm: S NA, SI P
Kiểm tra việc tách {S, N, A, I, P} thành hai sơ đồ con
{S, N, A} và {S, I, P} có mất mát thông tin?
Cơ sở dữ liệu 49
Lập bảng: 3 hàng – 6 cột
Xét S NA:
- Có hai hàng bằng nhau tại
thuộc tính S
- làm bằng nhau các kí hiệu
đối với thuộc tính N và A
làm b22 thành a2
làm b23 thành a3
Bảng có một hàng bao gồm
các ký hiệu a => phép tách
không mất mát thông tin
S N A I P
SNA a1 a2 a3 b14 b15
SIP a1 b22 b23 a4 a5
a5 a4 b23
a3
b22
a2
a1
b15 b14 a3 a2 a1
P I A N S
Cơ sở dữ liệu 50
Ví dụ 2:
Cho quan hệ R = ABCDE,
Tách thành các quan hệ: R1 = AD, R2 = AB, R3 = BE,
R4 = CDE, R5 = AE
Tập phụ thuộc hàm F:
- A C B C
- C D DE C
- CE A
Kiểm tra phép tách trên có mất mát thông tin
không?
Cơ sở dữ liệu 51
Lập bảng:
- 6 hàng – 6 cột
A B C D E
AD a1 b12 b13 a4 b15
AB a1 a2 b23 b24 b25
BE b31 a2 b33 b34 a5
CDE b41 b42 a3 a4 a5
AE a1 b52 b53 b54 a5
Cơ sở dữ liệu 52
Xét PTH: A C:
-có các hàng bằng nhau trên thuộc tính A
-Làm bằng nhau các ký hiệu đối với các thuộc tính C, cụ thể:
b23, b53 thành b13
a5 b54 b53 b13 b52 a1
a5 a4 a3 b42 b41
a5 b34 b33 a2 b31
b25 b24 b23 b13 a2 a1
b15 a4 b13 b12 a1
E D C B A
Cơ sở dữ liệu 53
Xét PTH: B C:
-có hai hàng bằng nhau trên thuộc tính B
-Làm bằng nhau các ký hiệu đối với các thuộc tính C, cụ thể:
b33 thành b13
a5 b54 b13 b52 a1
a5 a4 a3 b42 b41
a5 b34 b33 b13 a2 b31
b25 b24 b13 a2 a1
b15 a4 b13 b12 a1
E D C B A
Cơ sở dữ liệu 54
Xét PTH: C D:
-có các hàng bằng nhau trên thuộc tính C
-Làm bằng nhau các ký hiệu đối với các thuộc tính D, cụ thể:
b24, b34, b54 thành a4
a5 b54 a4 b13 b52 a1
a5 a4 a3 b42 b41
a5 b34 a4 b13 a2 b31
b25 b24 a4 b13 a2 a1
b15 a4 b13 b12 a1
E D C B A
Cơ sở dữ liệu 55
Xét PTH: DE C:
-có các hàng bằng nhau trên thuộc tính DE
-Có thể làm bằng nhau các ký hiệu đối với các thuộc tính C, cụ thể:
b13 thành a3
a5 a4 b13 a3 b52 a1
a5 a4 a3 b42 b41
a5 a4 b13 a3 a2 b31
b25 a4 b13 a2 a1
b15 a4 b13 b12 a1
E D C B A
Cơ sở dữ liệu 56
Xét PTH: CE A:
-có hai hàng bằng nhau trên thuộc tính CE
-Có thể làm bằng nhau các ký hiệu đối với các thuộc tính A, cụ thể:
b31, b41 thành a1
Kết quả: Có dòng chứa các ký hiệu a => phép tách không mất mát thông tin
a5 a4 a3 b52 a1
a5 a4 a3 b42 b41 a1
a5 a4 a3 a2 b31 a1
b25 a4 b13 a2 a1
b15 a4 b13 b12 a1
E D C B A
Cơ sở dữ liệu 57
Ví dụ 3: Cho lược đồ quan hệ R = với
tập thuộc tính U = {A, B, C, D, E} và tập phụ
thuộc hàm F = {A C, B C, CD, DE C,
CE A}.
- Kiểm tra tính không mất mát thông tin của phép
tách R thành: R1(AC), R2(CD), R3(BE), R4(BC),
R5(AE).
Cơ sở dữ liệu 58
Bước 1: Lập bảng:
Bước 2:
Xét pth A C, trên bảng có hai
hàng 1 và 5 bằng nhau trên cột
A, làm bằng nhau trên cột C
(bằng a3).
Xét pth B C, trên bảng có hai
hàng 3 và 4 bằng nhau trên cột
B, làm bằng nhau trên cột C
(bằng a3).
Xét pth C D, trên bảng cả 5
hàng bằng nhau trên cột C, làm
bằng nhau trên cột D (bằng a4).
Xét pth CE A, trên bảng có
dòng 3 và dòng 5 bằng nhau trên
cột CE, làm bằng nhau trên cột A
(bằng a1).
A B C D E
R1 a1 b12 a3 b14 b15
R2 b21 b22 a3 a4 b25
R3 b31 a2 b33 b34 a5
R4 b41 a2 a3 b44 b45
R5 a1 b52 b53 b54 a5
A B C D E
R1 a1 b12 a3 b14 a4 b15
R2 b21 b22 a3 a4 b25
R3 b31 a1 a2 b33 a3 b34 a4 a5
R4 b41 a2 a3 b44 a4 b45
R5 a1 b52 b53 a3 b54 a4 a5
Cơ sở dữ liệu 59
2. Tách quan hệ về 3NF vừa bảo toàn thông
tin vừa bảo toàn PTH
Thuật toán:
Bước 1: tìm phủ tối thiểu G của F
Bước 2:
- Với mỗi vế trái X của một phụ thuộc hàm xuất hiện trong
G, tạo một lược đồ mới theo nguyên tắc
với các thuộc tính {X, A1, A2,, Ak}
trong đó X→A1, X→A2,, X→Ak là các phụ thuộc hàm trong G
với X là vế trái
X là khóa của quan hệ này
- Xét tất cả các phụ thuộc hàm của tập phủ tối thiểu G
- Nếu có lược đồ con chứa khóa K thì kết thúc thuật toán
ngược lại thì tạo lược đồ con K.
Cơ sở dữ liệu 60
Ví dụ:
- Xét lược đồ: R = { A,B,C,D} , với các phụ thuộc
hàm: F = {A → BCD; BC → DA; D →B}
- Tách lược đồ thành các lược đồ ở dạng 3NF
Cơ sở dữ liệu 61
Trước tiên ta tìm G là phủ tối thiểu của F.
Theo thuật toán tìm phủ tối thiểu, đầu tiên ta làm cho
các vế phải trong G chỉ chứa một thuộc tính, ta có:
G = {A → B; A → C; A→ D; BC → D; BC → A; D → B}
Sau đó ta bỏ đi các phụ thuộc hàm thừa (là các phụ
thuộc hàm có thể suy diễn được từ các phụ thuộc hàm
khác).
Vậy G = {A → C; BC → A; D → B}.
Lược đồ R sẽ được tách thành:
R1( A,C); R2(B,C,A); R3(D,B) với các khóa chính được
gạch dưới.
Cơ sở dữ liệu 62
3. Phép tách quan hệ về BCNF bảo toàn
thông tin
Phép tách một lược đồ quan hệ R với tập pth F, không làm
mất mát thông tin sao cho mỗi lược đồ con đều ở BCNF.
Phương pháp: Lặp liên tiếp. Tại mỗi bước phép tách p là bảo
đảm không mất mát thông tin đối với F.
Thuật toán:
Bước đầu: p chỉ bao gồm R
Các bước tiếp: Nếu S là một lược đồ thuộc p, S chưa ở
BCNF, chọn X A là pth thoả trên S, trong đó X không
chứa khoá của S, A X. Thay thế S trong p bởi S1 và S2
với : S1 = XA, S2 = S - A
Quá trình tiếp tục cho tới khi tất cả các lược đồ đều ở dạng
chuẩn BCNF
Cơ sở dữ liệu 63
Ví Dụ 1: Cho lược đồ R(CTHRSG) với tập pth :
C T, HR C, HC R, CS G, HS R
Khoá của R là HS.
Ta lần lượt xét các pth vi phạm điều kiện BCNF.
Xét C T : vi phạm BCNF vì C không chứa khoá, dùng
thuật toán trên để tách thành : R1(CT) và R2( CHRSG).
Sau đó cần tính F+ và chiếu xuống R1 và R2, kiểm tra ta
thấy R1 đã ở BCNF, R2 thì chưa. Ta tách tiếp R2.
Thực hiện tách liên tiếp
Cơ sở dữ liệu 64
R(CTHRSG)
Khoá =HS
R1(CT)
Khoá =C
R2(CHRSG)
Khoá =HS
R21(CSG)
Khoá =CS
R22(CHRS)
Khoá =HS
R221(HRC)
Khoá =HR,HC
R222(HSR)
Khoá =HS
C T, HR C, HC R, CS G,
HS R
HR C, HC R,
CS G, HS R
HR C, HC
R, HS R
HR C, HC R HS R
CS G
C T
Quá trình tách có thể được biểu diến qua sơ đồ :
Cơ sở dữ liệu 65
Ví dụ 2:
- Xét lược đồ quan hệ R = { A, B, C, D, E, F)
- Với các phụ thuộc hàm:
- A → BCDEF, BC → ADEF, B→ F, D→ E, D→ B
- Lược đồ quan hệ này có hai khóa dự tuyển là A và BC
- Tách lược đề về BCNF
Cơ sở dữ liệu 66
Sơ đồ các bước tách lược đồ
R(ABCDEF)
Khoá =A, BC
R1(BF)
Khoá =B
R2(ABCDE)
Khoá =A, BC
R21(DE)
Khoá =D
R22(ABCD)
Khoá =A, BC
R221(DB)
Khoá =D
R222(ACD)
Khoá =A
B→ F, D→ E, D→ B
D→ E, D→ B
D→ B
D B
D E
B F
Cơ sở dữ liệu 67
BTVN:
BÀI 1. Cho lược đồ quan hệ R= với tập thuộc
tính U = ABCDEHG và tập phụ thuộc hàm F= {DE G,
E A, H C, CG H, DG EA, D B}
a. Xác định khoá của lược đồ quan hệ trên.
b. Xác định dạng chuẩn cao nhất của lược đồ
quan hệ trên.
BÀI 2. Xác định dạng chuẩn cao nhất của lược đồ
quan hệ với các thuộc tính ABCDEF và tập phụ thuộc
hàm {AB C, C B, ABD E, F A}
BÀI 3. Cho W= R = { A, B, C, D}
F= { B D, A C, C ABD}. Hỏi W có là 2NF, 3NF
không ?
Cơ sở dữ liệu 68
BÀI 4. Xác định dạng chuẩn cao nhất của lược đồ
quan hệ sau: H = (U,F); U=ABCD;
F = { CD B, A C, B ACD }
BÀI 5. Cho lược đồ R = (BOISQD) và
F = { S D, I B, IS Q, B O }
a. Chứng tỏ rằng phép tách: R = (SD, IB, ISQ, BO) Là
phép tách không mất mát thông tin.
b. Chứng tỏ phép tách trên là ở dạng 3NF.
Các file đính kèm theo tài liệu này:
- bai_giang_co_so_du_lieu_chuong_6_chuan_hoa_co_so_du_lieu_ngu.pdf