Các mức biểu diễn của CSDL
Gồm 3 mức :
Mức ngoài : là tập tất cả các dữ liệu mà người sử dụng cụ
thể có thể nhìn thấy và được phép truy cập, là mức của người
sử dụng và các chương trình ứng dụng thể hiện một phần
CSDL mà người dùng cần khai thác
Mức khái niệm (mức trung gian): giải quyết vấn đề lưu trữ
dữ liệu loại gì, lưu trữ bao nhiêu, mối quan hệ trong CSDL và
mối quan hệ giữa các loại dữ liệu này như thế nào cho biết
dữ liệu nào được lưu trữ trong hệ CSDL
Mức trong (mức vật lý): Đây là mức lưu trữ dữ liệu. Mục
đích của mức này giải quyết vấn đề dữ liệu là gì, dữ liệu được
lưu trữ như thế nào và nhằm mục đích gì Tập hợp các file
dữ liệu
Một CSDL chỉ có một CSDL vật lý, một CSDL khái niệm
nhưng có nhiều khung nhìn khác nhau
Phân loại cơ sở dữ liệu
Cơ sở dữ liệu dạng file: được lưu dưới dạng các file
văn bản, như: text, doc, dbf,
Cơ sở dữ liệu quan hệ: dữ liệu được lưu trữ trong
các bảng, giữa các bảng có quan hệ với nhau
Cơ sở dữ liệu hướng đối tượng: dữ liệu cũng được
lưu trữ trong các bảng nhưng các bảng có bổ sung
thêm các tính năng hướng đối tượng (lưu trữ hành vi
đối tượng)
Cơ sở dữ liệu bán cấu trúc: được lưu dưới định
dạng XML, mô tả về đối tượng thể hiện trong các thẻ
45 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 927 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Cơ sở dữ liệu - Chương 1: Các khái niệm cơ bản - Nguyễn Thị Tâm, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CƠ SỞ DỮ LIỆU
QUAN HỆ
ThS. Nguyễn Thị Tâm
45 tiết Lý thuyết
tamntam@gmail.com
Sites.google.com/site/tamntam
2 20/09/2012
Hình thức đánh giá
Hình thức đánh giá:
Bài tập lớn
Chia nhóm: 3 SV/ 1 đề tài
Cách tính điểm:
10%: Chuyên cần
20%: Điểm giữa kỳ
Kiểm tra
BTVN
Lên bảng
70%: Kết thúc môn
BTL: 35%
Thi viết: 35%
3 20/09/2012
Cách đánh giá điểm chuyên cần
Học phần
Nội dung
30 tiết 45 tiết 60 tiết 75 tiết
Vắng không phép - 2 điểm/tiết - 1.5 điểm/tiết - 1 điểm/buổi - 0.5 điểm/tiết
Vắng có phép - 1 điểm/tiết - 0.5 điểm/tiết
- 0.5
điểm/buổi
- 0.25
điểm/tiết
Đến lớp trễ - 0.5 điểm/lần - 0.5 điểm/lần
- 0.5
điểm/buổi
- 0.25
điểm/lần
4 20/09/2012
Mục đích
Trang bị cho sinh viên các kiến thức sau:
Các khái niệm về cơ sở dữ liệu
Thành thạo các phép toán đại số quan hệ
Các khái niệm cơ bản của cơ sở dữ liệu quan hệ
Các dạng chuẩn cơ bản
Phương pháp thiết kế cơ sở dữ liệu
Ngôn ngữ truy vấn bằng đại số quan hệ
5 20/09/2012
Yêu cầu
Kết thúc chương trình, sinh viên cần nắm vững:
Các khái niệm cơ bản về CSDL Quan hệ
Nắm được các ràng buộc dữ liệu trong CSDL
Hiểu và biết cách vận dụng các mô hình thực thể
liên kết (ER) để đặc tả CSDL của hệ thống thực
Nắm vững phương pháp và thiết kế được CSDL
theo chuẩn 3NF hoặc chuẩn Boyce – Codd
Viết được các biểu thức truy vấn CSDL Quan hệ
bằng đại số quan hệ
6 20/09/2012
Nhiệm vụ của sinh viên
Tham gia lớp học đầy đủ:
lên lớp nghe giảng
thảo luận
Hoàn thành các bài tập về nhà và bài kiểm tra tại lớp
7 20/09/2012
Nội dung
Các khái niệm cơ bản
Mô hình thực thể liên kết
Mô hình quan hệ
Phụ thuộc hàm, hệ tiên đề Amstrong
Bao đóng, rút gọn phụ thuộc hàm
Khóa
Chuẩn của lược đồ quan hệ
Thiết kế cơ sở dữ liệu
Khai thác CSDL: biểu thức đại số quan hệ,
SQL,
8 20/09/2012
Tài liệu tham khảo
Cơ sở dữ liệu, Khoa CNTT, Viện Mở Hà Nội
Nhập môn CSDL, Nguyễn Tuệ, NXB Đại học Quốc
Gia, 2008.
Giáo trình nhập môn CSDL quan hệ - Lê Tiến
Vương – NXB Giáo dục 2004
Cơ sở dữ liệu, Đỗ Trung Tuấn
Cơ sở dữ liệu - lý thuyết và thực hành - Nguyễn Bá
Tường
Fundamentals of Database Systems, 3rd+ edition,
John Wiley & Sons, Inc,2000.
9 20/09/2012
CHƯƠNG I:
CÁC KHÁI NIỆM CƠ BẢN
10 20/09/2012
Vì sao phải học CSDL?
Ví dụ 1:
Để quản lý bán hàng tại một cửa hàng điện thoại di
động, giả sử người ta tổ chức 1 tập tin lưu trữ có
dạng như sau:
Tên điện thoại Đơn giá
V3i 176 $
Samsung E250 117 $
01
02
STT
V3i
V3i
03
04
Số lượng
2
1
1
2
Thành tiền
325 $
.
176 $
176 $ 325 $
176 $
117 $
11 20/09/2012
Ví dụ 2:
Tại một trường Đại học, để nâng cao chất lượng đào tạo
và nghiên cứu khoa học. Giả sử người ta tổ chức lưu trữ hồ sơ
cán bộ trong trường và một số thông tin khác để tiện theo dõi.
Thông tin về cán bộ gồm mã cán bộ, họ, tên, học vị, học hàm,
khoa
Trong khi đó ở mỗi khoa của trường do yêu cầu công
việc riêng, khoa cũng tổ chức lưu trữ cán bộ trong khoa (hồ sơ
được trích ra từ phòng đào tạo)
12 20/09/2012
Khi chưa có máy tính người ta lưu trữ dữ liệu như thế nào?
Cách lưu trữ dữ liệu bằng các tệp tin truyền thống.
Vd: Các file .xls, .doc.
Tổ chức riêng rẽ
Phục vụ cho một mục đích
Ưu:
Đáp ứng yêu cầu nhanh chóng
Ít cần đầu tư tiền của, chất xám,..
Nhược:
Thông tin không nhất quán
Thiếu sự kế thừa, chia sẻ thông tin.
Không phù hợp với các hệ thống thông tin lớn!!!
13 20/09/2012
Vì những nhược điểm nêu trên, nên người ta đã xây
dựng lý thuyết thiết kế CSDL nhằm mang lại những mô
hình CSDL tối ưu theo nghĩa:
Không dư thừa dữ liệu
Bảo đảm tính nhất quán
Không có dị thường xảy ra
Bảo đảm tính dùng chung.
14 20/09/2012
I. Cơ sở dữ liệu là gì?
Cơ sở dữ liệu (Database): là tập hợp dữ liệu có cấu
trúc được lưu trữ trên các thiết bị trữ tin nhằm thỏa
mãn đồng thời cho nhiều người sử dụng khác nhau
với các mục đích khác nhau
CSDL bao gồm các loại dữ liệu: âm thanh, tiếng nói,
chữ viết, văn bản, đồ họa, hình ảnh, được mã hóa
và lưu trữ dưới dạng file cụ thể
CSDL
Người
dùng
Cho phép truy cập
thông tin
Lưu trữ thông tin
15 20/09/2012
Ví dụ: Cơ sở dữ liệu
quản lý học tập trong
trường đại học:
Thông tin về sinh viên
Thông tin về môn học
Thông tin về điểm,
..
-> là các thông tin có ý
nghĩa, có liên quan đến
nhau, được lưu trên
máy tính và có nhiều
người sử dụng!
16 20/09/2012
Các yêu cầu cơ bản của CSDL
Tính cấu trúc
Tính toàn vẹn
Tính nhất quán
Tính an toàn và bảo mật
Tính độc lập
Tính không dư thừa
17 20/09/2012
Các vấn đề CSDL cần giải quyết:
Tính chủ quyền của dữ liệu
Tính bảo mật và quyền khai thác thông tin
Tranh chấp dữ liệu
Đảm bảo an toàn dữ liệu khi có sự cố
18 20/09/2012
Các mức biểu diễn của CSDL
Gồm 3 mức :
Mức ngoài : là tập tất cả các dữ liệu mà người sử dụng cụ
thể có thể nhìn thấy và được phép truy cập, là mức của người
sử dụng và các chương trình ứng dụng thể hiện một phần
CSDL mà người dùng cần khai thác
Mức khái niệm (mức trung gian): giải quyết vấn đề lưu trữ
dữ liệu loại gì, lưu trữ bao nhiêu, mối quan hệ trong CSDL và
mối quan hệ giữa các loại dữ liệu này như thế nào cho biết
dữ liệu nào được lưu trữ trong hệ CSDL
Mức trong (mức vật lý): Đây là mức lưu trữ dữ liệu. Mục
đích của mức này giải quyết vấn đề dữ liệu là gì, dữ liệu được
lưu trữ như thế nào và nhằm mục đích gì Tập hợp các file
dữ liệu
Một CSDL chỉ có một CSDL vật lý, một CSDL khái niệm
nhưng có nhiều khung nhìn khác nhau
19 20/09/2012
CSDL
mức
khái
niệm
View 1
View 2
View k
CSDL
mức
vật
lý
.
User 1
User 2
User k
Mức ngoài Mức trung gian Mức vật lý
* Sự phân mức một CSDL
20 20/09/2012
*Phân loại cơ sở dữ liệu
Cơ sở dữ liệu dạng file: được lưu dưới dạng các file
văn bản, như: text, doc, dbf,
Cơ sở dữ liệu quan hệ: dữ liệu được lưu trữ trong
các bảng, giữa các bảng có quan hệ với nhau
Cơ sở dữ liệu hướng đối tượng: dữ liệu cũng được
lưu trữ trong các bảng nhưng các bảng có bổ sung
thêm các tính năng hướng đối tượng (lưu trữ hành vi
đối tượng)
Cơ sở dữ liệu bán cấu trúc: được lưu dưới định
dạng XML, mô tả về đối tượng thể hiện trong các thẻ
21 20/09/2012
Các ứng dụng của cơ sở dữ liệu: trong hầu hết các lĩnh
vực
Kinh doanh: thông tin sản phẩm, khách hàng, nhà cung
cấp,
Doanh nghiệp: cán bộ, lương, công việc,..
Giáo dục: học sinh, điểm, môn học, giáo viên,..
Thư viện: tài liệu, tác giả, độc giả
Y tế: bệnh nhân, thuốc, bác sỹ, điều trị,
Các đối tượng sử dụng CSDL:
Những người sử dụng CSDL không chuyên
Các chuyên viên biết khai thác CSDL – lập trình.
Người quản trị CSDL
22 20/09/2012
II. Hệ quản trị CSDL:
Một hệ quản trị CSDL là:
Một tập hợp các phần mềm quản lý CSDL và cung cấp các
dịch vụ xử lý CSDL cho các nhà phát triển ứng dụng và người
dùng cuối
HQTCSDL cung cấp một giao diện giữa người sử dụng và dữ
liệu
Một Hệ quản trị CSDL phải có ít nhất các chức năng sau:
Định nghĩa dữ liệu → DDL (Data Definition Language)
Thêm, sửa, xóa dữ liệu → DML (Data Manipulation
Language)
Truy vấn dữ liệu → SQL (Structured Query Language)
Quản lý dữ liệu → DCL (Data Control Language)
Sắp xếp, tìm kiếm
Đa số HQT CSDL đều sử dụng ngôn ngữ truy vấn cấu trúc
SQL
23 20/09/2012
Để khai thác và lưu trữ
thông tin trong máy tính
cần có:
•Cơ sở dữ liệu
•Hệ quản trị cơ sở dữ liệu
•Các thiết bị vật lý
24 20/09/2012
Ưu điểm của HQT CSDL:
Quản lý được dữ liệu dư thừa
Đảm bảo tính nhất quán cho dữ liệu
Tạo khả năng chia sẻ dữ liệu nhiều hơn
Cải tiến tính toàn vẹn cho dữ liệu
Nhược điểm:
HQT CSDL tốt thì khá phức tạp
HQT CSDL tốt thường rất lớn, chiếm nhiều dung
lượng bộ nhớ
Giá cả khác nhau tùy theo môi trường và chức năng
HQT CSDL được viết tổng quát cho nhiều người
dùng thì thường chậm
25 20/09/2012
*Phân loại Hệ QTCSDL
Theo mô hình dữ liệu:
Mô hình dữ liệu Hệ QT CSDL
Quan hệ Hệ QT CSDL quan hệ
Mạng Hệ QT CSDL mạng
Phân cấp Hệ QT CSDL phân cấp
Theo số người sử dụng đồng thời:
Hệ QT CSDL đơn
Hệ QT CSDL đa người dùng
Theo vị trí đặt CSDL:
Hệ QT CSDL tập trung
Hệ QT CSDL phân tán
26 20/09/2012
* Các thành phần trong hệ QT CSDL:
• CSDL cho phép nhiều người sử dụng, nhiều chương
trình ứng dụng cùng chia sẻ, dùng để lưu trữ dữ liệu
• Người sử dụng (user): Là những người có nhu cầu
truy cập vào CSDL để thực hiện một thao tác nào
đó. VD: các lập trình viên ứng dụng, những người sử
dụng thiết bị cuối từ xa)
• Phần mềm QT CSDL.
• Phần cứng: Các thiết bị nhớ thứ cấp được sử dụng
để lưu trữ dữ liệu
27 20/09/2012
*. Người dùng:
Người dùng: khai thác CSDL thông qua HQT CSDL,
phân thành ba loại:
quản trị CSDL: quản lý và bảo trì CSDL
phát triển ứng dụng và lập trình: người chuyên
nghiệp về máy tính, có trách nhiệm thiết kế, tạo dựng
và bảo trì hệ thống
người dùng cuối: người không chuyên về máy tính,
các chuyên gia trong các lĩnh vực khác có trách
nhiệm cụ thể trong tổ chức
28 20/09/2012
*. Ràng buộc dữ liệu
Ràng buộc dữ liệu là mối quan hệ, ràng buộc lần
nhau giữa các thực thể dữ liệu
Ràng buộc chính là: Tập các quy tắc, quy định yêu
cầu dữ liệu trong CSDL phải thỏa mãn
Phân loại ràng buộc dữ liệu:
Ràng buộc kiểu: loại ràng buộc thấp nhất, mô tả tính
chất của thuộc tính khi tạo lập CSDL
Ràng buộc giải tích: là ràng buộc giữa các thuộc
tính, được biểu diễn bằng biểu thức toán học
Ràng buộc logic: thể hiện mối quan hệ giữa các
thuộc tính với nhau, không phải là ràng buộc giải tích
được gọi là phụ thuộc hàm
29 20/09/2012
III. Mô hình cơ sở dữ liệu?
Mô hình cơ sở dữ liệu là sự trừu tượng hóa môi trường thực
Khái niệm: Mô hình CSDL là tập hợp các khái niệm dùng để biểu diễn các
cấu trúc của cơ sở dữ liệu. Bao gồm:
Kiểu dữ liệu
Mối liên kết
Các ràng buộc
Mô hình CSDL là hệ hình thức toán học gồm có hai phần:
Một hệ thống các ký hiệu để mô tả dữ liệu
Một tập hợp các phép toán thao tác trên dữ liệu đó.
Đặc trưng của một mô hình dữ liệu:
Tính ổn định khi thiết kế mô hình dữ liệu
Tính đơn giản: dễ hiểu và dễ thao tác
Tính dư thừa phải kiểm tra kỹ càng
Cơ sở lý thuyết vững chắc
30 20/09/2012
Lịch sử của mô hình CSDL
31 20/09/2012
Một vài mô hình dữ liệu
Mô hình phân cấp
Mô hình mạng
Mô hình quan hệ
Mô hình thực thể liên kết
Mô hình hướng đối tượng
Mô hình bán cấu trúc
Mô hình dữ liệu của XML
32 20/09/2012
Mô hình dữ liệu quan hệ thường được dùng trong các
hệ quản trị CSDL, mô hình này không được trực quan
=> thường dùng một mô hình trung gian đó là mô hình
thực thể kết hợp.
Hiện nay mô hình thực thế kết hợp được coi là mô
hình chuẩn để thiết kế hệ thống thông tin.
33 20/09/2012
a. Mô hình dữ liệu quan hệ
Mô hình dữ liệu quan hệ do E.F. Codd đề xuất.
Nền tảng cơ bản của nó là khái niệm lý thuyết tập hợp trên các
quan hệ, tức là tập các bộ giá trị.
Mô hình này:
Biểu thị dữ liệu trong một CSDL như một tập các quan hệ.
Một quan hệ là một bảng các giá trị gồm các dòng và các cột
Mã SV Họ và tên Ngày sinh Địa chỉ
0001 Nguyen 12/12/1989 Hà nội
0002 An 2/3/1990
34 20/09/2012
34
b. Mô hình dữ liệu phân cấp
Mô hình dữ liệu phân cấp là một cây (Tree) trong đó mỗi nút
của cây biểu diễn một thực thể, giữa nút con và nút cha được
liên hệ với nhau theo một mối quan hệ xác định.
Như vậy, mối liên hệ từ mẫu tin chủ tới các mẫu tin thành viên
là 1-n, và từ mẫu tin thành viên tới mẫu tin chủ là 1-1.
Ưu điểm: biểu diễn tốt mối quan hệ 1 - N
35 20/09/2012
Ví dụ : TOÀN QUỐC
HÀ NỘI HẢI PHÒNG NAM ĐỊNH
NAM HỒNG CỔ LOA
BA ĐÌNH ĐÔNG ANH
NK 1
HỘ 2
NK 1
HỘ 1
36 20/09/2012
c. Mô hình dữ liệu mạng
Mô hình dữ liệu mạng (lưới) là mô hình được biểu
diễn bởi một đồ thị có hướng.
Sử dụng kiến trúc phân cấp, cho phép các bảng con
có thể có nhiều bảng cha
Dữ liệu được lưu trong các bộ thay vì trong định dạng
cây phân cấp.
Ưu điểm: biểu diễn tốt mối quan hệ N-N
37 20/09/2012
PHÒNG
CÔNG VIỆC
LÝ LỊCH
NHÂN VIÊN
Có Gồm
Cùng làm
quản lý
1-n n-1
1-n
1-1
Mô hình dữ liệu mạng ( Network Model)
38 20/09/2012
d. Mô hình dữ liệu hướng đối tượng
Là loại mô hình tiên tiến nhất hiện nay, dựa trên cách
tiếp cận hướng đối tượng
Sử dụng các khái niệm như lớp, sự kế thừa, kế thừa
bội
Phương pháp tiếp cận này còn mới mẻ và các hệ
quản trị CSDL hướng đối tượng hiện nay vẫn chưa
nhiều và chưa thuần nhất
39 20/09/2012
e. Mô hình dữ liệu Kho dữ liệu
Kho dữ liệu là một tập các dữ liệu có những đặt điểm
sau:
tập trung vào một chủ đề,
tổng hợp từ nhiều nguồn dữ liệu khác nhau, từ
nhiều thời gian, và không sửa đổi.
Được dùng trong việc hỗ trợ ra quyết định trong
công tác quản lý
Kho dữ liệu: Data Warehouse
40 20/09/2012
*Các bước xây dựng một hệ CSDL
41 20/09/2012
Lợi ích khi sử dụng CSDL - HQTCSDL
Hạn chế dư thừa dữ liệu
Có tính chia sẻ
Ngăn cản truy cập bất hợp pháp
Lưu trữ lâu dài
Cho phép suy dẫn dữ liệu
Cung cấp giao diện đa người dùng
Biểu diễn được các mối quan hệ phức tạp của dữ liệu
Đảm bảo ràng buộc toàn vẹn dữ liệu
Cho phép sao lưu phục hồi khi có sự cố.
42 20/09/2012
V. Đối tượng sử dụng CSDL
Đối tượng trực tiếp: là những người tham gia thiết
kế, xây dựng, bảo trì và sử dụng một CSDL.
Đối tượng gián tiếp: những người phân tích, phát
triển và thực hiện tạo ra môi trường hệ thống và phần
mềm của hệ QTCSDL.
-> Không trực tiếp thao tác trên một HQTCSDL cụ thể.
43 20/09/2012
1. Đối tượng trực tiếp
Quản trị viên – Database Administrator: người
quản lý và chịu trách nhiệm với nguồn dữ liệu
Tổ chức nội dung
Phân quyền truy cập
Đảm bảo an toàn, bảo mật, sao lưu,, phục hồi,
Thiết kế viên:
Phỏng vấn người sử dụng để nắm được yêu cầu
Xác định dữ liệu cần lưu trữ
Lựa chọn cấu trúc thích hợp để biểu diễn
Phân tích thiết kế hệ thống sau khi thống nhất được
các yêu cầu.
44 20/09/2012
Người dùng cuối:
Truy vấn
Cập nhật
Thống kê
Lập trình viên: thực hiện các yêu cầu thông qua lập
trình sử dụng ngôn ngữ phù hợp
Viết code
Chạy thử
Chữa lỗi, gỡ rối
Viết tài liệu hướng dẫn sử dụng
Bảo trì hệ thống.
45 20/09/2012
2. Đối tượng gián tiếp
Người phân tích và xây dựng hệ QTCSDL
Người phát triển công cụ
Người kiểm tra và bảo trì phần cứng và phần mềm
của hệ thống
Các file đính kèm theo tài liệu này:
- bai_giang_co_so_du_lieu_chuong_1_cac_khai_niem_co_ban_nguyen.pdf