Luận văn Cơ sở dữ liệu đa phương tiện yêu cầu và các vấn đề

Mục lục

BẢNG THUẬT NGỮVÀ CÁC CHỮVIẾT TẮT .4

LỜI CẢM ƠN .5

MỞ ĐẦU.7

CHƯƠNG 1 .10

GIỚI THIỆU CHUNG VỀCƠSỞDỮLIỆU ĐA PHƯƠNG TIỆN .10

1.1 Các kiểu truyền thông vàmultimedia .11

1.1.1. Cơsởdữliệu và các DBMS .12

1.1.2. Truy tìm thông tin tài liệu văn bản .12

1.1.3. Truy xuất và chỉsốhoá multimedia.13

1.1.4. Trích rút đặc trưng, biểu diễn nội dung và chỉsốhoá .13

1.2 Sựcần thiết đối với MIRS.13

1.2.1. Sựphát triển vềdữliệu multimedia và các đặc trưng của nó.14

1.2.2. Các DBMS và vai trò của chúng trong việc xửlý dữliệu multimedia.15

1.2.3. Hệthống IR và vai trò của nó trong việc truy xuất multimedia .18

1.2.4. Cách tiếp cận tích hợp việc truy xuất và chỉsốhoá thông tin multimedia19

1.3 Tổng quan vềMIRS .19

1.4 Các ứng dụng nói chung và khảnăng mong đợi của MIRS.20

CHƯƠNG 2 .24

CƠSỞDỮLIỆU ĐA PHƯƠNG TIỆN (Multimedia Database) .24

2.1 Kiến trúc cho việc tổchức nội dung.25

2.4.1 Nguyên lý tựtrị.25

2.4.2 Nguyên lý đồng nhất .26

2.4.3 Nguyên lý lai ghép .27

2.2 Tổchức dữliệu multimedia dựa trên nguyên lý đồng nhất. .30

2.3 Cấu trúc tóm tắt media .32

2.4.1 Dữliệu ảnh nhưlà một tóm tắt media. .33

2.4.2 Dữliệu video nhưlà một tóm tắt media. .34

2.4.3 Định nghĩa vềmột CSDL Multimedia đơn giản.36

2.4.4 Định nghĩa vềmột CSDL Multimedia có cấu trúc.37

2.4 Ngôn ngữtruy vấn khai thác dưliệu multimedia.39

2.4.1 Truy vấn SMDSs (mô tả đồng nhất) .40

2.4.2 Truy vấn dữliệu multimedia mô tảdưới kiến trúc lai tạo. .43

2.4.3 Chỉsốhoá SMDS với chỉsố đảo. .46

CHƯƠNG 3 .52

HỆQUẢN TRỊCƠSỞDỮLIỆU ĐA PHƯONG TIỆN – YÊU CẦU VÀ CÁC VẤN ĐỀ.52

3.1 Mục đích của MDBMS .52

3.2 Các yêu cầu của một MDBMS.55

3.2.1 Khảnăng quản trịlưu trữlớn.57

3.2.2 Hỗtrợtruy vấn và khai thácdữliệu. .58

3.2.3 Tích hợp các phương tiện, tổng hợp và thểhiện.59

3.2.4 Giao diện và tương tác. .59

3.2.5 Hiệu suất. .60

3.3 Các vấn đềcủa MDBMS.60

3.3.1 Mô hình hoá dữliệu MULTIMEDIA .60

3.3.2 Lưu trữ đối tượng MULTIMEDIA .62

3.3.3 Tích hợp multimedia, thểhiện và chất lượng của dịch vụ(QoS).63

3.3.4 Chỉsốhoá multimedia .64

3.3.5 Hỗtrợtruy vấn multimedia, khai thác và duyệt qua.65

3.3.6 Quản trịCSDL multimedia phân tán .66

3.3.7 Sựhỗtrợcủa hệthống .67

CHƯƠNG 4 .69

XÂY DỰNG HỆTHỐNG MUA BÁN HÀNG QUA MẠNG.69

4.2.1. Giới thiệu .69

4.2.2. Ứng dụng CSDL đa phương tiện vào hệthống bán hàng qua mạng.70

4.2.1. Xây dựng kho dữliệu hình ảnh 2D và 3D .71

4.2.2. Xây dựng cơchếtruy vấn đối với kho dữliệu hình ảnh .71

4.2.3. Hệthống bán hàng qua mạng .73

4.3.1. Mô hình hệthống .73

4.3.2. Các chức năng cơbản của hệthống.75

4.3.3. Các công cụphát triển hệthống.76

4.3.4. Quy trình thực hiện giao dịch của hệthống .77

4.3.5. Cài đặt hệthống .78

4.4. Giải pháp tích hợp các hệthống khác .80

4.4.1. Hệthống quản lý và cấp phát chứng chỉsố(CA) .80

4.4.2. Hệthống thanh toán trực tuyến (VASC Payment) .81

4.5. Một sốgiao diện chính của hệthống.83

KẾT LUẬN .86

TÀI LIỆU THAM KHẢO.87

pdf88 trang | Chia sẻ: maiphuongdc | Lượt xem: 1449 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Luận văn Cơ sở dữ liệu đa phương tiện yêu cầu và các vấn đề, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
cần được quan tâm như ngày, thời gian và địa điểm chụp bức ảnh đó. • λ là một ánh xạ đặc trưng rút gọn cho phép ta biết đặc trưng nào xuất hiện trong những trạng thái nào. λ có thể là một GUI cho phép người sử dụng tương tác nhằm mục đích nhận biết được nội dung của một đối tượng media. • R là một tập các quan hệ trên fei x ATTRj x S các quan hệ này phụ thuộc vào trạng thái. Ví dụ nếu xem xét một bức ảnh như photo1.gif thì ở đây có thể có một quan hệ phụ thuộc vào trạng thái gọi là left.of bao gồm một bộ ba có dạng (đối tượng A, đối tượng B, photo1.gif). tương tự như vậy chúng ta cũng có thể có một quan hệ khác gọi là background bao gồm một cặp có dạng (photo1.gif, White_House). • F có thể chứa các liên kết kết hợp 2 trạng thái chẳng hạn như liên kết có trước, nếu chúng ta có 2 bức ảnh (photo1.gif, photo2.gif) mà giữa chúng tồn tại liên kết có trước thì khi đó có nghĩa là bức ảnh 1 được chụp trước bức ảnh 2 và tiếp tục như vậy[18]. Để nắm rõ hơn, chúng ta xem xét một số ví dụ áp dụng trên một số loại đối tượng media sau 2.4.1 Dữ liệu ảnh như là một tóm tắt media. Giả sử chúng ta xem một CSDL hình ảnh đơn giản gồm có 7 bức ảnh, CSDL này sẽ tương ứng với media trừu tượng sau: 34 • Tập các trạng thái bao gồm (pic1.gif,……….,pic7.gif). • Tập các đặc trưng bao gồm tên của các đối tượng xuất hiện trong các bức ảnh tương ứng là Bob, Jim, Bill, Charlic và Ed. • Ánh xạ thu gọn λ cho chúng ta biết với mỗi trạng thái có những đặc trưng nào xuất hiện trong nó. Bảng sau sẽ mô tả cho vấn đề này Trạng thái Đặc trưng Pic1.gif Bob.Jim Pic2.gif Jim Pic3.gif Bob Pic4.gif Bill Pic5.gif Charlie Pic6.gif Ed, Bill Pic7.gif Ed Bảng 2.1: Liên hệ giữa đặc trưng và trạng thái cho hình ảnh Một điểm cần chú ý ở đây là chúng ta dùng bảng trên để mô tả cho λ nhưng cách thức chỉ số hoá mà chúng ta sử dụng có thể khác đi. • Tập các quan hệ chỉ chứa 2 quan hệ: một quan hệ phụ thuộc vào trạng thái gọi là left_of và một quan hệ không phụ thuộc vào trạng thái gọi là father. • Tập các quan hệ nội tại có thể trống 2.4.2 Dữ liệu video như là một tóm tắt media. • Tập các trạng thái bao gồm 5 frames video từ frame 1 đến frame 5. • Tập các đặc trưng bao gồm Jane Shady, Denis Dopeman, ngôi nhà của Dopeman và chiếc valy. 35 • Ánh xạ rút gọn λ được mô tả ở bảng sau State Feature Frame1 Dopemanhouse,briefcase,JaneShady Frame2 Dopemanhouse,briefcase,JaneShady,DenisDopeman Frame3 Dopemanhouse,briefcase,JaneShady,DenisDopeman Frame4 Dopemanhouse_briefcase,JaneShady,DenisDopeman Frame5 Dopemanhouse,JaneShady Bảng 2.2: Liên hệ giữa đặc trưng và trạng thái cho video Cũng giống như trường hợp áp dụng đối với CSDL hình ảnh, định dạng cụ thể của ánh xạ λ có thể khác đi để tối ưu hoá cho quá trình chỉ số hoá và khai thác. • Chúng ta có thể có một số quan hệ phụ thuộc vào trạng thái sau: o Quan hệ có (have) là một quan hệ phụ thuộc vào trạng thái xác định chiếc valy (đối tượng) xuất hiện cùng với nhân vật nào ở trong trạng thái nào? Quan hệ này có được mô tả như sau: Person Object State JaneShady Briefcase 1 JaneShady briefcase 2 JaneShady briefcase 3 DenisDopeman briefcase 4 Bảng 2.3: Quan hệ Have o Quan hệ vợ chồng (spouse) là một quan hệ phụ thuộc vào trạng thái chỉ ra tên vợ (hoặc chồng) của một đối tượng nào đó. Quan hệ này có thể được mô tả như sau 36 Person Spouse JaneShady PeterShady JaneShady PeterShady DenisDopeman DebraDopewoman Bảng 2.4: Quan hệ vợ- chồng • Ở đây có thể chỉ có một quan hệ nội tại của trạng thái gọi là before (s1,s2) chỉ ra rằng trạng thái s1 có trước trạng thái s2. Cũng tương tự như trên, chúng ta có thể dễ dàng thấy rằng các kiểu media khác nhau chằng hạn như dữ liệu âm thanh hoặc dữ liệu văn bản có thể được mô tả như là một trường hợp của kiểu media tóm tắt tổng quát. Với cấu trúc đơn giản đề cập ở trên, một CSDL Multimedia là một tập bao gồm các media tóm tắt. 2.4.3 Định nghĩa về một CSDL Multimedia đơn giản Một CSDL Multimedia đơn giản là một tập hữu hạn M của các media tóm tắt. Ví dụ, một CSDL Multimedia đơn giản có thể chứa tệp vidoe video1.mpg và một tệp ảnh photo1.gif, trong trường hợp này CSDL có chứa hai trường hợp của media tóm tắt. Tuy nhiên một CSDL Multimedia đơn giản tỏ ra quá đơn giản và kém hiệu quả nếu xét thêm một số khía cạnh. Ví dụ, một media tóm tắt có thể liệt kê “nhà thờ” là một đặc trưng, tuy nhiên khi chúng ta tìm kiếm với đặc trưng là “thánh đường” thì có thể sẽ không tìm thấy nhà thờ đó vì hệ thống không thể hiểu được rằng nhà thờ và thành đường là tương tự nhau. Các hạn chế về mặt từ đồng nghĩa này cũng thường rất hay xẩy ra đối với CSDL văn bản. Một vấn đề nữa mà chúng ta cũng cần phải quan tâm là người dùng thường hay tìm kiếm các đối tượng có chứa một hoặc nhiều các đặc trưng khác nhau và một thực tế là mặc dù sau một số lần chỉnh sửa lại câu hỏi của mình một 37 cách hoàn chỉnh thì các kết quả trả về tương ứng với câu hỏi vẫn chưa chính xác với những gì người dùng thực sự mong muốn, điều này được thể hiện rõ nhất trong trường hợp chúng ta tìm kiến trên web sử dụng các công cụ tìm kiếm như Google hoặc AltaVista. Ngược lại, ở đây cũng tồn tại các trường hợp khi người dùng muốn mở rộng khả năng tìm kiếm (tìm kiếm một cách chính xác hơn bằng cách khai bào câu hỏi rõ ràng hơn) thì có thể sẽ không thu được kết quả nào, trong khi đó nếu đơn giản hoá bớt câu hỏi thì lại tìm được các thông tin mình mong muốn. Cuối cùng, khi người dùng đưa ra câu hỏi có dạng “ hãy tìm tất cả các hình ảnh mà Jane Shady và Denis Dopeman có mặt tại địa điểm A”, nếu kết quả tìm kiếm trả về là trống thì người dùng có thể suy nghĩ là “địa điểm A có thể tương tự như địa điểm B” và sửa lại câu hỏi bằng cách thay thê việc tìm kiếm tại địa điểm A bằng việc tìm kiếm tại địa điểm B, điều này dẫn đến việc chỉnh sửa lại câu hỏi bằng cách thay thế một hằng số cụ thể này bằng một hằng số khác. Các ví dụ trên đưa đến việc thúc đẩy việc tìm ra một cấu trúc khác để xác định CSDL Multimedia hỗ trợ được các vấn dề về ngữ nghĩa cũng như kế thừa được mối quan hệ giữa các đặc trưng. 2.4.4 Định nghĩa về một CSDL Multimedia có cấu trúc Một CSDL Multimedia có cấu trúc là một tập gồm có 5 thuộc tinh ({M1,…..,Mn),≡,≤,inh,subst) trong đó: • là một media tóm tắt. • ≡ là một quan hệ tương đưong trên . • ≤ là một thứ tự bộ phận trên tập của các lớp tương đương trên F. 38 • inh: giả sử cho biết Như vậy inh là một ánh xạ kết hợp với mỗi đặc trưng f một tập các đặc trưng “bên dưới f y theo ≤ thứ tự trên đặc trưng. • Subst là một ánh xạ từ đến Để hiểu rõ hơn, chúng ta xem xét ví dụ sau: Một CSDL Multimedia có chứa 3 loại media trừu tượng là hình ảnh, âm thanh và video được liệt kê dưới đây Media Object Part_frame Feature_s) image Photo1.gif _ Church,durnstein,danube,subrahmanian image Photo2.gif _ Cathedral,melk,subrahmanian image Photo3.gif _ Church,st.paul,rome Video Video1.mpg 1-5 Church,durnstein,stream Video Video1.mpg 6-10 stream Audio Audio1.wav 1-20 St.peters,tiber,rome Bảng 2.5 • Tập các đặc trưng F có chứa: church, durnstein, danube, subrahmanian, cathedral, melk, st. paul. Rome. Stream. Restaurant, st.peters, tiber. • ≡ cho biết : o Church ≡ cathedral. o River ≡ Stream 39 • Quan hệ ≤ cho biết Hình 2.4 Có nghĩa là [tiber] ≤ [river], [danube] ≤ [river]. [st.paul] ≤ [church], [st.peter] ≤ [church]. Cách định nghĩa trên tuy cung cấp đầy đủ hơn các thông tin hữu ích cho việc tìm kiếm và trình bầy cấu trúc đơn giản của một hệ CSDL Multimedia có cấu trúc nhưng nó vẫn chưa cung cấp được một cấu trúc chỉ số hoá mà hệ thống CSDL Multimedia dùng để tổ chức và lưu trữ dữ liệu. Trước khi đưa ra một cấu trúc chỉ số hoá thích hợp, chúng ta sẽ được ra một ngôn ngữ truy vấn đơn giản dùng để truy vấn dữ liệu Multimedia. Ở đây chúng ta trình bầy ngôn ngữ truy vấn trước vì chúng ta chỉ có được một cấu trúc chỉ số hoá có hiệu quả khi mà chúng ta đã tối ưu được các kiểu truy vấn mà người sử dụng mong muốn . 2.4 Ngôn ngữ truy vấn khai thác dư liệu multimedia Trong phần này, chúng ta sẽ trình bầy một ngôn ngữ truy vấn đơn giản được xây dựng dựa trên SQL dùng để khai thác dữ liệu Multimedia. Chúng ta đã chỉ ra được rằng một media tóm tắt có thể được dùng để mô tả các loại dữ liệu media khác nhau sử dụng kiến trúc mô tả đồng nhất. Việc mở rộng ngôn ngữ truy vấn SQL sử dụng cho việc truy vấn dữ liệu được xây dựng bởi kiến trúc mô tả đồng nhất sẽ là tiền đề để chúng ta tiếp tục mở rộng ngôn ngữ truy vấn dùng cho việc khai thác các dữ liệu media được xây dụng theo kiến trúc lai ghép 40 2.4.1 Truy vấn SMDSs (mô tả đồng nhất) Các hàm cơ bản của SMDSs bao gồm: • FindType(Obj): hàm này sử dụng đối tượng media Obj làm đầu vào và sẽ trả về kiểu của đối tượng, ví dụ: o FindType(image1.gif) = gif. o FindType(movie1.mpg) = mpg. • FindObjWithFeature(f): hàm này sử dụng đặc trưng f là giá trị đầu vào và trả về một tập tất cả các loại đối tượng media mà có chứa đặc trưng f, ví dụ o . o • FindObjWithFeatureAttr(f,a,v): hàm này sử dụng đặc trưng f, một thuộc tính tên a kết hợp với đặc trưng này và một giá trị v là đầu vào. Giá trị trả về sẽ là tất cả các đối tượng o có chứa đặc trưng và giá trị của thuộc tính a trong đối tượng o là v. Ví dụ: o : câu hỏi này đòi hỏi tìm tất cả các đối tượng media mà có sự xuất hiện của Jane Shady trong chiếc áo mầu blue. o câu hỏi này đòi hỏi tìm tất cả các đối tượng media mà một con voi có mang một cái nơ mầu đỏ xuất hiện. • FindFeaturesInObj(Obj): câu hỏi này đòi hỏi phải tìm tất cả các đặc trưng có mặt trong một đối tượng media đã cho. Kết quả trả về là một tập bao gồm tất cả các đặc trưng. Ví dụ: o câu hỏi này yêu cầu trả về tất cả các đặc trưng có trong file ảnh im1.gif. 41 o câu hỏi này yêu cầu trả về tất cả các đặc trưng có trong 5 frame đầu tiên của file video video1.mpg. • FindFeatureandAttrinObj(Obj): hàm này cũng có chức năng tương tự như hàm trước ngoại trừ việc nó trả về một quan hệ có schema như sau: (Feature, Attribute,Value) trong đó cặp 3 (f,a,v) xuất hiện trong quan hệ đầu ra nếu thuộc tính a của đặc trưng f được xác định và có giá trị là v. Ví dụ: o có thể trả về kết quả được mô tả ở bảng sau Feature Attribute Value John age 32 John address 32 PicoLane.Mclean.VA 22050. Mary age 46 Mary address 16 ShawRoad.Dumfries.VA 2290s. Mary employer XYZCorp. Mary boss David Bảng 2.6 SMDS-SQL mở rộng của chúng ta sẽ bao gồm tất cả các câu lệnh chuẩn của SQL có bổ sung thêm một số đặc trưng của dữ liệu Multimedia vào SQL (bổ sung thêm vào Select, From, Where) • Tuyên bố Select có thể chứa thực thể media. Một thực thể media được định nghĩa như sau: o Nếu m là một đối tượng media liên tục, i và j là 2 số nguyên khi đó m : [i,j] là một thực thể media thể hiện một tập tất cả các frame của đối tượng media m nằm trong (và chỉ trong) khoảng i và j. o Nếu m không phải là một đối tượng media liên tục thì khi đó m là một thực thể media. 42 o Nếu m là một thực thể media và a là một thuộc tính của m thì khi dó m.a là một thực thể media. • Tuyên bố From có thể có các thực thể theo mẫu sau: (media) (source) (M), có nghĩa là chỉ có các đối tượng media kết hợp với tên của kiểu media và tên của dữ liệu nguồn được xem xét dến khi thực hiện câu hỏi và M là một biến được xếp loại trên các đối tượng media đó. • Tuyên bố Where cho phép có các biểu thức có dạng term In func.call. Trong đó: o Term có thể là một biến (trong trường hợp này được sắp xếp trên kiểu trả về của func.call) hoặc là một đối tượng có kiểu đầu ra giống như func.call. o Func.call kà một trong 5 hàm đã nêu ra ở trên. Chúng ta cũng xem xét một vài ví dụ • Tìm tất cả các đối tượng ảnh hoặc video có chứa cả Jane Shady và Denis Dopeman. SELECT M Select M FROM smds source M WHERE (FindType(M)= Video OR FindType(M)=Image AND M IN FindObjWithFeatureand(Jane Shady) And M IN FindObjWithFeatureand(Denis Dopeman) • Tìm tất cả các ảnh và video mà đối tượng Jane Shady mặc áo vét mầu tím SELECT M FROM smds source M WHERE FindType(M)=Video OR FindType(M)=Image AND M IN FindObjWithFeatureandAttr(Jane Shady,suit,purple) • Tìm tất cả các ảnh có chứa cả Jane Shady và Denis Dopeman và Jane đứng bên trái Denis 43 SELECT M FROM smds source M WHERE FindType(M)=Image AND M IN FindObjWithFeature(Denis Dopeman) AND M IN FindObjWithFeature(Jane Shady) AND Left (jane Shady,Denis Dopeman.M) Ở đây có một chú ý là quan hệ left được sử dụng ở trên là một quan hệ media tóm tắt của CSDL hình ảnh • Tìm tất cả các ảnh có Jane Shady cùng với đối tượng xuất hiện trong đoạn Video cùng với Denis Hopeman. Khác với câu hỏi trước, câu hỏi này đòi hỏi phải có các thao tác kết hợp giữa các loại dữ liệu khác nhau. Để thực hiện được câu hỏi này, chúng ta phải sử dụng các biến mở rộng như là Person, biến này được dùng để tham chiếu đến đối tượng chưa xác định được danh tính trong đoạn băng video. 2.4.2 Truy vấn dữ liệu multimedia mô tả dưới kiến trúc lai tạo. Trong phần trước, chúng ta đã trình bày ngôn ngữ SMDS-SQL như là một mô hình để truy vấn các dối tượng Multimedia lưu trữ trong kiến trúc thổng nhất. Trong kiến trúc 44 đồng nhất, tất cả các dữ liệu nguồn được truy vấn đều là SMDSs, trong khi trong kiến trúc lai tạo các cách thức mô tả khác (non-SMDS) cũng được sử dụng. Cách thức mô tả dữ liệu kiểu lai tạo thường có hai phần chính: • Một tập các đối tượng media được mô tả dưới dạng đồng nhất. • Một tập các kiểu media khác nhau mà có cấu trúc để truy nhập và truy vấn riêng. Để mở rộng ngôn ngữ truy vấn SMDS-SQL thành ngôn ngữ có thể truy vấn được các dữ liệu được mô tả dưới dạng lai tạo (HM-SQL) các yêu cầu sau bắt buộc phải có: • HM-SQL phải có khả năng thực hiện tất cả các câu hỏi sử dụng ngôn ngữ riêng đối với nguồn dữ liệu không đồng nhất này. • HM-SQL phải có cơ chế “joins” hoặc các thao tác đại số nhị phân có trách nhiệm “joins” giữa 2 nguồn dữ liệu SMDS và non-SMDS. Ngôn ngữ HM-SQL cũng tương tự như ngôn ngữ SQL chuẩn ngoại trừ các mệnh đề Select, From. Where được mở rộng như sau: • Mệnh đề SELECT và WHERE được mở rộng giống như với ngôn ngữ SMDS- SQL. • Tuyên bố Where cho phép sự có mặt của biểu thức có dạng Term IN MS : func_call trong đó: o Term:có thể là một biến hoặc là một đối tượng có kiểu đầu ra giống hệt với của func_call đã được định nghĩa trong media gốc và . o Nếu MS=SMDS hoặc họ func_call thuộc 1 trong 5 hàm đã đinh nghĩa ở trên hoặc o MS không phải là một nguồn SDMS và func_call là một câu hỏi trong QL(MS). • Khi đó có 2 sự khác nhau giữa SMDS-SQL và HM-SQL là: o func_call xuất hiện trong mệnh đề where cần được chú thích một cách tường minh với media gốc kèm theo và 45 o Các câu hỏi được xây dựng từ các ngôn ngữ hỏi đáp của từng loại dữ liệu non-SMDS có thể được nhúng vào bên trong câu lệnh truy vấn của HM- SQL. Điều này làm cho HM_SQL trở nên hết sức mạnh mẽ và linh hoạt. Căn cứ vào điều này chúng ta có thể thực thi các câu hỏi đối với các nguồn dữ liệu khác nhau. Xét một số ví dụ sau: • Giả sử chúng ta có 2 nguồn dữ liệu video video1 và video2, nguồn video1 được triển khai qua hình thức SDMS, nguồn video2 được triển khai qua hình thức non-SDMS (gọi là videob). Câu hỏi của chúng ta ở đây là “hãy tìm tất cả các video clip có mặt Denis Hopeman từ cả 2 nguồn dữ liệu video1 và video2. Câu hỏi này có thể được diễn đạt bằng ngôn ngữ HM-SQL như sau: Trong câu hỏi này, chúng ta tìm kiếm tất cả các Ms mà chúng trả về kết quả mong muốn từ cả 2 nguồn dữ liệu (SDMS và non-SDMS). • Cũng với câu hỏi trên nhưng ở đây chúng ta thêm vào một nguồn dữ liệu mới là dữ liệu hình ảnh (idb) được triền khai dưới hình thức non-SDMS và giả sử dữ liệu hình ảnh này có riêng chức năng tìm kiếm getpic(obj) với tham số đầu vào là obj và kết quả trả về là một cặp bao gồm một ảnh (file ảnh) và thứ tự có liên quan. Giả sử chúng ta muốn tìm kiếm trên cả 3 loại dữ liệu này (video1, video2, idb) có mặt của đối tượng Denis Hopeman thì câu hỏi diễn đạt bằng ngôn ngữ HM-SQL có thể như sau: Select M From sdms Video1, vi•eob Video2 46 Where M IN sdms: FindObjWithFeature(Denis Hopeman) OR M IN videodb: FindVideoWithObj(Denis Dopeman) UNION (Select M.file From imagedb idb M Where M In imagedb:getpic(Denis Dopeman) • Giả sử chúng ta muốn tìm tất cả các đối tượng có mặt cùng với Denis Dopeman trong tất cả các nguồn dữ liệu (video1, video2, idb), câu hỏi sẽ như sau 2.4.3 Chỉ số hoá SMDS với chỉ số đảo. Trong các phần trước, chúng ta đã trình bầy các cách thức để truy vấn CSDL multimedia dưới cả 2 hình thức mô tả là đồng nhất và lai tạo. Các nguồn dữ liệu non- SMDS được chỉ số hoá bởi các cơ chế riêng của chúng, ở đây chúng ta đi sâu vào tìm hiểu cách thức chỉ số hoá đối với các nguồn dữ liệu SDMS. Giả sử chúng ta có trước một SMDS có dạng: 47 trong đó Chúng ta phải chỉ ra được một cách thức chỉ số hoá có hiệu quả dữ liệu này, ý tưởng cơ bản ở đây là: • Featuretable: đây là một bảng băm có chứa tất cả các đặc trưng có trong . Mỗi bảng băm ở vị trí I có chứa một đại diện featurenodes được băm đến vị trí i. • Statetable: là một bảng băm chưa tất cả các trạng thái thuộc . Cũng giống như featuretable, statetable cũng chứa một đại diện của statenotes được băm đến vị trí xác định. • Featurenodes: mỗi featurenodes bao gồm các thành phần sau: o Tên của đặc trưng (ví dụ “Denis Dopeman”). o Một danh sách các nút con (nếu f1 và f2 là các đặc trưng trong chúng ta nói rằng f2 là con của f1 nếu f2≤f1 và không có một đặc trưng f3 khác ( ) mà f2<f3<f1. o Một danh sách con trỏ trỏ tới statenodes có chứa các đặc trưng liên quan (ví dụ trong trường hợp CSDL hình ảnh nó có thể là một con trỏ trỏ đến node kết hợp với hình ảnh có chứa đặc trưng được nêu ra trong câu hỏi (VD “Denis Hopeman”). o Một tập các con trỏ trỏ đến featurenodes khác thích hợp để thay thế cho featurenodes trong câu hỏi. • Statenodes: Một statenodes chỉ chứa 2 thành phần bao gồm: o Một con trỏ trỏ đến file có chứa đối tượng media (hình ảnh, video, audio ) mà trạng thái được quy đến trong câu hỏi. 48 o Một danh sách các mối quan hệ mà thành viên của nó trỏ đến featurenodes, bằng trực giác chúng ta có thể thấy được là có một con trỏ trỏ đến featurenodes f nếu đặc trưng có trong câu hỏi ở trạng thái đó. Cấu trúc dữ liệu của SMDS được mô tả như sau: Type featurenode = record of name: String ;/* Tên của đặc trưng */ children: ^ node1; /* trỏ đến danh sách các on trỏ trỏ đến nodes con */ statelist: ^ node2 ;/* trỏ đến danh sách các on trỏ trỏ đến các trạng thái có chứa đặc trưng này */ replacelít: ^ node3; /* trỏ đến một danh sách bao gồm các con cháu kết hợp với các trạng thái có thể cho là có đặc trưng kết hợp với node đó */ end record; type node1 = record of element: ^ featurenode; /* trỏ đến node con của một featurenode */ next: ^ node1; /* trỏ đến nodé con tiếp theo */ end record; type node2 = record of state: ^ statenode; /* trỏ đến danh sách kết hợp với trạng thái */ link: ^ node2; /* node tiếp theo */ end record; type node3 = record of feat: ^ featurenode; /* trỏ đến một node mà có thể cho là có đặc trưng kết hợp với node hiện thời */ link1: ^ node3; end record; 49 type statenode = record of rep: framerep; flist: ^ node4; end record; type node4 = record of f: ^ featurenode; link2: ^ node4; end record; Hình 2.5: Ví dụ về statetable 50 Chúng ta hãy xem xét một ví dụ của SDMS bao gồm 3 media trừu tượng bào gồm : dữ liệu ảnh, video và âm thanh (audio) có nội dung như sau Media trừu tượng Trạng thái Các đặc trưng Img Im1 Im2 Im3 john, mary john, mary, lizt lizt, mary Video Vid1: [1,10] Vid1: [11,20] Vid1: [21,40] Vid2: [1,20] Vid2: [21,30] john, singing john, mary, dancing john, mary, lizt, singing, dancing ed, speaking man, speaking Audio Disk1: [1,20] Disk1: [21,40] John, singing woman, speaking Bảng 2.7 • Hình 2.5 cho chúng ta thấy một ví dụ về statetable (để đơn giản chúng ta không đề cập đến các hàm băm được sử dụng) ví dụ về một featuretable. Một trong 10 trạng thái liệt kê ở trên được lưu trữ trong statetable cùng với 9 đặc trưng. Trong trường hợp này phải chú ý là “singing” và “dancing” được xem như là các đặc trưng. • Thứ tự ≤ trên các đặc trưng được thể hiện ở hình dưới Hình 2.6 • Chúng ta đã chỉ ra được sự kết hợp của featurelist với các trạng thái im1 và disk1: [1,20], các featurelist khác không được thể hiện ra ở đây nhằm mục đích đơn giản hoá. 51 • Tương tự như vậy chúng ta chỉ ra statelist kết hợp với các đặc trưng man và lizt. • Mối liên hệ kết hợp giữa các media trừu tượng này có thể lưu trữ trong một CSDL quan hệ chuẩn. 52 CHƯƠNG 3 HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯONG TIỆN – YÊU CẦU VÀ CÁC VẤN ĐỀ Trung tâm của một hệ thống thông tin multimedia chính là hệ quản trị CSDL MULTIMEDIA (MDBMS). Theo truyền thống, một CSDL bao gồm một bộ các dữ có liên quan về một thực thể cho trước hoặc một hệ quản trị CSDL (DBMS) là một bộ các dữ liệu có liên quan đến nhau với một tập hợp các chương trình được dùng để khai báo, tạo lập, lưu trữ, truy cập và truy vấn CSDL. Tương tự như vậy, chúng ta có thể xem một CSDL MULTIMEDIA là một tập các loại dữ liệu multimedia như văn bản, hình ảnh, video, âm thanh, các đối tượng đồ hoạ….Một hệ quản trị CSDL MULTIMEDIA (MDBMS) cung cấp hỗ trợ cho các loại dữ liệu MULTIMEDIA trong việc tạo lập, lưu trữ, truy cập, truy vấn và kiểm soát. Sự khác nhau của các kiểu dữ liệu trong CSDL MULTIMEDIA có thể đòi hỏi các phương thức đặc biệt để tối ưu hoá việc lưu trữ, truy cập, chỉ số hoá và khai thác. MDBMS cần phải cung cấp các yêu cầu đặc biệt này bằng cách cung cấp các cơ chế tóm tắt bậc cao để quản lý các kiểu dữ liệu khác nhau cũng như các giao diện thích hợp để thể hiện chúng. 3.1 Mục đích của MDBMS Một MDBMS cung cấp một môi trường thích hợp để sử dụng và quản lý các thông tin CSDL MULTIMEDIA. Vì vậy, nó phải hỗ trợ các kiểu dữ liệu MULTIMEDIA khác nhau bên cạnh việc phải cung cấp đầy đủ các chức năng của một DBMS truyền thống như khai báo và tạo lập CSDL, khai thác dữ liệu, truy cập và tổ chức dữ liệu, độc lập dữ liệu, tính riêng, toàn vẹn dữ liệu, kiểm soát phiên bản. Các chức năng của MDBMS cơ bản tương tự như các chức năng của DBMS, tuy nhiên, bản chất của thông tin 53 MULTIMEDIA tạo ra các đòi hỏi mới. Bằng cách sử dụng các chức năng tổng quát của DBMS chúng ta có thể trình bầy mục đích của MDBMS như sau[1]: • Sự thống nhất: bảo đảm rằng một dữ liệu không phải tạo lại khi các chương trình khác nhau đòi hỏi dữ liệu đó. • Độc lập dữ liệu: Đảm bảo sự tách rời giữa CSDL và các chức năng quản trị từ các chương trình ứng dụng. • Điều khiển nhất quán: đảm bảo sự toàn vẹn của CSDL MULTIMEDIA thông qua các quy tắc dược áp dụng trên các giao dịch đồng thời. • Sự tồn tại: bảo đảm các đối tượng dữ liệu tồn tại qua các giao dịch khác nhau cũng như các yêu cầu của chương trình. • Tính riêng: ngăn chặn các truy cập và sửa chữa các dữ liệu được lưu trữ một cách trái phép. • Kiểm soát sự toàn vẹn; bảo đảm sự toàn vẹn của CSDL một giao dịch này sang một giao dịch khác thông qua việc áp đặt các ràng buộc. • Khả năng phục hồi: phải có các phương thức cần thiết để đảm bảo rằng kết quả của các giao dịch thất bại không làm ảnh hưởng đến dữ liệu lưu trữ. • Hỗ trợ truy vấn: bảo đảm các cơ chế truy vấn phù hợp với dữ liệu MULTIMEDIA. • Kiểm soát phiên bản: tổ chức và quản lý các phiên bản khác nhau của các đối tượng lưu trữ có thể được yêu cầu bởi các ứng dụng. 54 Hình3.1: Kiến trúc bậc cao cho một MDBMS đáp ứng các yêu cầu cho dữ liệu MULTIMEDIA Đối với việc điều khiển nhất quán, một giao dịch là một chuỗi các hướng dẫn được thực thi một cách hoàn toàn hoặc không hoàn toàn, đối với trường hợp không hoàn toàn CSDL sẽ được khôi phục lại trạng thái trước đó, việc đưa ra được một cơ chế tương ứng đảm bảo cho việc nhất quán là một vấn đề khó khăn đối với CSDL MULTIMEDIA. Các CSDL quan hệ truyền thống sử dụng một bản ghi hoặc một bảng duy nhất như là một đơn vị nhất quán. CSDL MULTIMEDIA thường sử dụng một đối tượng đơn lẻ (hoặc đối tượng ghép) như là một đơn vị logic của truy cập. Như vậy một đối tượng MULTIMEDIA đơn lẻ có thể tạo thành đơn vị nhất quán[14]. Đối với vấn đề lưu trữ, một phương thức đơn giản là lưu trữ các tệp MULTIMEDIA trong các tệp tương ứng của hệ điều hành. Tuy nhiên với đặc thù là dung lượng lớn, các dữ liệu MULTIMEDIA là cho chi phí triển khai theo cách thức này trở nên tốn kém. Hơn nữa, hệ thống cũng cần phải lưu trữ các metadata MULTIMEDIA và có thể cả các đối tượng MULTIMEDIA tổng hợp. Vì vậy, hầu hết các MDBMS phân loại thành 2 phần là cố đ

Các file đính kèm theo tài liệu này:

  • pdfCo-So-Du-Lieu-Da-Phuong-TienYeu-Cau-Va-Cac-Van-De.pdf