Luận văn Xây dựng hệ tìm kiếm thông tin theo hướng tiếp cận ngữ nghĩa (Conceptual Indexing)
Mục lục Chương 1. Tổng quan . 7 1.1 Bối cảnh hiện tại. 7 1.2 Mục tiêu, giới hạn và đóng góp của luận văn . 9 1.2.1 Mục tiêu luận văn . 9 1.2.2 Giới hạn luận văn. 10 1.2.3 Đóng góp của luận văn . 10 1.3 Bốcục của báo cáo. 11 Chương 2. Giới thiệu và khảo sát hệthống tìm kiếm thông tin. 13 2.1 Giới thiệu chung vềhệthống tìm kiếm thông tin . 13 2.1.1 Định nghĩa vềhệthống tìm kiếm thông tin . 13 2.1.2 Mục tiêu và chức năng của một hệthống tìm kiếm thông tin. 14 2.1.3 Kiến trúc chung của một hệthống tìm kiếm thông tin . 14 2.1.4 Phân loại hệthống tìm kiếm thông tin . 15 2.1.5 Tiêu chí để đánh giá một hệthống tìm kiếm thông tin . 16 2.2 Hệthống tìm kiếm dựa trên từkhóa . 18 2.2.1 Bộthu thập thông tin – Robot. 19 2.2.2 Bộlập chỉmục – Index . 19 2.2.3 Bộtruy vấn (bộtìm kiếm). 19 2.3 Hệthống tìm kiếm dựa trên khái niệm. 20 2.3.1 Bộthu thập thông tin . 22 2.3.2 Bộlập chỉmục khái niệm . 22 Quy trình chung của rút trích khái niệm . 23 2.3.3 Bộtruy vấn. 24 2.4 Khảo sát hiện trạng. 25 2.4.1 Khảo sát vềcác phương pháp lập chỉmục cho các tài liệu: . 28 2.4.2 Khảo sát vềcác phương pháp mởrộng khái niệm. 33 2.4.3 Khảo sát vềcác phương pháp rút trích khái niệm. 35 2.4.3.1 Rút trích từchỉmục từcác tài liệu . 35 2.4.3.2 So khớp các cụm từchỉmục với nguồn tri thức. 37 2.4.4 So sánh cách biểu diễn tri thức với cách biểu diễn tri thức của hệthống khác . 38 Chương 3. CIRS - Hệthống tìm kiếm thông tin dựa trên khái niệm. 40 3.1 Kiến trúc của CIRS . 40 3.2 Các bộphận cấu thành nên CIRS. 43 3.2.1 Bộlập chỉmục khái niệm . 43 3.2.2 Bộtruy vấn. 46 Chương 4. Các quá trình quan trọng trong CIRS . 48 4.1 Rút trích các khái niệm từtập các tài liệu và câu truy vấn. . 48 4.2 Phân loại tập khái niệm của các tài liệu . 50 4.2.1 Mục tiêu, ý nghĩa, cách tiếp cận của việc phân loại khái niệm . 50 4.2.2 Các thuật ngữ. 52 4.2.2.1 Độdài khái niệm: . 52 4.2.2.2 n-khái niệm, khái niệm ngắn, khái niệm dài, . 53 4.2.3 Quy trình phân loại khái niệm . 54 4.2.3.1 Giai đoạn 1: chuẩn hóa. . 55 4.2.3.2 Giai đoạn 2: loại bỏcác tag . 56 4.2.3.3 Giai đoạn 3: lấy thông tin vềcác khái niệm và vịtrí. 59 4.2.3.4 Giai đoạn 4: tính độdài khái niệm . 61 4.2.3.5 Giai đoạn 5: phân loại khái niệm. 62 4.3 Mởrộng tập khái niệm của các tài liệu và câu truy vấn. 63 4.3.1 Mục đích của việc mởrộng khái niệm. 63 4.3.2 Cách tiếp cận vềmởrộng khái niệm của CIRS . 63 4.3.3 Các mối quan hệ được hệthống CIRS sửdụng đểmởrộng khái niệm. 63 4.3.4 Quy trình mởrộng khái niệm trong hệthống CIRS . 66 4.3.4.1 Giai đoạn 1: rút trích các cặp khái niệm có quan hệvới nhau . 67 4.3.4.2 Giai đoạn 2: mởrộng khái niệm. 67 4.4 Lập chỉmục theo khái niệm trong CIRS. 69 4.4.1 Giai đoạn 1: tạo vector chỉmục . 70 4.4.2 Giai đoạn 2: tạo ma trận nghịch đảo . 72 4.5 So trùng trong CIRS. 73 4.6 Đánh giá hiệu quảcủa CIRS . 75 Chương 5. Nguồn tri thức, cơsởdữliệu và công cụ. 76 5.1 UMLS Metathesaurus . 76 5.1.1 Các thành phần trong UMLS Metathesaurus:. 77 5.1.1.1 Khái niệm: . 77 5.1.1.2 Mối quan hệ. 80 5.1.2 Các ngôn ngữmà UMLS Metathesaurus hỗtrợ. 81 5.1.3 Các tập tin định dạng RRF . 82 5.2 ImageCLEFmed . 86 5.2.1 Tổng quan vềImageCLEFmed. 86 5.2.2 ImageCLEFmed 2007. 87 5.2.2.1 Những bộdữliệu ảnh trong ImageCLEFmed 2007 . 87 5.2.2.2 Kích thước các tập dữliệu trong ImageCLEFmed 2007. 88 5.2.2.3 Hệthống tập tin trong ImageCLEFmed 2007 . 89 5.3 MetaMap . 92 5.3.1 Tổng quan . 92 5.3.2 Quá trình rút trích các khái niệm trong các tài liệu của MetaMap . 92 5.4 XIOTA . 95 5.4.1 Tổng quan vềXIOTA . 95 5.4.2 Hệthống các module trong XIOTA . 96 5.4.2.1 Conversion. 96 5.4.2.2 Indexing . 96 5.4.2.3 Querying . 97 5.4.2.4 Mining . 97 Chương 6. Hiện thực và kết quả. 99 6.1 Một sốmodule trong chương trình . 99 6.2 Thửnghiệm. . 101 6.2.1 Mục tiêu thửnghiệm. 101 6.2.2 Cách thức thửnghiệm . 101 6.3 Kết quảvà phân tích kết quả. 102 6.3.1 Các kết quảthửnghiệm trên từkhóa, các loại khái niệm, các mô hình . 102 6.3.2 Các kết quảthửnghiệm vềmởrộng khái niệm . 107 6.3.2.1 So sánh việc sửdụng các mối quan hệkhác nhau đểmởrộng tài liệu, khi cùng sửdụng một mối quan hệ đểmởrộng câu truy vấn. 108 6.3.2.2 So sánh việc sửdụng các mối quan hệkhác nhau đểmởrộng câu truy vấn, khi cùng sửdụng một mối quan hệ đểmởrộng tài liệu . 114 6.4 So sánh kết quảvới các hệthống khác. 120 6.4.1 So sánh kết quảvới hệthống tìm kiếm thông tin dựa trên từkhóa . 120 6.4.2 So sánh kết quảvới hệthống tìm kiếm dựa trên khái niệm sửdụng mô hình mạng Bayes.121 6.4.3 So sánh kết quảvới hệthống MIRACLE . 122 Chương 7. Kết luận và hướng phát triển . 124 7.1 Kết luận . 124 7.2 Hướng phát triển . 125 Tài liệu tham khảo . 127 Phụlục: Các kết quảcủa Module 8 và 9. 132
Các file đính kèm theo tài liệu này:
- 5.pdf
- 0.pdf
- 1.pdf
- 2pdf.pdf
- 3.pdf
- 4_2.pdf
- 6.pdf
- 7.pdf
- 8.pdf
- 9.pdf
- 10.pdf
- 11.pdf
- 12.pdf
- 13.pdf