Luận văn Xây dựng hệ thống tìm kiếm thông tin xuyên ngữ Việt Anh
MỤC LỤC MỤC LỤC . 3 DANH MỤC CÁC BẢNG . 5 DANHMỤC CÁC HÌNH VẼ . 6 MỞ ĐẦU . 7 Chương 1: GIỚI THIỆU. 9 1.1 Giới thiệu về tìm kiếm thông tin (Information Retrieval) . 9 1.2 Tìm kiếm thông tin xuyên ngữ (Cross Language Information Retrieval) . 11 1.2.1 Khái niệm . 11 1.2.2 Mô hình chung . 11 1.2.3 Các vấn đề. 12 1.3 Các hướng tiếp cận . 13 1.3.1 Dịch máy. 13 1.3.2 Sử dụng từ điển . 14 1.3.3 Sử dụng ngữ liệu . 15 1.4 Một số công trình nghiên cứu trong và ngoài nước . 16 1.5 Giới thiệu luận văn. 16 Chương 2: CƠ SỞ LÝ THUYẾT. 18 2.1 Giới thiệu về từ điển máy đọc (Machine Readable Dictionary –MRD) . 18 2.1.1 Vai trò của MRD . 18 2.1.2 Sử dụng từ điển . 19 2.2 Các phương pháp khử nhập nhằng . 20 2.2.1 Giới thiệu . 20 2.2.2 Khử nhập nhằng . 20 2.3 Mô hình thống kê . 25 2.3.1 Giới thiệu . 25 2.3.2 Dịch bằng xác suất thống kê . 25 2.3.3 Mô hình ngôn ngữ . 28 2.3.4 Liên kết từ. 28 2.3.5 Mô hình dịch . 29 2.4 Kết luận . 33 Chương 3: CÁC KỸ THUẬT LIÊN QUAN . 34 3.1 Tìm kiếm dựa trên MRD . 34 3.2 Công cụ GIZA++ . 36 3.2.1 Cấu trúc đầu vào của GIZA++ . 36 3.2.2 Cấu trúc đầu ra của GIZA++ . 37 3.2.3 Sử dụng GIZA++ . 37 3.3 Kết luận . 38 Chương 4: CHƯƠNG TRÌNH VÀ KẾT QUẢ THỰC NGHIỆM. 39 4.1 Kiến trúc hệ thống. 39 4.1.1 Từ điển. 40 4.1.2 Thống kê từ ngữ liệu . 41 4.1.3 Chương trình thử nghiệm . 42 4.2 Khai thác ngữ liệu song song . 45 4.3 Kết quả thử nghiệm. 51 4.4 Đánh giá thử nghiệm . 55 4.4.1 Nhận xét việc chuyển ngữ . 55 4.4.2 Đánh giá kết quả thử nghiệm . 57 Chương 5: ĐÁNH GIÁ VÀ HƯỚNG PHÁT TRIỂN. 62 5.1 Đánh giá . 62 5.2 Hướng ứng dụng và phát triển . 62 TÀI LIỆU THAM KHẢO . 65
Các file đính kèm theo tài liệu này:
- 4.pdf
- 0_2.pdf
- 1_2.pdf
- 2_2.pdf
- 3.pdf
- 5_2.pdf
- 6_4.pdf
- 7.pdf
- 8.pdf
- 9.pdf