Luận văn Xử lý ngữ nghĩa trong hệ dịch tự động Anh-Việt trong các tài liệu tin học
MụcLục Lời Nói Đầu . i Mục Lục . ii Danh Sách Hình . vii Danh Sách Bảng Biểu . viii Chương 1 TỔNG QUAN .1 1.1. SƠLƯỢC VỀDỊCH MÁY . 2 1.1.1. Lịch sửcủa Dịch Máy .2 1.1.2. Khái niệm vềDịch Máy .6 1.1.3. Các bước xửlý trong một hệDịch Máy .7 1.2. XỬLÝ NGỮNGHĨA TRONG DỊCH MÁY . 10 1.2.1. Vai trò và chức năng của xửlý ngữnghĩa .10 1.2.2. Các mức độnhập nhằng trong tầng xửlý ngữnghĩa .12 1.2.2.1. Nhập nhằng ởmức từvựng.12 1.2.2.2. Mức độnhập nhằng cấu trúc.12 1.2.2.3. Mức độnhập nhằng liên câu .13 1.2.2.4. Mức độnhập nhằng theo thểloại văn bản .14 1.2.3. Các khó khăn trong xửlý ngữnghĩa.15 1.2.3.1. Nhập nhằng nghĩa .15 1.2.3.2. Phụthuộc vào ngữcảnh .15 1.2.3.3. Phụthuộc vào tri thức .15 1.2.3.4. Sựkhác biệt giữa tiếng Anh và Việt .16 1.2.3.5. Yếu tốkhác .16 1.3. CÁC CÁCH TIẾP CẬN TRONG XỬLÝ NGỮNGHĨA VÀ CÁC CÔNG TRÌNH TRƯỚC ĐÂY . 17 1.3.1. Xửlý ngữnghĩa trong thời gian đầu .17 1.3.2. Dựa trên trí tuệnhân tạo .18 1.3.3. Dựa trên cơsởtri thức .20 1.3.3.1. Từ điển máy .20 1.3.3.2. Từ điển đồng nghĩa .22 1.3.3.3. Từ điển điện toán .23 1.3.4. Dựa trên ngữliệu .24 Chương 2 CƠSỞLÝ THUYẾT.27 2.1. CƠSỞLÝ THUYẾT VỀNGÔN NGỮHỌC . 28 2.1.1. Nghĩa của từ.28 2.1.1.1. Cơcấu nghĩa của từ.29 2.1.1.2. Phân tích nghĩa của từ.29 2.1.1.3. Nghĩa của từtrong hoạt động ngôn ngữ.30 2.1.2. Quan hệ đồng nghĩa và trái nghĩa trong từvựng .30 2.1.2.1. Từ đồng nghĩa .30 2.1.2.2. Từtrái nghĩa.31 2.1.3. Biến đổi trong từvựng .31 2.1.3.1. Những biến đổi bềmặt.31 2.1.3.2. Những biến đổi trong chiều sâu của từvựng .32 2.2. HỌC DỰA TRÊN CHUYỂN ĐỔI. 32 2.2.1. Học dựa trên chuyển đổi là gì ? .32 2.2.2. Giải thuật học dựa trên chuyển đổi tổng quát .33 2.2.3. Mô tảvềtrình tựtạo luật chuyển đổi .35 2.2.4. Yêu cầu trong việc áp dụng thuật toán học dựa trên chuyển đổi vào xửlý ngữnghĩa.37 2.2.5. Nhận xét .38 2.3. MỘT SỐGIẢI THUẬT HỌC DỰA TRÊN CHUYỂNĐỔI CẢI TIẾN. 39 2.3.1. Lazy TBL .39 2.3.2. TBL đa chiều.40 2.3.3. TBL nhanh .40 2.4. THUẬT TOÁN FAST-TBL. 41 2.4.1. Quy ước.41 2.4.2. Phát sinh luật .42 2.4.2.1. Trường hợp 1 .43 2.4.2.2. Trường hợp 2 .44 2.5. VĂN PHẠM PHỤTHUỘC . 46 2.5.1. Giới thiệu .46 2.5.2. Vận dụng văn phạm phụthuộc vào xửlý ngữnghĩa .49 2.5.3. Các loại quan hệtrong bộphân tích cú pháp dựa trên văn phạm phụthuộc .50 Chương 3 MÔ HÌNH CÀIĐẶT .53 3.1. CÁC NGUỒN TRI THỨC ĐỂXỬLÝ NGỮNGHĨA . 54 3.1.1. Tri thức vềtừloại và hình thái.54 3.1.2. Tri thức vềngôn từ.56 3.1.3. Tri thức vềquan hệcú pháp và ràng buộc ngữnghĩa .57 3.1.4. Tri thức vềchủ đề.58 3.1.5. Tri thức vềtần suất nghĩa của từ.59 3.2. CÁC BƯỚC THỰC HIỆN . 59 3.3. MÔ HÌNH HUẤN LUYỆN CHO BỘGÁN NHÃN NGỮNGHĨA. 61 3.4. HỆTHỐNG NHÃN NGỮNGHĨA . 62 3.4.1. Yêu cầu đối với hệthống nhãn ngữnghĩa .62 3.4.2. Cơsởcủa việc phân lớp ngữnghĩa.63 3.4.3. Nhận xét các hệthống nhãn ngữnghĩa có liên quan .64 3.5. CHUẨN BỊNGỮLIỆU HUẤN LUYỆN. 66 3.5.1. Giới thiệu kho ngữliệu song ngữAnh-Việt VCLEVC .66 3.5.2. Rút trích thống kê từngữliệu song ngữ.68 3.5.2.1. Thống kê các nghĩa tiếng Việt .68 3.5.2.2. Thống kê tần sốxuất hiện một nghĩa của từtiếng Anh .69 3.5.2.3. Ý nghĩa .70 3.5.3. Xây dựng ngữliệu huấn luyện .70 3.5.3.1. Gán nhãn ngữnghĩa bán tự động cho ngữliệu .71 3.5.3.2. Xây dựng “ngữliệu vàng” .72 Chương 4 CÀI ĐẶT THỬNGHIỆM.75 4.1. GÁN NHÃN CƠSỞ. 76 4.1.1. Mô hình gán nhãn cơsở.76 4.1.2. Xửlý ngôn từ, thành ngữ.78 4.1.3. Xửlý ràng buộc lựa chọn.79 4.1.3.1. Cơsởtri thức.79 4.1.3.2. Thuật toán .79 4.1.4. Xửlý dựa trên lĩnh vực xem xét .81 4.1.5. Xửlý dựa trên tần sốxuất hiện .82 4.2. MẪU LUẬT . 82 4.2.1. Các từtrong ngữcảnh .83 4.2.2. Từgốc trong ngữcảnh .83 4.2.3. Từloại trong ngữcảnh.83 4.2.4. Nhãn ngữnghĩa trong ngữcảnh.83 4.2.5. Từcó quan hệngữpháp trong ngữcảnh .84 4.2.6. Các nhãn trong ngữcảnh có quan hệngữpháp .84 4.3. GẮN NGHĨA TIẾNG VIỆT . 84 4.3.1. Các từkhông cần gắn nghĩa tiếng Việt .85 4.3.2. Gắn thêm lượng từNhững .86 4.3.2.1. Mô tả.86 4.3.2.2. Ngữliệu và mẫu luật .87 4.3.3. Quan hệgiữa động từ“to be” và các trường hợp khác.88 4.3.4. Các trường hợp đi kèm với giới từ.90 4.3.5. Các trường hợp liên quan đến thành ngữ.91 4.4. KẾT QUẢTHỰC HIỆN . 92 4.4.1. Dãy luật tốiưu.92 4.4.2. Dãy luật rút ra đểgiải quyết việc thêm từtrong tiếng Việt .93 4.4.3. Thửnghiệm .93 Chương 5 KẾT LUẬN– HƯỚNG PHÁT TRIỂN.98 5.1. HẠN CHẾVÀ HƯỚNG PHÁT TRIỂN. 99 5.2. KẾT LUẬN . 100 Danh Mục Tài Liệu Tham Khảo .101 PhụLục 1. Danh Sách Nhãn NgữNghĩa CơBản .103 PhụLục 2. Danh Sách Các Nhãn TừLoại.106 PhụLục 3. Trích Một SốLuật .108 PhụLục 4. Các Kết QuảDịch Đạt Được .111 PhụLục 5. Một SốKết QuảDịch ThửNghiệm .123 PhụLục 6. Một SốVí DụSo Sánh .138
Các file đính kèm theo tài liệu này:
- Xử lý ngữ nghĩa trong hệ dịch tự động anh việt trong các tài liệu tin học.pdf