Luận văn Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
MỤC LỤC LỜI CẢM ƠN.i MỤC LỤC.ii DANH SÁCH CÁC HÌNH.vii DANH SÁCH CÁC BẢNG.ix GIỚI THIỆU CHUNG.x CHƯƠNG 1 Sơlược vềngữâm tiếng Việt.1 1.1. Ý nghĩa của các nghiêncứu ngữâmtrong nhận dạng tiếng nói Tiếng Việt.1 1.2. Phânloại âm tốtheo cấu âm.1 1.2.1. Định nghĩa âm tố.1 1.2.2. Các âmtốphụâm.2 1.2.2.1. Đặc điểm cấu tạo của phụâm.2 1.2.2.2. Một sốcách phân chia phụâm.2 1.2.2.3. Cấu âmbổsung.4 1.2.3. Các âmtốnguyên âm.4 1.2.3.1. Đặc điểm cấu tạo của nguyên âm.4 1.2.3.2. Một sốcách phân chia nguyên âm.4 1.3. Phânloại âm tốvềmặt âm học - nhận dạng tiếng nói dựa vào đặc trưng âm học.6 1.3.1. Ý nghĩa của phân loại vềmặt âm học.6 ii KHOA CNTT – ĐH KHTN Mục lục 1.3.2. Các đặc trưng âm học.6 1.3.3. Nhận dạng tiếng nói dựa vào các đặc trưng âmhọc.11 1.4. Sơlược vềâm tiết tiếng Việt.11 1.4.1. Giới thiệu vềâm tiết.11 1.4.2. Một số đặc điểm của âm tiết tiếng Việt.12 1.4.2.1. Là ngôn ngữcókết cấu âmtiết tính.12 1.4.2.2. Mỗi âm tiết có thanh điệu riêng.12 1.4.2.3. Âmtiết có cấu trúc chặt chẽvà ổn định.13 1.5. Lý thuyết vềâm vị.14 1.5.1. Định nghĩa âm vị.14 1.5.2. Chức năng của âm vị.15 1.5.3. Tách âmvịvà xác định âmvịtrên chuỗi sóng âm.15 CHƯƠNG 2 Mô hình HMM áp dụng vào nhận dạng âm vị.17 2.1. Giới thiệu.17 2.2. Những vấn đềcơbản của HMM.17 2.2.1. Các kiến thức toán của HMM và các vấn đềkhi sửdụng HMM vào nhận dạng tiếng nói.17 2.2.1.1. Giới thiệu vềnhận dạng thống kê và HMM.18 2.2.1.2. Các thành phần chính của HMM.19 2.2.1.3. Ví dụvềnhận dạng từ đơn dựa trên HMM.21 2.2.1.4. Haigiảthuyết cơbản đểxây dựng hệthống nhận dạng dựa trên HMM.22 2.2.1.5. Ba vấn đềthiết yếu của môhình HMM và cách giải quyết các vấn đề trên.24 iii KHOA CNTT – ĐH KHTN Mục lục 2.3. Nhận dạng tiếng nói và nhận dạng âm vịdựa trên HMM.28 2.3.1. Mô hình Nhận dạng.28 2.3.2. Các thành phần cơbản của hệthống nhận dạng tiếng nói dựa trên HMM và mối liên hệgiữa chúng.30 2.4. Môhình HMM cho âmvị được sửdụng trong bài làm.32 CHƯƠNG 3 Tiền xửlý tín hiệu Tiếng nói và rút trích đặc trưng.34 3.1. Ý nghĩa của Tiền xửlýTiếng nói.34 3.2. Một sốcông việc trong Tiền xửlý tín hiệu tiếng nói.35 3.2.1. Làmnổi tín hiệu (pre-emphasis).35 3.2.2. Lọc tiếng ồn.36 3.3. Rút trích đặc trưng.37 3.3.1. Giới thiệu.37 3.3.2. Một sốphương pháp trích đặc trưng.38 3.3.2.1. Phương pháp Mã hóa dựbáo tuyến tính (LPC).38 3.3.2.3. Phương pháp Mã hoá cepstral tần sốMel dựa trên LPC (MFCC).42 3.3.2.4. Các hệsốdelta (D) và hệsốgia tốc (A).42 3.3.3. So sánh các phương pháp trích đặc trưng.43 CHƯƠNG 4 Thuật giải Embedded training – tách và xây dựng mô hình HMM tự động cho âm vị.45 4.1. Tách và nhận dạng âm vịtự động dựa trên HMM.45 4.1.1. Thuật toán huấn luyện đối với những đơn vị độc lập - Huấn luyện trên dữ liệu gán nhãn.45 4.1.2. Thuật giải Embedded training - huấn luyện trên dữliệu âm thanh không gán nhãn âmvị.46 iv KHOA CNTT – ĐH KHTN Mục lục 4.2. Các công thức ước lượng tham sốcủa mô hình HMM.49 4.2.1. Ước lượng thamsốkhi huấn luyện cácmôhình HMM độc lập.49 4.2.2. Ước lượng thamsốtrong thuật giải Embedded training.51 4.3. Các vấn đềvềtham sốcủa HMM khi sửdụng thuật giải Embedded training. .53 4.3.1. Khởi tạo thamsố.53 4.3.2. Ngưỡng.54 4.3.3. Sốlần lặp trong mỗi bước luyện của thuật toán.54 4.3.4. Dữliệu huấn luyện.54 CHƯƠNG 5 Thực hiện chương trình.56 5.1. Các khó khăn trong quá trình nhận dạng.56 5.1.1. Âmvị độc lập và âmvịphụthuộc ngữcảnh.56 5.1.2. Tách âmtiết trong tiếng nói liên tục và sựphụthuộc giữa các âm vịlẫn nhau trong tiếng nói liên tục.58 5.1.3. Các nguyên âm đôi.58 5.1.4. Ảnh hưởng của thanh điệu lên âmvị.59 5.2. Quá trình thực hiện chương trình.59 5.2.1. Các bước chính.60 5.2.2. Thu dữliệu và gán nhãn dữliệu.60 5.2.2.1. Thu dữliệu.60 5.2.2.2. Gán nhãn dữliệu.61 5.2.2.3. Đánh giá dữliệu.61 5.2.2.4. Rúttrích đặc trưng dữliệu.61 5.2.3. Khởi tạo môhình HMM.62 v KHOA CNTT – ĐH KHTN Mục lục 5.2.4. Huấn luyện môhình HMM.63 5.2.4.1. Huấn luyện môhình HMM cho âmvị độc lập ngữcảnh (monophone).63 5.2.4.2. Huấn luyện trên môhình âmvịphụthuộc ngữcảnh (triphone).66 5.2.5. Nhận dạng.70 5.3. Đánhgiá kết quảvà hướng phát triển:.71 5.3.1. Kết quảnhận dạng.71 5.3.2. Nhận xét.73 5.3.3. Hướng phát triển.73 TÀI LIỆU THAM KHẢO.75
Các file đính kèm theo tài liệu này:
- 0012535.pdf
- 230_book210408.pdf