Luận văn Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động

MỤC LỤC

LỜI CẢM ƠN.i

MỤC LỤC.ii

DANH SÁCH CÁC HÌNH.vii

DANH SÁCH CÁC BẢNG.ix

GIỚI THIỆU CHUNG.x

CHƯƠNG 1 Sơlược vềngữâm tiếng Việt.1

1.1. Ý nghĩa của các nghiêncứu ngữâmtrong nhận dạng tiếng nói Tiếng Việt.1

1.2. Phânloại âm tốtheo cấu âm.1

1.2.1. Định nghĩa âm tố.1

1.2.2. Các âmtốphụâm.2

1.2.2.1. Đặc điểm cấu tạo của phụâm.2

1.2.2.2. Một sốcách phân chia phụâm.2

1.2.2.3. Cấu âmbổsung.4

1.2.3. Các âmtốnguyên âm.4

1.2.3.1. Đặc điểm cấu tạo của nguyên âm.4

1.2.3.2. Một sốcách phân chia nguyên âm.4

1.3. Phânloại âm tốvềmặt âm học - nhận dạng tiếng nói dựa vào đặc trưng âm

học.6

1.3.1. Ý nghĩa của phân loại vềmặt âm học.6

ii

KHOA CNTT – ĐH KHTN

Mục lục

1.3.2. Các đặc trưng âm học.6

1.3.3. Nhận dạng tiếng nói dựa vào các đặc trưng âmhọc.11

1.4. Sơlược vềâm tiết tiếng Việt.11

1.4.1. Giới thiệu vềâm tiết.11

1.4.2. Một số đặc điểm của âm tiết tiếng Việt.12

1.4.2.1. Là ngôn ngữcókết cấu âmtiết tính.12

1.4.2.2. Mỗi âm tiết có thanh điệu riêng.12

1.4.2.3. Âmtiết có cấu trúc chặt chẽvà ổn định.13

1.5. Lý thuyết vềâm vị.14

1.5.1. Định nghĩa âm vị.14

1.5.2. Chức năng của âm vị.15

1.5.3. Tách âmvịvà xác định âmvịtrên chuỗi sóng âm.15

CHƯƠNG 2 Mô hình HMM áp dụng vào nhận dạng âm vị.17

2.1. Giới thiệu.17

2.2. Những vấn đềcơbản của HMM.17

2.2.1. Các kiến thức toán của HMM và các vấn đềkhi sửdụng HMM vào nhận

dạng tiếng nói.17

2.2.1.1. Giới thiệu vềnhận dạng thống kê và HMM.18

2.2.1.2. Các thành phần chính của HMM.19

2.2.1.3. Ví dụvềnhận dạng từ đơn dựa trên HMM.21

2.2.1.4. Haigiảthuyết cơbản đểxây dựng hệthống nhận dạng dựa trên

HMM.22

2.2.1.5. Ba vấn đềthiết yếu của môhình HMM và cách giải quyết các vấn đề

trên.24

iii

KHOA CNTT – ĐH KHTN

Mục lục

2.3. Nhận dạng tiếng nói và nhận dạng âm vịdựa trên HMM.28

2.3.1. Mô hình Nhận dạng.28

2.3.2. Các thành phần cơbản của hệthống nhận dạng tiếng nói dựa trên HMM

và mối liên hệgiữa chúng.30

2.4. Môhình HMM cho âmvị được sửdụng trong bài làm.32

CHƯƠNG 3 Tiền xửlý tín hiệu Tiếng nói và rút trích đặc trưng.34

3.1. Ý nghĩa của Tiền xửlýTiếng nói.34

3.2. Một sốcông việc trong Tiền xửlý tín hiệu tiếng nói.35

3.2.1. Làmnổi tín hiệu (pre-emphasis).35

3.2.2. Lọc tiếng ồn.36

3.3. Rút trích đặc trưng.37

3.3.1. Giới thiệu.37

3.3.2. Một sốphương pháp trích đặc trưng.38

3.3.2.1. Phương pháp Mã hóa dựbáo tuyến tính (LPC).38

3.3.2.3. Phương pháp Mã hoá cepstral tần sốMel dựa trên LPC (MFCC).42

3.3.2.4. Các hệsốdelta (D) và hệsốgia tốc (A).42

3.3.3. So sánh các phương pháp trích đặc trưng.43

CHƯƠNG 4 Thuật giải Embedded training – tách và xây dựng mô hình HMM

tự động cho âm vị.45

4.1. Tách và nhận dạng âm vịtự động dựa trên HMM.45

4.1.1. Thuật toán huấn luyện đối với những đơn vị độc lập - Huấn luyện trên dữ

liệu gán nhãn.45

4.1.2. Thuật giải Embedded training - huấn luyện trên dữliệu âm thanh không

gán nhãn âmvị.46

iv

KHOA CNTT – ĐH KHTN

Mục lục

4.2. Các công thức ước lượng tham sốcủa mô hình HMM.49

4.2.1. Ước lượng thamsốkhi huấn luyện cácmôhình HMM độc lập.49

4.2.2. Ước lượng thamsốtrong thuật giải Embedded training.51

4.3. Các vấn đềvềtham sốcủa HMM khi sửdụng thuật giải Embedded training.

.53

4.3.1. Khởi tạo thamsố.53

4.3.2. Ngưỡng.54

4.3.3. Sốlần lặp trong mỗi bước luyện của thuật toán.54

4.3.4. Dữliệu huấn luyện.54

CHƯƠNG 5 Thực hiện chương trình.56

5.1. Các khó khăn trong quá trình nhận dạng.56

5.1.1. Âmvị độc lập và âmvịphụthuộc ngữcảnh.56

5.1.2. Tách âmtiết trong tiếng nói liên tục và sựphụthuộc giữa các âm vịlẫn

nhau trong tiếng nói liên tục.58

5.1.3. Các nguyên âm đôi.58

5.1.4. Ảnh hưởng của thanh điệu lên âmvị.59

5.2. Quá trình thực hiện chương trình.59

5.2.1. Các bước chính.60

5.2.2. Thu dữliệu và gán nhãn dữliệu.60

5.2.2.1. Thu dữliệu.60

5.2.2.2. Gán nhãn dữliệu.61

5.2.2.3. Đánh giá dữliệu.61

5.2.2.4. Rúttrích đặc trưng dữliệu.61

5.2.3. Khởi tạo môhình HMM.62

v

KHOA CNTT – ĐH KHTN

Mục lục

5.2.4. Huấn luyện môhình HMM.63

5.2.4.1. Huấn luyện môhình HMM cho âmvị độc lập ngữcảnh

(monophone).63

5.2.4.2. Huấn luyện trên môhình âmvịphụthuộc ngữcảnh (triphone).66

5.2.5. Nhận dạng.70

5.3. Đánhgiá kết quảvà hướng phát triển:.71

5.3.1. Kết quảnhận dạng.71

5.3.2. Nhận xét.73

5.3.3. Hướng phát triển.73

TÀI LIỆU THAM KHẢO.75

pdf91 trang | Chia sẻ: oanh_nt | Lượt xem: 2398 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Luận văn Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

Các file đính kèm theo tài liệu này:

  • pdf0012535.pdf
  • pdf230_book210408.pdf