Đề tài Các hệ thống truyền hình số : trình bày về các hệ thống truyền hình số Atsc, Dvb, Isdb

Lời nói đầu 1

Chương 1 3

Giới thiệu chung. 3

Hình 1.1 : Sơ đồ cấu trúc tổng quát hệ thống truyền hình số 7

Chương2 9

Xử lý tín hiệu video. 9

2.1 / Số hoá tín hiệu video. 9

2.1.1 / Lấy mẫu. 10

Hình 2.3: Cấu trúc trực giao. 11

Cấu trúc “ quincunx “ mành. 11

Hình 2.5: Cấu trúc “ quincunx “ dòng. 11

Hình 2.6: Quan hệ giữa dòng video số và dòng video tương tự hệ 525 dòng / 60 mành. 13

Hình 2.7: Quan hệ giữa dòng video số và dòng video tương tự hệ 625 dòng / 50 mành. 13

Hình 2.8 : Tiêu chuẩn 4:4:4. 14

Hình 2.9 : Tiêu chuẩn 4::2:2. 14

Hình 2.10 : Tiêu chuẩn 4:2:0. 15

Hình 2.11 : Tiêu chuẩn 4:1:1. 15

2.1.2 / Lượng tử hoá. 16

Bảng 2.2 : Giá trị các từ mã ứng với các mức và điện áp tín hiệu Y. 17

Bảng 2.3 : Giá trị các từ mã ứng với các mức và điện áp tín hiệu CB, CR. 17

Bảng 2.4 : Giá trị các từ mã ứng với các mức và điện áp tín hiệu CB, CR. 18

2.1.3 / Tín hiệu chuẩn thời gian TRS (Time Reference Signal). 19

2.1.4 / Dữ liệu phụ ANC (Ancillary Data). 20

2.1.5 / Quan hệ giữa mành số và mành tương tự. 20

Hình 2.12 : Quan hệ giữa mành số và mành tương tự hệ 525 dòng / 60 mành. 20

Hình 2.13 : Quan hệ giữa mành số và mành tương tự hệ 625 dòng / 50 mành. 21

2.2 / Nén tín hiệu video. 21

Hình 2.14 : Sự phối hợp các kĩ thuật nén 23

2:2:1 / Mã hoá dự báo DPCM. 25

Hình 2.16 : Giải mã DPCM 25

Hình 2.17 : Sơ đồ khối DPCM liên mành. 26

2:2:2 / Mã chuyển vị (Transform Coding). 27

Hình 2.18 : Quá trình mã hoá DCT một chiều 29

Hình 2.19 : Biến đổi DCT hai chiều 30

2.2.3 / Nén trong ảnh (Intra-frame Compression). 31

Hình 2.20 : Nén theo ảnh (Frame). 31

Hình 2.21 : Nén theo mành (Field). 31

Hình 2.22 : Nén trong ảnh (Intra-frame Compression) 32

Hình 2.23 : Cấu tạo của MB theo các chuẩn lấy mẫu 32

Hình 2.24 : Quét zig-zag các hệ số lượng tử hoá DCT. 34

Hình 2.25 : Quá trình nén trong ảnh. 35

Hình 2.26 : Quá trình giải nén trong ảnh. 35

2.2.4 / Nén liên ảnh (Inter-frame Compression). 35

Hình 2.27 : Sự bù chuyển động. 36

Hình 2.28 : Các khung hình I, B và P . 37

Hình 2.29 : Nén liên ảnh. 37

2.2.5 / Chuẩn nén video MPEG. 38

Bảng 2.5 : Các level và profile của MPEG-2 39

Hình 2.31 : Cấu trúc nhóm ảnh. 40

Hình 2.32 : Giải nén MPEG. 41

Chương3 42

Xử lý tín hiệu audio. 42

Hình 3.1 : Hệ thống âm thanh đa kênh 3 front/2 surround (ITU-R Rec. BS. 775-1). 42

Hình 3.2 : Phân hệ audio trong hệ thống truyền hình số. 43

3.1 / Các đặc điểm của hệ thống thính giác người. 43

Hình 3.3 : Ngưỡng che lấp tần số và nghe thấy tuyệt đối 44

3.2 / Các kỹ thuật nén số liệu audio. 44

3.2.1 / Nén không suy hao 44

Hình 3.4 : Hệ thống mã hoá điểm quá tải khối số liệu audio. 45

3.2.2 / Nén có suy hao. 46

3.3 / Quá trình mã hoá audio. 46

Hình 3.5 : Bộ mã hoá audio dựa vào thính giác cơ bản. 47

3.4 / Chuẩn nén audio MPEG. 48

Hình 3.6 : Họ các chuẩn nén tín hiệu MPEG audio. 48

3.4.1 / Chuẩn nén audio MPEG-1. 48

Hình 3.7 : Cấu trúc cơ bản của bộ mã hoá audio MPEG. 49

Hình 3.8 : Cấu trúc cơ bản của bộ giải mã audio MPEG. 49

Hình 3.9 : Sơ đồ khối của bộ mã hoá audio MPEG-1(lớpI, II). 50

Hình 3.10 : Sơ đồ khối của bộ giải mã audio MPEG-1(lớpI, II). 50

Hình 3.11 : Cấu trúc khung MPEG audio lớp 1 51

3.4.2 / Chuẩn nén audio MPEG-2. 53

Hình 3.12 : Sự mở rộng MPEG-2 Audio trong định dạng luồng bit MPEG-1. 53

Hình 3.13 : Nguyên lý tương thích ngược của chuẩn audio MPEG-2 với 54

3.5 / Chuẩn nén audio AC-3. 54

Hình 3.14 : Hệ thống audio tiêu chuẩn AC-3. 55

Chương 4 56

Ghép kênh và truyền tải các dịch vụ 56

4.1 / Hệ thống ghép kênh và phân kênh MPEG-2 . 56

Hình 4.1 : Hệ thống ghép kênh và phân kênh MPEG-2. 56

4.2 / Dòng cơ sở được đóng gói (PES). 57

Hình 4.2 : Cấu trúc của gói phần tử cơ sở (PES). 58

4.3 / Dòng chương trình(PS). 60

4.4 / Dòng truyền tải (TS). 60

4.4.1 / Cấu trúc dòng truyền tải. 60

Hình 4.3 : Cấu trúc gói TS. 61

Hình 4.4 : Cấu trúc header gói TS. 62

Bảng 4.1 : Bit điều khiển xáo trộn luồng truyền tải 63

Bảng 4.2 : Bit điều khiển phần thích nghi. 63

Hình 4.5 : Cấu trúc trường Adaptation Field gói TS . 64

4.4.2 / Thông tin đặc tả chương trình (PSI). 65

Bảng 4.3 : Bảng thông tin đặc tả chương trình. 66

docChia sẻ: huong.duong | Lượt xem: 1654 | Lượt tải: 2download
Bạn đang xem nội dung tài liệu Đề tài Các hệ thống truyền hình số : trình bày về các hệ thống truyền hình số Atsc, Dvb, Isdb, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ột tổ chức quốc tế được thành lập dưới sự bảo trợ của ISO và IEC. Mục đích của MPEG trước đây là đưa ra chuẩn cho việc mã hoá hình ảnh động và âm thanh cho các phương tiện lưu trữ số DSM (Digital Storage Media) có thông lượng từ 1.5 Mbit/s đến 10Mbit/s. Phương pháp mã hoá được định nghĩa để ứng dụng cho nhiều lĩnh vực khác nhau như phân phát và truyền thông. Tiêu chuẩn MPEG là sự kết hợp giữa nén trong ảnh và nén liên ảnh, tức là phương pháp nén có tổn hao dựa trên biến đổi DCT và bù chuyển động. Tiêu chuẩn MPEG không biểu diễn cấu trúc bộ mã hoá một cách chính xác, chỉ đặc trưng chính xác các thuật toán nén và kích thước dòng số liệu. Cấu trúc cơ bản của một hệ thống nén MPEG bao gồm ba phần chính: Bộ đồng bộ và dồn kênh tín hiệu audio và video. Hệ thống video. Hệ thống audio. MPEG-1 được khởi đầu vào năm 1988 được dùng để nén video với tốc độ 1,5Mbit/s. Chuẩn này rất thích hợp cho các thiét bị lưu trữ như CD-ROM và các kênh truyền dẫn số PDH có tốc độ 1,554 Mbit/s và 2,048 Mbit/s trong hệ thống truyền dẫn của mạng viễn thông thế hệ cũ. MPEG-2 được phát triển sau, dự định được sử dụng cả cho nén HDTV. Sự phát triển của tiêu chuẩn MPEG-2 được khởi đầu vào tháng 6 năm 1990. Mục đích để định nghĩa tiêu chuẩn mã hoá thông tin hình ảnh và âm thanh với chất lượng phát quảng bá với tốc độ lên tới 15Mbit/s, dựa trên khuyến nghị của tiêu chuẩn truyền hình số ITU-R BT601. Vào tháng 3 năm 1993 MPEG đã họp ở Sydney và tháng 6 ở New York, các chỉ tiêu kỹ thuật về các mức "Level" và các mô tả "Profile" đã được thông qua. Bảng dưới đây cung cấp định nghĩ vắn tắt của 5 mô tả và danh sách các độ phân giải cho 4 mức, nó cũng chỉ ra tốc độ bit cực đại đối vói sự kết hợp của các mức và mô tả. Bảng 2.5 : Các level và profile của MPEG-2 Mã hoá có thể thay đổi độ phân giải "Scalability" cho phép các bộ giải mã của các kênh truyền hình số có độ phân giải thấp LDTV và tiêu chuẩn SDTV có thể lấy ra thông tin mà nó yêu cầu từ luồng bit của kênh truyền hình có độ phân giải cao HDTV. Tiêu chuẩn MPEG-3: nén tín hiệu số xuống còn Ê 50Mbit/s để truyền tín hiệu truyền hình có độ phân giải cao. Năm 1992 MPEG-3 được kết hợp với MPEG-2 dùng cho truyền hình thông thường và truyền hình có độ phân giải cao và lấy tên chung là MPEG-2. Tiêu chuẩn MPEG-4 đã được khởi thảo vào năm 1997 tại New York sử dụng cho nén hình ảnh và âm thanh có tốc độ bit rất thấp. Tốc độ dữ liệu yêu cầu là 9á40 Kbps. MPEG-4 được hoàn thiện vào tháng 10-1998 nhằm mục đích phát triển các tiêu chuẩn mã hoá mới với tốc độ bit rất thấp. Tiêu chuẩn MPEG-7 được đề nghị vào tháng 10-1998 và trở thành chuẩn quốc tế vào tháng 9-2001. MPEG-7 là chuẩn mô tả thông tin của nhiều loại đa phương tiện và được gọi chính thức là “giao thức mô tả nội dung đa phương tiện”. Trong các chuẩn nén, chuẩn MPEG-2 với các Profiles và Levels được lựa chọn là tiêu chuẩn quốc tế cho tín hiệu video. Nguyên lý chung của nén tín hiệu video theo chuẩn MPEG được thực hiện như sau: Hình 2.30 : Bộ mã hoá Video MPEG cơ bản. Công nghệ nén MPEG cũng sử dụng ba loại ảnh I, B và P .Để có một khuôn hình hoàn chỉnh ảnh P và B cần có dữ liệu từ các ảnh lân cận, chính vì vậy đối với MPEG một khái niệm mới là GOP (Group Of Piture) được sử dụng. Mỗi GOP bắt buộc phải bắt đầu bằng một ảnh hoàn chỉnh I và tiếp sau nó là một loạt các ảnh P và B. Nhóm ảnh có thể là mở (Open) hoặc đóng (Close). Nhóm ảnh mở bắt đầu từ một ảnh I và kết thúc ở một ảnh trước ảnh I của nhóm ảnh tiếp theo, ảnh cuối cùng của nhóm ảnh trước dùng ảnh đầu của nhóm ảnh kề sau làm chuẩn. Đối với nhóm ảnh đóng, việc dự đoán ảnh không sử dụng thông tin của nhóm ảnh khác. Trong trường hợp này theo quy định ảnh cuối cùng của một nhóm bao giờ cũng là ảnh P. 7 5 I 6 7 B 5 6 B 4 2 P 3 4 B 2 3 B 1 1 I 1 1 I 2 3 B 1 1 I 3 4 B 3 4 B 2 3 B 1 1 I 4 2 P 3 4 B 2 3 B 1 1 I Thứ tự hiện ảnh Thứ tự truyền Loại ảnh GOP mở GOP đóng Hình 2.31 : Cấu trúc nhóm ảnh. Tỉ lệ nén video phụ thuộc rất nhiều vào độ dài của GOP, tuy nhiên GOP thường gây khó khăn cho quá trình tua, định vị, sửa lỗi...Trong thực tế, tuỳ thuộc và từng khâu (sản xuất, dựng, truyền dẫn, phát sóng..) mà người ta chọn độ dài GOP thích hợp. Trong sản xuất hậu kì nếu có yêu cầu dựng chính xác đến từng ảnh, GOP tất nhiên chỉ có ảnh I (trong trường hợp này tỷ số nén sẽ đạt rất thấp). Trong truyền dẫn, phát sóng, số lượng ảnh B, P trong GOP tăng để đạt được tỷ số nén cao hơn, số ảnh trong một GOP có thể lên tới 12 và lúc này không thể thực hiện dựng hình cũg như làm kĩ xảo trên đó. Quá trình giải mã, về lý thuyết, là ngược lại với quá trình mã hoá và được thực hiện theo sơ đồ sau: Nhớ đệm Giải mã entropy Giải lượng tử hóa DCT ngược Nhớ ảnh ồ Dự báo ảnh Số liệu điều khiển Hình 2.32 : Giải nén MPEG. Chương3 Xử lý tín hiệu audio. Các tín hiệu audio số PCM đã được sử dụng trong truyền hình, đa phương tiện, và các ứng dụng khác. Người xem truyền hình hiện nay đang sử dụng các hệ thống âm thanh đa kênh như: Home Theaters, Dolby-Surround... Những tín hiệu audio này đòi hỏi tốc độ số liệu cao khi lưu trữ số liệu vào đĩa và kênh truyền dẫn có dải thông lớn. Ví dụ như: tín hiệu audio stereo có độ phân giải 16 bit được lấy mẫu ở tần số 48Khz thì tốc độ số liệu là 1,54Mb/s, trong khi đó hệ thống âm thanh surround sẽ có tốc độ bit 4.5Mb/s. Do vậy, đòi hỏi phải có phương thức nén số liệu hiệu quả cho việc lưu trữ số liệu trong thời gian dài và trong các kênh truyền có độ rộng hữu hạn. Hình 3.1 : Hệ thống âm thanh đa kênh 3 front/2 surround (ITU-R Rec. BS. 775-1). Hiện nay, tín hiệu audio được nén đã được sử dụng rộng trong các ứng dụng multimedia dựa vào máy tính cá nhân, ở đó tín hiệu audio được nén được lưu giữ trên CD-ROM và các mạng máy tính. Nó cũng đã được sử dụng trong các ứng dụng truyền dẫn phát quảng bá qua vệ tinh và nhiều ứng dụng khác. Những năm gần đây, các hệ âm thanh đa kênh đã được đưa vào dùng rộng rãi trong lĩnh vực truyền hình số (ADTV,HDTV...), có nhiều hệ âm thanh với chất lượng cao được sử dụng như AC-3, MPEG-1, MPEG-2... Một hệ thống âm thanh thích hợp cho truyền hình số phải thoả mãn một vài yêu cầu cơ bản và phải có được các yếu tố về kĩ thuật và vận hành như: Cho âm thanh đa kênh. Có kênh tần số thấp LFE (20Hzá120Hz). Có tính tương thích ngược và thuận. Kết hợp được giữa dịch vụ và cấu hình. Hình 3.2 : Phân hệ audio trong hệ thống truyền hình số. Các hệ thống nén thông tin âm thanh dựa vào các đặc điểm cảm nhận âm thanh của người và sự giới hạn của chúng để loại bỏ các thông tin không cần thiết trong tín hiệu audio. 3.1 / Các đặc điểm của hệ thống thính giác người. Hệ thống thính giác của con người (HAS : Human Auditory System) xử lý giống như bộ phân tích phổ và tách riêng phổ của các âm thanh nghe được bằng các bộ lọc thông giải được gọi là các dải giới hạn tới hạn. Các dải này có độ rộng 100hz trong dải tần số dưới 500Hz, còn tần số trên 500hz thì độ rộng của dải tăng tỷ lệ tương ứng với tần số như đã được miêu tả bởi Fletcher (1940) và Sharf (1970). Mô hình hiện thời được sử dụng được tạo bởi 25 dải con tương ứng với 25 bộ lọc ốc tai của tai người. Độ nhạy thính giác HAS giảm ở các tần số thấp và tần số cao. Hình dưới cho thấy áp suất âm thanh tối thiểu cho các âm , còn được gọi là ngưỡng nghe thấy tuyệt đối. Ví dụ đối với âm có tần số 1khz ngưỡng nghe thấy 27dB có nghĩa là với nhiễu dưới 27 dB thì không thể nghe thấy. Do đó âm 1khz có thể được lượng tử hoá phần âm thanh lớn hơn 27dB. Hình 3.3 : Ngưỡng che lấp tần số và nghe thấy tuyệt đối 3.2 / Các kỹ thuật nén số liệu audio. Các kỹ thuật mã hoá nguồn được sử dụng để loại bỏ sự dư thừa của tín hiệu audio (khi các mẫu sai khác nhau không đáng kể), kỹ thuật che lấp cảm nhận âm thanh được sử dụng để loại bỏ nội dung không liên quan (các mẫu âm thanh không thể nghe được). Có hai kỹ thuật nén chính là : Mã hoá dự đoán miền thời gian : kỹ thuật này sử dụng mã hoá vi sai để lấy sự khác nhau giữa hai mẫu liên tiếp. Mã hoá chuyển dạng miền tần số : kỹ thuật này sử dụng các khối của các mẫu audio PCM tuyến tính được chuyển từ miền thời gian đến một số dải nhất định trong miền tần số.  3.2.1 / Nén không suy hao Các phương thức nén không suy hao cho phép khôi phục từng bit thông tin số liệu nguyên thuỷ sau khi giải nén. Chúng loại bỏ sự dư thừa thống kê trong các tín hiệu audio bởi các các giá trị dự đoán từ các mẫu trước đó. Tỷ số nén khoảng 2:1 có thể đạt được và nó phụ thuộc vào độ phức tạp tín hiệu audio nguyên thuỷ. Nén không suy hao được thực hiện dựa vào kỹ thuật mã hoá dự đoán miền thời gian đó là : Các thuật toán vi sai : Các tín hiệu audio có chứa các âm thanh lặp đi lặp lại cũng như một số lượng lớn sự dư thừa và các âm thanh không thể cảm nhận được. Thông tin lặp đi lặp lại này được loại bỏ trong quá trình mã hoá và được tái tạo lại ở bộ giải mã. Kĩ thuật DPCM cũng có thể được sử dụng cho tín hiệu audio. Mã hoá entropy: sử dụng phương thức loại bỏ sự dư thừa trong việc thể hiện các hệ số lượng tử hoá để cải thiện hiệu quả mã hoá. Các hệ số sẽ được mã hoá theo tần suất suất hiện, các hệ số có tần xuất xuất hiện cao sẽ được mã hoá với số bit ít hơn, các hệ số có tần suất xuất hiện thấp hơn sẽ được mã hoá với số bit nhiều hơn. Các thông số quá tải khối dữ liệu: thực hiện bằng cách nhóm các giá trị bit nhị phân được lấy từ đầu ra của bộ chuyển đổi ADC thành các khối số liệu (trong miền thời gian: các mẫu lân cận nhau ở đầu ra của bộ ADC, hoặc trong miền tần số: các hệ số tần số lân cận nhau ở đầu ra của bộ mã hoá DCT). Các giá trị nhị phân sau đó sẽ được chia tỷ lệ sao cho giá trị lớn nhất luôn nhỏ hơn giá trị thang lượng tử đầy đủ. Hệ số này được gọi là số mũ, là gía trị chung cho tất cả các khối. Tiếp theo đó mỗi giá trị có thể được thể hiện bằng giá trị phần định trị và bởi giá trị mũ để chỉ thị chính xác biên độ của mẫu. Đây là quá trình tái lượng tử hoá không đồng nhất, ở đó kích cõ bước lượng tử hoá được quyết định bởi số bít được cấp phát cho một khối. Việc tính toán cấp phát bit được lấy từ mô hình cảm nhận âm thanh của người như được trình bày ở hình dưới đây. Sự giảm tốc độ số liệu có thể nhận được bởi gửi một giá trị mũ trên một khối số liệu. ADC 16 bit Delay Buffer Digital Scaling Multiplexer Scaling calculation 3 bit exponent HAS model Encoded bit stream analoge input signal Hình 3.4 : Hệ thống mã hoá điểm quá tải khối số liệu audio. 3.2.2 / Nén có suy hao. Kỹ thuật nén suy có thể đạt được bởi kết hợp hai hay nhiều kỹ thuật xử lý, tận dụng khả năng không cảm nhận được các thành phần phổ có biên độ nhỏ giữa các thành phần phổ có biên độ lớn. Tỷ lệ nén của kỹ thuật nén suy hao có thể đạt được từ 2:1 đến 20:1 tuỳ thuộc vào độ phức tạp của quá trình nén, giải nén và các yêu cầu của chất lượng âm thanh. Các hệ thống nén suy hao sử dụng kỹ thuật mã hoá cảm giác . Nguyên lý cơ bản của nó là loại bỏ sự dư thừa thính giác trong tín hiệu audio bởi loại bỏ bất cứ tín hiệu nào nằm dưới đường cong ngưỡng nghe thấy, điều này giải thích tại sao người ta gọi các hệ thống nén số liệu audio có tổn hao là mất các thành phần âm. Nén suy hao sử dụng các kỹ thuật như : Hiệu ứng che lấp miền thời gian, miền tần số của các thành phần tín hiệu. Tỉ lệ signal-mask được sử dụng để xác định số bit cho quá trình lượng tử hoá mỗi băng tín hiệu. Hiệu ứng che lấp nhiễu lượng tử hoá cho các âm nghe được bởi việc cấp phát đử các bit một cách vừa đủ để đảm bảo nhiễu lượng tử hoá luôn luôn dưới đường cong ngưỡng nghe thấy. Tại các tần số gần với tín hiệu có khả năng nghe được thì giá trị SNR từ 20dB đến 30dB là có thể chấp nhận được, nó tương đương với độ phân tích từ 4 đến 5 bit Mã hoá nối (Joint coding): kỹ thuật này tận dụng sự dư thừa trong các hệ thống âm thanh đa kênh. Với các hệ thống này thì một số lượng đáng kể số liệu âm thanh tương đương tồn tại ở tất cả các kênh. Do vậy, số liệu có thể được giảm bởi mã hoá một lần giá trị tương đương đó và chỉ cho bộ giải mã biết phải lặp lại cho tất cả các kênh khác. 3.3 / Quá trình mã hoá audio. Các hiệu ứng che lấp quan trọng nhất xảy ra trong miền tần số. Để tận dụng đặc tính này phổ của tín hiệu audio được phân ra thành các dải con với độ phân dải về mặt thời gian và tần số phù hợp với các dải giới hạn của hệ thống cảm nhận âm thanh của tai người (HAS). Cấu trúc cơ bản của bộ mã hoá dựa vào thính giác như sau : Filter band Perceptual model Quantizer and coder Multiplexer Encoded bit stream Encoded stream Bit allocation input signal allocation Bit allocator Hình 3.5 : Bộ mã hoá audio dựa vào thính giác cơ bản. Bộ cấp phát bit (Bit Allocator) dùng để đánh giá ngưỡng che lấp và cấp phát bit dựa trên năng lượng phổ cơ bản của tín hiệu audio và mô hình thính giác của người. Bộ ghép kênh dữ liệu (Multiplexer): nhận dữ liệu lượng tử hoá và cộng thông tin phụ (thông tin vị trí bit và hệ số thang độ) cho quá trình giải mã. Bộ lọc đa dải (Filter Band) còn được gọi là băng bộ lọc được sử dụng để phân tích phổ tín hiệu thành các dải băng tần con. Băng các bộ lọc có ba loại như sau : Băng dải con: phổ tín hiệu được phân thành các dải con có độ rộng bằng nhau (32 dải trong MPEG lớp I và lớp II). Nó tương tự như quá trình HAS phân tích tần số (chia phổ audio thành các băng tới hạn) Băng chuyển dạng: là một thuật toán sửa đổi của DCT để chuyển đổi tín hiệu audio miền thời gian thành một số dải con (từ 256 đến 1024). Băng bộ lọc lai ghép : Chúng bao gồm các bộ lọc dải con tiếp theo là các bộ lọc chuyển dạng. Sự kết hợp này sẽ cho độ phân dải tần số mịn hơn và nó đã được sử dụng trong MPEG lớp III. Tín hiệu đầu vào trước hết được phân thành 32 dải nhờ bộ lọc dải con sau đó bộ lọc chuyển dạng sẽ được thực hiện trên 18 mẫu trong mỗi dải con. Do đó tín hiệu được phân thành 576 dải con rất hẹp. Mô hình cảm nhận (Perceptual Model): sự phân tích thần kinh cảm giác một cách chính xác của các tín hiệu PCM đầu vào được thực hiện cũng như đối với nội dung năng lượng và tần số của nó đều sử dụng thuật toán FFT. Có hai dạng che lấp là : Che lấp về phổ: khi tồn tại cung một lúc hai âm thanh có tần số khác nhau, âm thanh có mức lớn hơn có thể che lấp được âm thanh có mức nhỏ hơn. Do đó đường cong ngưỡng nghe thấy sẽ luôn thay đổi tuỳ thuộc vào phổ của các mẫu âm thanh đang xét. Chỉ có các đoạn phổ nằm trên đường cong này mới thực sự cần được mã hoá. Che lấp về thời gian : Tai người chỉ cảm nhận âm thanh sau khi âm thanh đó bắt đầu khoảng 200ms, và có cảm tưởng âm thanh kéo dài 200ms nữa khi âm thanh chấm dứt ngoài ra tai người không thể phân biệt được khoảng ngừng nhỏ hơn 50ms giữa hai âm thanh giống nhau đi liền nhau. 3.4 / Chuẩn nén audio MPEG. Chuẩn nén audio MPEG là tiêu chuẩn được dùng phổ biến để nén tín hiệu audio số. Tiêu chuẩn này cho phép sử dụng phát thanh số trên mặt đất, qua vệ tinh DAB (Digital Audio Broadcasting) và DVB cho truyền hình vệ tinh, truyền hình cáp,truyền hình số mặt đất. Họ chuẩn MPEG audio bao gồm nhiều tiêu chuẩn khác nhau tuỳ thuộc vào các ứng dụng và có thể khái quát trong hình sau: Hình 3.6 : Họ các chuẩn nén tín hiệu MPEG audio. 3.4.1 / Chuẩn nén audio MPEG-1. Tiêu chuẩn MPEG-1 (ISO/IEC 11172) được phát triển vào năm 1991 cho mã hoá hình ảnh chuyển động kết hợp với audio cho các phương tiện lưu trữ tốc độ dưới 1,5Mb/s. Phần audio của tiêu chuẩn này định nghĩa 3 lớp cho mã hoá tín hiệu PCM có tốc độ lấy mẫu là 32KHz, 44,1KHz và 48 Khz với 16 bit/mẫu. Quá trình nén theo chuẩn này thường được thực hiện theo ba bước: Chuyển tín hiệu audio về miền tần số, toàn bộ dải phổ của nó được chia thành 32 băng con nhờ bộ lọc băng con. Xác định mức biên độ và mức nhiễu cho mỗi băng con bằng mô hình cảm nhận. Tỉ lệ signal-mask xác định cho mỗi băng được sử dụng để xác định số bit cho quá trình lượng tử hoá mỗi băng. Lượng tử hoá các băng con thông qua lượng tử các thành phần nghe thấy trong mỗi băng. Quá trình này thường bao gồm cả mã hoá Huffman. Cơ bản của bộ mã hoá và giải mã audio được thể hiện trong hình dưới đây. Temporal/ frequence mapping Joint coding Scaling Quatizing coding Frame buffer Psychoacoustic model ancillary data (option) PCM audio samples @32; 44,1; 48Khz compressed data Hình 3.7 : Cấu trúc cơ bản của bộ mã hoá audio MPEG. Frame unpacking Recontruction frequence/ temporal mapping PCM audio samples @32;44,1;48Khz Ancillary data (Option) Encoded data stream Hình 3.8 : Cấu trúc cơ bản của bộ giải mã audio MPEG. Có ba lớp phân biệt trong tiêu chuẩn audio MPEG để cung cấp cho cấc chế độ hoạt động sau : Chế độ mono. Chế độ hai kênh audio độc lập. Chế độ stereo . Chế độ stereo kết hợp. Trong MPEG -I lớp I dùng FFT cho mẫu có cửa sổ 512. trong MPEG-I lớp II và III dùng phân tích FFT của mẫu có cửa sổ 1024. Lớp I dùng trong các thiết bị dân dụng, lớp II dùng trong các thiết bị chuyên dụng và multimedia, lớp III dùng trong các hệ thống mã hoá tiếng nói và mã hoá chất lượng cao cho tín hiệu âm nhạc. Lớp I là thuật toán cơ sở, lớp II và III bao gồm nhiều phần nâng cao của lớp I. Sơ đồ khối của bộ mã hoá và giải mã audio MPEG (theo tiêu chuẩn ISO/IEC 11172-3) lớp I và lớp II được đưa ra như sau: Hình 3.9 : Sơ đồ khối của bộ mã hoá audio MPEG-1(lớpI, II). Hình 3.10 : Sơ đồ khối của bộ giải mã audio MPEG-1(lớpI, II). Các đặc điểm của lớp 1 Cấu trúc khung MPEG lớp 1 audio được trình bày như hình dưới đây : Hình 3.11 : Cấu trúc khung MPEG audio lớp 1 Tốc độ số liệu từ 32 đến 448Kbps (tổng cộng). Tín hiệu đầu vào được phân thành các khung có 384 mẫu trên một kênh. Khung có chiều dài 8ms tần số lấy mẫu 48Khz (12x32x20.83 = 8ms). 32 dải con kích cỡ tương đương, tạo thành các khối 12 mẫu (32x12=384 mẫu). Các hệ số bậc thang 6 bit trên một dải (dải động 120 dB), và hệ số tỉ lệ khác nhau cho mỗi dải. Cấp phát bít thích nghi hướng đi. Mỗi mẫu băng con được lượng tử hóa một cách chính xác bởi bộ tính toán cấp phát các bit. Tín hiệu audio có thể là mono, stereo, hoặc stereo kết hợp. Thích hợp cho hầu hết các ứng dụng thương mại. Các đặc điểm của lớp II: MPEG audio lớp 2 cải thiện tính năng của lớp I cho phép nén tốt hơn. Tốc độ bit cuối cùng khoảng128kp/s. Tốc độ số liệu từ 32 đến 384 kb/s. Tín hiệu đầu vào được phân thành các khung chứa 1152 mẫu (trên một kênh). 32 dải kích cỡ tương đương tạo ra tử các khối 36 mẫu (32x36=1152 mẫu). Khung có chiều dài 24ms@48Khz (384x3x20,83= 24ms). Các hệ số bậc thang 6 bit trên một dải, khác nhau cho mỗi dải. Hệ số bậc thang có thể được chia sẻ bởi các nhóm 12; 24 và 36 mẫu để trách làm méo tín hiệu audio. Tín hiệu audio có thể là mono, hai kênh, stereo, stereo kết hợp. Cấp phát bít thích nghi hướng đi. Được sử dụng rộng rãi nhất trong CD-ROM, DVB,DAB,DBS, ... Các đặc điểm của lớp III . Lớp III cung cấp chất lượng tốt nhất ở tốc độ bit thấp. Băng bộ lọc miền thời gian đến băng lọc miền tần số cung cấp độ phân giải phổ, tần số,và thời gian thích nghi cao để phù hợp với sự biến đổi nội dung của tín hiệu đầu vào. Tốc độ bit khoảng 64 Kb/s. Các đặc điểm của lớp III như sau : Tốc độ số liệu từ 32 đến 320 kb/s. Tín hiệu đầu vào được phân thành các khung chứa 1152 mẫu (trên một kênh). 32 dải kích cỡ tương đương sau đó được phân thành 18 dải MDCT (tổng số là 576 dải) có khả năng tương thích chuyển xuống thành 192 dải. Khung có chiều dài 24ms@48Khz (384x3x20,83= 24ms). Các hệ số bậc thang được sử dụng để sửa đổi cấu trúc và các mức nhiễu do lượng tử. Cấp phát bit thích nghi hướng phát. Sử dụng phương pháp mã hoá VLC (Huffman) cho các giá trị lượng tử. Tín hiệu audio có thể là mono, hai kênh, stereo, stereo kết hợp. Được sử dụng rộng trong các ứng dụng tốc độ bit thấp như ISDN, viễn thông, audio chất lượng cao qua internet... 3.4.2 / Chuẩn nén audio MPEG-2. Trong tiêu chuẩn thứ 2 được thiết lập vào năm 1994, MPEG-2 (ISO/IEC 13818) sự mở rộng tiêu chuẩn MPEG-1 đã được xác định để đáp ứng được các nhu cầu trong các ứng dụng mới như : Một dải rộng chất lượng audio từ tốc độ bit thấp đén tốc độ bit cao (32- 1066Kbit/s). Dải rộng này được thực thiện bởi tách khung audio MPEG-2 thành 2 phần, một luồng bit cơ sở tương thích với MPEG-1 (384 kbit/s cho lớp II) và một luồng bit mở rộng. Với lớp III với tốc độ 64 kbit/s trên một kênh 5 kênh audio với độ rộng băng đầy đủ có thể được mã hoá với tốc độ số liệu 320 Kbit/s. Mã hoá lên tới 6 kênh audio bao gồm một kênh tần số thấp, để hỗ trợ các yêu cầu âm thanh surround đa kênh. Hình 3.12 : Sự mở rộng MPEG-2 Audio trong định dạng luồng bit MPEG-1. Chuẩn audio MPEG-2 có thêm một số tần số lấy mẫu mới: 16; 22,05 và 24 KHz. Nó cho phép truyền băng tần trong khoảng 7.5 KHz đến 11 KHz và cho chất lượng cao khi tốc độ dòng số liệu nhỏ hơn 64 Kbps cho mỗi kênh. Tiêu chuẩn MPEG-2 được phát triển sau và tương thích xuống với MPEG-1. Nhưng MPEG-1 chỉ có thể giải mã được các kênh trái phải của luồng audio MPEG-2. Tất cả các lớp của MPEG -1 và MPEG-2 đều giống nhau. Sự tương thích ngược của của chuẩn audio MPEG-2 với MPEG-1 (ISO/IEC11172) được thể hiện trong sơ đồ sau: Hình 3.13 : Nguyên lý tương thích ngược của chuẩn audio MPEG-2 với MPEG-1(ISO/IEC11172). 3.5 / Chuẩn nén audio AC-3. Chuẩn AC-3 được phát triển cho âm thanh đa kênh, nó gồm 5 kênh audio có độ rộng băng tần đầy đủ (3KHzá20KHz) là: Trái. Giữa. Phải. Surround trái. Surround phải. Và một kênh tần số thấp băng hạn chế 3Kzá120Hz. Các đặc tính quan trọng nhất của chuẩn nén AC-3 bao gồm: Tốc độ dòng số liệu từ 32 Kbps đến 640 Kbps. Chu kỳ khung 32 ms cho kênh 48 KHz (384*4*20.83ms = 32ms). Số băng con là 256/128. Cấp phát bit thích nghi hướng phát. Hệ số tỉ lệ là 4,5 bit trên một dải. Có thể điều khiển được dải động âm thanh. Hệ thống AC-3 được mô tả trong sơ đồ sau: Hình 3.14 : Hệ thống audio tiêu chuẩn AC-3. Chương 4 Ghép kênh và truyền tải các dịch vụ 4.1 / Hệ thống ghép kênh và phân kênh MPEG-2 . Năm 1994, ISO/IEC đã chuẩn hoá hệ thống truyền tảitheo chuẩn MPEG-2(ghép kênh audio, video, dữ liệu phụ...). Có thể phân biệt 2 loại hệ thống: hệ thống ghép kênh dòng chương trình PS (Program Stream) và hệ thống ghép kênh dòng truyền tải TS (Transport Stream), mỗi loại có đặc tính tối ưu cho các nhóm ứng dụng khác nhau. Sơ đồ khối tổng quát của hệ thống ghép kênh và phân kênh MPEG -2 được trình bày như hình dưới đây: Program de-multiplexer Video encoder and Packetizer Audio Encoder and Packetizer Program multiplexer Trasnport multiplexer Video in Audio PES Audio in Program 1 Program 2 Program n TS Video PES Video decoder and depacketizer Audio decoder and depacketizer Video out Audio PES Video PES Audio out Packetizer Ancilary data Ancilary data Data PES Data PES depacketizer Trasnport de-multiplexer Program 1 Program 2 Program n PS Hình 4.1 : Hệ thống ghép kênh và phân kênh MPEG-2. Bộ mã hóa video (mã hoá tín hiệu video số theo định dạng CCIR 601) và mã hoá audio (mã hóa tín hiệu audio số theo định dạng AES/EBU) thành các dòng video và audio sơ cấp ES (Elementary Stream) có chiều dài tuỳ ý. Tiếp theo, các dòng sơ cấp audio, video được đóng gói tạo thành các dòng gói sơ cấp PES (Packetized Elementary Stream) tương ứng với các gói có độ dài thay đổi. Mỗi gói PES bao gồm một header và một số liệu trích ra từ dòng sơ cấp. Các gói PES này lại được ghép với nhau tạo ra dòng chương trình PS (Program Stream) hay dòng truyền tải TS (Transport Stream). Đó là phía mã hóa, phía giải mã sẽ bao gồm các quá trình ngược lại. Dòng truyền tải hoặc dòng chương trình sẽ được phân kênh (Demultiplexing) để trả lại các dòng gói sơ cấp, rồi được mở gói (Depacketizing) để trả lại các dòng sơ cấp ES của tín hiệu video, audio. Các dòng sơ cấp video, audio cuối cùng sẽ được giải mã (giải nén) để tái tạo lại tín hiệu video, audio số cung cấp cho bộ đệm và trình diễn (Buffer & Presentation) để phát lại âm thanh hình ảnh. Bên cạnh đó, các thông tin về đồng bộ hệ thống được truyền đi bởi thông số chuẩn đồng hồ (Clock Reference). Việc phát lại các dòng audio, video cũng được kiểm soát bởi các nhãn thời gian trình diễn PTS (Presentation Time Stamps). PTS này cũng được truyền đi trong dòng ghép kênh MPEG - 2. MPEG - 2 nói chung chỉ chuẩn hóa phía giải mã để cải thiện chất lượng hình ảnh, âm thanh hoặc để giảm tốc độ bit, không chuẩn hóa phía mã hóa vì năng lực tính toán, xử lý của bộ mã hóa sẽ còn phát triển mạnh trong tương lai. MPEG-2 phân ra ba loại luồng cơ bản là : Luồng cơ sở được đóng gói : đây là luồng cơ bản của video , audio, số liệu. Luồng chương trình: đây là sự kết hợp của một số lường cơ sở và nó được sử dụng trong môi trường không có lỗi. Luồng truyền tải: luồng có chứa một số luồng cơ sở, nó được sử dụng trong môi trường dễ xảy ra lỗi. 4.2 / Dòng cơ sở được đóng gói (PES). Dòng sơ cấp được phân thành các gói PES tạo thành dòng gói sơ cấp PES. Mỗi gói PES bao gồm trường header và trường payload. Trường payload chỉ bao gồm các byte số liệu trích tuần tự từ dòng sơ cấp gốc. Không nhất thiết yêu cầu byte bắt đầu của các đơn vị truy cập phải là byte bắt đầu của trường payload gói PES. Do đó, một đơn vị truy cập mới có thể bắt đầu tại bất cứ

Các file đính kèm theo tài liệu này:

  • docDAN206.doc
Tài liệu liên quan