Đồ án Truyền hình số qua vệ tinh

MỤC LỤC

Lời nói đầu 1

phần I. truyền hình tương tự 2

I. Cơ sở lý thuyết truyền hình 2

I.1 Hệ thống truyền hình: 2

I.2 Nguyên lý hệ thống truyền hình: 3

I.3 Quá trình quét: 4

I.4 Số ảnh Truyền trong một giấy và tín hiệu video 5

I.5.Hình dạng tín hiệu video: 6

I.5.1.Tín hiệu vi deo. 6

I.5.2 Tín hiệu đồng bộ 6

I.5.3 Phổ tín hiệu video: 6

II. Truyền hình mầu 7

II.1 Khái niệm tổng quát về nguyên lý truyền hình mầu 7

II.2 Tính tương hợp giữa truyền hình mầu và truyền hình đen trắng. 7

II.3.1 ánh sáng và mầu sắc: 8

II.3.2 Chọn ba mầu cơ bản: 8

II. 3.3 Ba yếu tố để xác định một sắc mầu. 9

II.3.4 tách mầu: 9

II.3.5 Trộn mầu: 9

II.3.6 Các định luật cơ bản về trộn mầu: 10

II. 4 Các thông số cơ bản của tín hiệu vô tuyến truyền hình: 10

II.4.1 Tín hiệu truyền hình mầu toàn phần PaL D/K 10

II.4.2 Các thông số của tín hiệu mầu: 10

II.4.2.1 Tín hiệu chói EY (Lumirace Signal) 11

II.4.2.2 Các tín hiệu mầu (Color dibberence Signal) 11

II.4.2.3 Sóng mang phụ truyền tín hiệu hiện mầu: 13

II.4.2.4 Tín hiệu xung đồng bộ mầu: 13

II.5 Một số hệ truyền hình mầu chỉnh được sử dụng trên thế giới hiện nay 14

II.5.1 Hệ truyền hình mầu NTSC (National television Sýtem Committee – Tổ chức hệ thống truyền hình quốc gia) 14

II.5.1.1 Hệ này có các đặc điểm chính sau: 14

II.5.1.2 Dùng đồ thị véc tơ mầu để giải thích tín hiệu mầu EI và EQ 15

II. 5.1.3 Sơ đồ khối mạch tạo mã mầu phía phát 16

II.5.1.4 Sơ đồ khối mạch giải mã mầu ở phía thu 17

II.5.2 Hệ truyền hình mầu PaL (Pluse Alterntion line: pha thay đổi theo dòng) 18

II.5.2.1 Dùng đồ thị véc tơ mầu để giải thích nguyên lý sửa méo pha trong hệ PaL 18

II.5.2.2 Sơ đồ khối mạch tạo mã mầu hệ PaL phía phát 20

II.5.2.3 Sơ đồ khối mạch phải giải mã mầu hệ PaL phía thu 21

II.5.2.4 Hệ PaL có các đặc điểm chính sau: 21

II.5.3 Hệ truyền hình mầu Secam 22

II.5.3.1 Tín hiệu mầu và phương pháp điều chế: 22

II.5.3.2 Tiền nhấn tần cao ở phía phát và giải nhấn tân cao ở phía thu 23

II.5.3.3 Sơ đồ khối mạch tạo mã mầu hệ Secam Error! Bookmark not defined.

II.5.3.5 Một vài đặc điểm chính hệ Secam 26

Phần II. Truyền hình số 28

I.Giới thiệu chung. 28

I.1.Đặc điểm của truyền hình số: 30

1.1.Yêu cầu về băng tần. 30

1.2.Tỷ lệ tín hiệu tạp âm (SignallNoise). 30

1.3.Méo phi tuyến. 31

1.4.Chồng phổ (Aliasing). 31

1.5.Xử lý tín hiệu 31

1.6.Khoảng cách giữa các trạm truyền hình đồng kênh. 31

1.7.Hiện tượng Ghosts (bóng ma) 31

I.2.Sơ đồ khối hệ thống thu phát hình số. 32

I.3.Nguyên lý hoạt động. 32

II.Số hoá tín hiệu truyền hình. 33

II.1. Mở đầu. 33

II.2.Biến đổi tương tự sang số. 33

III.Cơ sở biến đổi tín hiệu truyền hình. 33

III.1.Biến đổi tín hiệu Video. 33

III.2.Tần số lấy mẫu tín hiệu Video. 34

III.2.1.Tín hiệu Video tổng hợp. 34

III.2.2.Tín hiệu Video thành phần. 35

III.2.3.Cấu trúc mẫu (sample) 37

III.2.3.1.Cấu trúc trực giao. 37

III.2.3.2.Cấu trúc “quincunx” mành. 38

III.2.3.3.Cấu trúc “quinncunx” dòng. 38

II.2.4. Các chuẩn lấy mẫu tín hiệu Video. 39

III.2.4.2.Chuẩn 4:2:2. 40

III.2.4.3.Chuẩn 4:2:0. 41

I.Mục đích nén. 42

II.Thực chất của nén Video. 42

II.1.Mô hình nén ảnh. 43

II.2. Độ dư thừa dữ liệu. 44

II.2.1.Dư thừa mã (Coding Redundancy). 45

II.22.Dư thừa trong pixel (Interpixel Redundancy). 45

II.2.3.Dư thừa tâm sinh lý. 45

III.Các phương pháp nén. 46

III.1.Nén không tổn hao. 46

III.1.1.Mã hóa với độ dài từ mã thay đổi (VLC) 46

III.1.2.Mã hoá với độ dài của từ mã động (RLC) 46

III.1.3.Sử dụng khoảng xoá dòng và mành. 46

II.1.4.Biến đổi cosin rời rạc (DCT) 46

III.2.Nén có tổn hao. 47

IV.Các loại mã dùng trong nén. 47

I.1.Mã RLC (Run – length Coding). 47

II.2.Mã Shannon-Fano. 48

II.3.Mã Huffman. 48

III.4.Mã dự đoán (DPCM) 48

II.4.1.DPCM trong mành (intraframe DPCM). 49

III.4.2. DPCM giữa các mành. 49

III.5.Mã chuyển vị (Transform Coding). 51

V.Nén trong ảnh. 53

1.Nguyên lý nén trong ảnh. 53

2.Tiền xử lý. 53

3.Biến đổi cosin rời rạc (DCT). 54

4.Lượng tử hoá. 55

5.Mã hoá entropy. 56

VI.Nén liên ảnh. 57

1.Mô hình. 57

2 Xấp xỉ và bù chuyển động. 57

3.Tốc độ truyền sau khi nén. 59

VII. Các chuẩn MPEG 60

1. Giới thiệu chung về chuẩn MPEG. 60

1.1. Ảnh loại I ( Inta-picture). 60

1.2. Ảnh loại P (Predicted - Picture). 60

1.3. Ảnh loại B (Bidiretional Predcited-picture). 60

1.4 Nhóm ảnh (GOP). 61

1.5 Cấu trúc dòng bít MPEG video. 62

1.6. Nguyên lý nén dòng bít. 64

2. Tiêu chuẩn MPEG-1. 65

3. Tiêu chuẩn MPEG-2 65

I. Khái niệm âm thanh. 66

II. Phát tín hiệu âm thanh. 66

II.1.1. Sơ đồ khối máy phát tín hiệu âm thanh. 66

II.1.2. Chức năng từng khối. 67

II.2. Sáu chỉ tiêu chất lượng cho máy phát tín hiệu âm thanh. 67

II.2.1. Độ ổn định tần số. 67

II.2.2. Méo tần số: 68

II.2.3. Méo phi tuyến: 68

II.2.4. Độ sâu điều chế: 68

II.2.5. Mức bức xạ sóng dài: 68

II.2.6. Mức tạp âm có tiếng ù: 68

II.3.Nguyên lý ghi âm 69

II.3.1. Các phương pháp ghi âm . 69

II.3.2 Các chi tiêu chất lượng của máy ghi âm . 69

II.3.3. Nhược điểm của các phương pháp ghi tín hiệu âm thanh tương tự 71

III. Khái niệm cơ bản của audio số. 71

III.1. Mã hoá kênh truyền. 72

III.2. Đặc điểm của tín hiệu số liệu AES/EBU 72

III.3. Các đặc điểm giao diện kênh chuẩn AES/EBU. 73

III.4. Giải mã và ghép kênh tín hiệu AES/EBU. 73

III.5. Đồng bộ audio số 74

III.5.1.Đồng bộ giữa các tín hiệu audio số 74

III.5.2. Đồng bộ giữa tín hiệu audio số và tín hiệu video. 75

III.5.3 Ghi audio số 75

III.6. Cơ sở về nén audio. 76

III.6.1. Khái niệm kỹ thuật nén số liệu audio. 76

III.6.2. Kỹ thụt nén số liệu audio 77

III.7. Nén tín hiệu audio theo chuẩn MPEG 78

III.7.1. Tiêu chuẩn nén MPEG – 1 ( BO/LEC 11172) 78

III.7.2. Thuật toán nén tín hiệu audio MPEG bao gồm các bước sau: 79

III.7.3. Ứng dụng và đặc điểm của 3 mức tiêu chuẩn MPEG 81

III .7.5. Ưu điểm của hai tiêu chuẩn MPEG 83

Kết luận 84

 

doc88 trang | Chia sẻ: maiphuongdc | Lượt xem: 2808 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Đồ án Truyền hình số qua vệ tinh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
bội số của sóng mang màu đã trở nên không phù hợp. Tần số lấy mẫu, như trên đã trình bày, ngoài yêu cầu có giá trị trong khoảng từ 12414 MHz là bội số của tần số dòng còn phải đạt điều kiện là tần số lấy mẫu chung cho cả hai tiêu chuẩn truyền hình 525 và 625 dòng, để có thể tiến tới một tiêu chuẩn Video số chung cho toàn thế giới. Loại bỏ được những điều phiền phức gây nên bởi tình trạng đa hệ truyền hình tương tự. Tóm lại, tần số lấy mẫu đáp ứng được những yêu cầu trên đã được các tổ chức phát thanh truyền hình (SMPTE, EBU, CCIR) thống nhất lựa chọn là: FSa= 13,5 MHz chung cho cả hai tiêu chuẩn 525 và 625 dòng. Cả hai tiêu chuẩn sử dụng chung cùng một tần số lấy mẫu, cùng một lượng mẫu trong thời gian tích cực của một dòng. Thời gian một dòng của hai hệ 625 và 525 bằng 64 ms và 63,56 ms (hệ 625 có thời gian lớn hơn), trong khi thời gian tích cực của một dòng trong hệ 625 là 52 ms. Nếu cả hai hệ đều lấy thời gian tích cực bằng 52 ms, thời gian xoá dòng tương ứng với từng hệ là 12 ms và 11,59 ms thông số cơ bản đối với mỗi hệ là: Tổng số mẫu mỗi dòng: Hệ 625 dòng: 64 x 13,5 =864 mẫu. Hệ 525 dòng: 63,56 x 13,5 = 858 mẫu Số mẫu trong thời gian tích cực của mỗi dòng: Hệ số 625 dòng: 52 x 13,5 = 702mẫu Hệ 525 dòng : 52 x 13,5 = 702 mẫu Số mẫu trong thời gian xoá dòng: Hệ 625 dòng : 12 x 13,5 = 162 mẫu Hệ 525 dòng : 11,56 x 13,5 = 156 mẫu. III.2.3.Cấu trúc mẫu (sample) Tín hiệu hình ảnh từ camera và được hiển thị trên ảnh hình chứa thông tin về đồng bộ theo mành và dòng, đó là ảnh hai chiều. Vì vậy để khôi phục chính xác ảnh, tần số lấy mẫu phải có liên quan đến tần số dòng. Các kết quả nghiên cứu cho thấy, tần số lấy mẫu phải là bội số của tần số dòng. Khi đó điểm lấy mẫu trên các dòng quét sẽ thẳng hàng với nhau, do đó tránh được các hiệu ứng méo đường biên. Như vậy, việc lấy mẫu không những phụ thuộc vào thời gian mà còn phụ thuộc vào toạ độ các điểm lấy mẫu. Vị trí các điểm lấy mẫu hay cấu trúc lấy mẫu được xác định theo thời gian, theo các dòng và theo các mành. Hàm lấy mẫu có thể biến đổi dạng xq(t,x,y). Tần số lấy mẫu phù hợp với cấu trúc lấy mẫu sẽ cho phép khôi phục hình ảnh tốt nhất. Vì vậy tần số lấy mẫu phải thích hợp theo cả 3 chiều t,x,y. Tuy nhiên, trong các cấu trúc lấy mẫu phổ biến, ta chỉ xét các mẫu theo 2 chiều x,y. Có 3 dạng cấu trúc được dùng phổ biến cho tín hiệu Video: III.2.3.1.Cấu trúc trực giao. Các mẫu được sắp xếp trên các dòng kề nhau thẳng hàng theo chiều đứng. Cấu trúc này cố định theo mành và theo ảnh (hai mành). Trong trường hợp này tần số lấy mẫu thoả mãn định lý Nyquist do đó tốc độ bit rất lớn được sử dụng. Dòng 1, mành 2 Dòng 2, mành 2 Dòng 2, mành 1 Dòng 1, mành 1 Hình II.2 Cấu trúc trực giao III.2.3.2.Cấu trúc “quincunx” mành. Đối với cấu trúc quincunx mành, các mẫu trên các dòng kề nhau thuộc một mành xếp thẳng hàng theo chiều đứng (trực giao), nhưng các mẫu thuộc mành một lại dịch đi nữa chu kỳ lấy mẫu so với các mẫu của mành thứ hai. Dòng 1, mành 2 Dòng 2, mành 2 Dòng 2, mành 1 Dòng 1, mành 1 Hình II.3. Cấu trúc quinncunx mành Phân bố phổ tần cấu trúc quinncunx mành rất có ý nghĩa với mành 1, nó cho phép giảm tần số lấy mẫu theo dòng. Phổ tần của cấu trúc nói trên của mành 2 so với phổ của mành 1 bị dịch đi và có thể lồng với phổ tần cơ bản, gây ra méo ở các chi tiết ảnh (khi hình ảnh có các sọc đứng). III.2.3.3.Cấu trúc “quinncunx” dòng. Các mẫu trên các dòng kề nhau của một mành sẽ lệch nhau nửa chu kỳ lấy mẫu, còn các mẫu trên một dòng của mành 1 sẽ lệch so với mẫu của dòng tiếp theo của mành 2 một nửa chu kỳ lấy mẫu. ở đây không xảy ra trường hợp lồng phổ biên với phổ chính và không bị méo. Điều đó cho phép sử dụng tần số lấy mẫu nhỏ hơn 25% tần số Nyquist, và tiết kiệm được phổ biến của tín hiệu số. Dòng 1, mành 2 Dòng 2, mành 2 Dòng 2, mành 1 Dòng 1, mành 1 Hình II.4. Cấu trúc quincunx dòng. Tuỳ theo cấu trúc lấy mẫu, sẽ xuất hiện méo ảnh đặc trưng. Đối với cấu trúc trực giao, độ phân giải của ảnh sẽ giảm. Đối với cấu trúc quincunx mành sẽ xuất hiện nhấp nháy các điểm ảnh.Ngược lại cấu trúc quincunx dòng sẽ xuất hiện các vòng tròn theo chiều ngang (méo đường biên). Tóm lại cấu trúc trực giao cho chất lượng ảnh cáo nhất, vì đối với mắt người thì độ phân giải thấp dễ chịu hơn là hai loại méo nêu trên. II.2.4. Các chuẩn lấy mẫu tín hiệu Video. Quá trình lấy mẫu là bước đầu tiên của việc số hoá tín hiệu Video , trước hết ta tìm hiểu về một vài tiêu chuẩn lấy mẫu. Có nhiều tiêu chuẩn Video số thành phần, điểm khác nhau cơ bản giữa chúng ở tỷ lệ giữa tần số lấy mẫu và phương pháp lấy mẫu tín hiệu chói và các tín hiệu màu, trong đó bao gồm: tiêu chuẩn 4:4:4, 4:2:2, 4:4:0, 4:1:1. Dưới đây ta xét phương thức từng chuẩn. Tốc độ lấy mẫu dựa trên cơ sở tần số chuẩn là 3,375 MHz. III.2.4.1.Chuẩn 4:4:4 Mẫu tín hiệu chỉ được lấy đối với các phần tử tích cực của tín hiệu Video . Với hệ PAL, mà hình được chia làm 625 x 720 điểm (pixel). Điểm lấy mẫu tín hiệu chói Y Điểm lấy mẫu màu đỏ CR Điểm lấy mẫu màu lam CB Hình II.5. Tiêu chuẩn 4:4:4. Các tín hiệu chói (Y), tín hiệu hiệu màu (CR, CB) được lấy mẫu tại tất cả các điểm lấy mẫu trên dòng tích cực của tín hiệu Video. Cấu trúc lấy mẫu là cấu trúc trực giao, ví trị lấy mẫu như trình bày trong hình vẽ trên đây: Tiêu chuẩn 4:4:4 có khả năng khôi phục hình ảnh chất lượng tốt nhất trong các tiêu chuẩn, thuận tiện cho việc xử lý tín hiệu. Tiêu chuẩn này có thể dùng trong trường hợp xử lý tín hiệu chói và tín hiệu màu RGB. Nó có thể được dùng trong studio nhằm rời rạc hoá tín hiệu. Tuy nhiên tiêu chuẩn này sẽ đòi hỏi tốc độ bit rất cao. Các tổ chức tiêu chuẩn quốc tế đã thống nhất về chỉ tiêu tần số lấy mẫu cho truyền hình số theo tiêu chuẩn này với tên gọi là CCIR-601. Với chuẩn 4:4:4 tốc độ dòng dữ liệu (ví dụ cho hệ PAL) được tính như sau: *Khi lấy mẫu 8 bit: (720 + 720 + 720) x 576 x 8 x 25 = 249 Mbit/s *Khi lấy mẫu 10 bit: (720 + 720 + 720) x 576 x 10 x 25 = 311 Mbit/s III.2.4.2.Chuẩn 4:2:2. Điểm lấy mẫu tín hiệu chói Y Điểm lấy mẫu màu đỏ CR Điểm lấy mẫu màu lam CB Hình II.6. Tiêu chuẩn 4:2:2. Điểm đầu lấy mẫu toàn bộ ba tín hiệu : chói (Y) và hiệu màu (CR, CB) Điểm kế tiếo chỉ lấy mẫu tín hiệu chói Y, còn hai tín hiệu hiệu màu không lấy mẫu. Khi giải mã màu suy ra từ màu của điểm ảnh trước. Điểm sau nữa là lấy mẫu đủ ba tín hiệu Y, CR, CB Tuần tự như thế, cứ 4 lần lấy mẫu tín hiệu chói Y, thì hai lần lấy mẫu CR, hai lần lấy mẫu CB tạo nên cơ cấu 4:2:2. Đối với hệ PAL tốc độ dòng dữ liệu theo chuẩn này được tính như sau: *Khi lấy mẫu 8 bit: (720 + 360 + 360) x 576 x 8 x 25 = 166 Mbit/s *Khi lấy mẫu 10 bit: (720 + 360 + 360) x 576 x 10 x 25 = 207 Mbit/s Tiêu chuẩn 4:2:2 là tiêu chuẩn cơ bản của truyền hình số. Chất lượng hình ảnh của tiêu chuẩn này cao hơn sau tiêu chuẩn 4:4:4. Nó cho phép xử lý tín hiệu một cách thuận lợi. III.2.4.3.Chuẩn 4:2:0. Theo chuẩn này, tín hiệu Y được lấy mẫu tại tất cả các điểm ảnh của dòng, còn tín hiệu hiệu màu thì cứ cách một điểm sẽ lấy mẫu cho một tín hiệu hiệu màu. Tín hiệu hiệu màu được lấy xen kẽ, nếu hàng chẵn lấy mẫu cho tín hiệu hiệu màu CR thì dòng lẻ sẽ lấy mẫu cho tín hiệu hiệu màu CB. Điểm lấy mẫu tín hiệu chói Y Điểm lấy mẫu màu đỏ CR Điểm lấy mẫu màu lam CB Hình II.8. Tiêu chuẩn 4:2:0. Đối với hệ PAL tốc độ dòng dữ liệu theo chuẩn này được tính như sau: *Khi lấy mẫu 8 bit: (720 + 360) X 576 X 8 X 25 = 124,4 Mbit/s *Khi lấy mẫu 10 bit: (720 + 360) X 576 X 10 X 25 = 155,5 Mbit/s III 2.4.4. Chuẩn 4:1:1 Điểm ảnh đầu lấy màu đủ Y, CR, CB: ba điểm ảnh tiếp sau chỉ lấy Y không lấy mẫu CR, CB. Khi giải mã màu của ba điểm ảnh sau phải suy ra từ điểm ảnh đầu. Tuần tự như thế, cứ bón lần lấy mẫu Y, có một lần lấy mẫu CB ,một lần lầy mẫu CB đây là cơ cấu 4:1:1 Điểm lấy mẫu tín hiệu chói Y Điểm lấy mẫu màu đỏ CR Điểm lấy mẫu màu lam CB Hình II.8 Tiêu chuẩn 4:1:1 Đối với hệ PAL, tốc độ dòng dữ liệu theo chuẩn này được tính như sau: *Khi lấy mẫu 8 bit: (720 + 180 + 180) X 576 X 8 X 25 = 124,4 Mbit/s *Khi lấy mẫu 10 bit: (720 + 180 + 180) X 576 X 10 X 25 = 155,5 Mbit/ Tiêu chuẩn này cho chất lượng hình ảnh tương đối thấp, thường được dùng cho điện thoại truyền hình. Chương II. Nén ảnh số. I.Mục đích nén. Với kỹ thuật số hoá truyền hình, tốc độ truyền và do vậy dải thông truyền là quá lớn. Do vậy đòi hỏi độ rộng kênh truyền là rất lớn. Ví dụ: tín hiệu Video số thành phần (số hoá 8 bit – 625 dòng ) có tốc độ bit bằng 216 Mbit/s. Dải phổ cần thiết để truyền tín hiệu này có bề rộng không dưới (3/4)x216 ằ 162 MHz . Nếu truyền qua vệ tinh băng C với tiêu chuẩn 40 MHz/ 1 Transponder thì phải cần 4 Transponder ghép liền nhau. Trong Studio truyền tín hiệu bằng cáp, rắc nối chất lượng cao và với khoảng cách ngắn, việc nén dải tần chỉ mang tính kinh tế, nên việc truyền tín hiệu có thể thực hiện được mà không cần nén. Song sẽ rất khó khăn, thậm chí không thể thực hiện được việc truyền tín hiệu Video số qua vệ tinh với độ rộng dải tần một kênh 27 MHz hoặc qua hệ thống truyền hình quảng bá trên mặt đất với tiêu chuẩn 7 á8 MHz cho một kênh truyền hình tiêu chuẩn. Do vậy nén Video là công đoạn không thể thiếu được để khắc phục những khó khăn về yêu cầu dải băng tần cho phép. II.Thực chất của nén Video. Bản chất của nén Video là một quá trình trong đó lượng số liệu (data) biểu diễn lượng thông tin của một ảnh hoặc nhiều ảnh được giảm bớt bằng cách loại bỏ những số liệu dư thừa trong tín hiệu Video. Các chuỗi ảnh truyền hình có nhiều phân tử giống nhau. Vậy tín hiệu truyền hình có chứa nhiều dữ liệu dư thừa, ta có thể bỏ qua mà không làm mất thông tin hình ảnh. Đó là quá trình xoá dòng ,xoá mành, vùng ảnh tĩnh hoặc chuyển động rất chậm, vùng ảnh nền giống nhau hoặc khác nhau rất ít. Thường thì chuyển động trong ảnh truyền hình có thể dự báo, do đó chỉ cần truyền các thông tin chuyển động. Các phần tử lân cận trong ảnh giống nhau, do đó chỉ cần truyền các thống tin biến đổi. Các hệ thống nén sử dụng đặc tính này của tín hiệu Video và các đặc trưng của mắt người (là kém nhạy với sai số trong hình ảnh có nhiều chi tiết và các phần tử chuyển động). Quá trình sau nén là giãn ảnh để tạo lại ảnh gốc hoặc một xấp xỉ ảnh gốc. II.1.Mô hình nén ảnh. Tầng đầu tiên của bộ mã hoá Video , tín hiệu Video được trình bày dưới dạng hiệu quả để nén hiệu quả nhất. Điểm cốt yếu là phải xác định cái gì được mã hoá. Sự biểu diễn có thể chứa nhiều mẩu thông tin để mô tả tín hiệu hơn chính là bản thân tín hiệu, nhưng hầu hết các thông tin quan trọng chỉ tập trung trong một phần nhỏ của sự mô tả này. Trong cách biểu diễn hiệu quả, chỉ có phần nhỏ dữ liệu là cần thiết để truyền cho việc tái tạo lại tín hiệu Video. Biểu diễn thuận lợi Lượng tử hoá Gán từ mã Nguồn Xử lý kênh Giải từ mã Giải lượng tử Biểu diễn thuận lợi Giải mã Video Mã mã Video Video khôi phục Hình II.9. Mô hình hệ thống nén Video Hoạt động thứ hai của bộ mã hoá là lượng tử hoá giúp rời rạc hoá thông tin được biểu diễn. Để truyền tín hiệu Video qua một kênh số, những thông tin biểu diễn được lượng tử hoá thành một số hữu hạn mức. ở công đọan này xảy ra sai số, sai số này được gọi là sai số hệ thống. Hoạt động thứ ba là gán các từ mã . Các từ mã này là một chuổi các bít dùng để biểu diễn các mức lượng tử hoá. Các quá trình sẽ ngược lại trong bộ giải mã Video. Mỗi hoạt động cố gắng loại bỏ phần dư thừa trong tín hiệu Video và lợi dụng sự giới hạn của hệ thống nhìn của mắt người, Nhờ bỏ đi phần dư thừa, các thông tin giống nhau hoặc có liên quan đến nhau sẽ không được truyền đi. Những thông tin bỏ đi mà không ảnh hưởng đến việc nhìn cũng sẽ không được truyền đi. II.2. Độ dư thừa dữ liệu. Nén số liệu là quá trình giảm lượng số liệu cần thiết để biểu diễn cùng một lượng thông tin cho trước. Cần phải phân biệt giữa số liệu và thông tin . Thực tế giữa số liệu và thông tin không đồng nhất với nhau. Số liệu (và do đó là tín hiệu) chỉ là phương tiện để truyền tải thông tin. Cùng một lượng thông tin cho trước có thể biểu diễn bằng các lượng số liệu khác nhau, nó bao gồm số liệu hoặc từ không cho thông tin thích hợp lẫn xác định đã biết. Độ dư thừa số liệu là trung tâm trong nén ảnh số. Độ dư thừa dữ liệu không phải là một khái niệm trừu tượng mà là một thực tế có thể định lượng được bằng toán học. Nếu r1 và r2 là lượng số liệu trong hai tập hợp số liệu cùng được dùng để biểu diễn một lượng thông tin cho trước thì độ dư thừa số liệu tương đối của tập hợp số liệu thứ nhất so với hợp số liệu thứ hai có thể được định nghĩa như sau: RD= 1- 1/CN Trong đó CN thường được gọi là tỷ số nén và CN = r1/r2. Trong trường hợp r1=r2 thì CN= 1 và RD= 0, có nghĩa là so với tập hợp số liệu thứ hai thì tập hợp số liệu thứ nhất không dư thừa. Khi r2<<r1 thì CN tiến tới vô cùng và RD tiến tới 1, có nghĩa là độ dư thừa số liệu tương đối của tập hợp số liệu thứ nhất là khá lớn hay tập hợp số liệu thứ hai đã được nén quá nhỏ. ở đây có sự kết hợp giữa tỷ lệ nén và chất lượng hình ảnh. Tỷ lệ nén càng cao sẽ làm giảm chất lượng hình ảnh và ngược lại. Chất lượng và quá trình nén có thể thay đổi tùy theo đặc điểm của hình ảnh nguồn và nội dung ảnh. Đánh giá chất lượng ảnh, người ta tính số bit cho một điểm trong ảnh nén (Nb). Nó được xác định là tổng số bit ở ảnh nén chia cho tổng số điểm: Nb= Số bit nén/ số điểm Trong nén ảnh số có ba loại dư thừa số liệu. II.2.1.Dư thừa mã (Coding Redundancy). Nếu các mức của tín hiệu Video được mã hoá bằng các Symbol nhiều hơn cần thiết thì kết quả có độ dư thừa mã. Để giảm độ dư thừa mã, trong nén ảnh thường sử dụng các mã có độ dài thay đổi (VLC) như mã Huffman, mã RLC.. Lượng thông tin về hình ảnh có xác xuất cao sẽ được mã hoá bằng từ mã ít bit hơn so với lượng thông tin có xác xuất thấp hơn. II.22.Dư thừa trong pixel (Interpixel Redundancy). Vì giá trị của bất kỳ pixel nào đó, cũng có thể được dự báo từ các pixel lân cận nó, nên thông tin từ các pixel riêng là tương đối nhỏ. Sự tham gian của một pixel riêng vào ảnh là dư thừa. Nhiều tên (bao gồm: dư thừa không gian, dư thừa hình học, dư thừa trong ảnh) được đặt ra để phân biệt sự phụ thuộc này của pixel. Ta dùng độ dư thừa pixel để chỉ tất cả các tên trên. Để giảm độ dư thừa trong pixel của một ảnh, dãy pixel hai chiều dùng cho việc nhìn và nội suy phải được biến đổi thành một dạng có hiệu quả hơn. Trong các phương pháp nén ảnh người ta thường sử dụng phương pháp biến đổi Cosin rời rạc (DCT) để biến đổi pixel từ miền không gian sang miền tần số, bằng cách này sẽ giảm được độ dư thừa dữ liệu trong pixel ở miền tần số cao. II.2.3.Dư thừa tâm sinh lý. Bẳng trực quan ta thấy, sự thu nhận cường độ sáng của mắt người thay đổi chỉ giới hạn trong một phạm vi nhất định. Hiện tượng này xuất phát từ sự thật là mắt không đáp ứng với cùng độ nhạy của các thông tin nhì thấy. Thông tin đơn giản có tầm quan trọng ít hơn thông tin khác trong vùng nhìn thấy. Thông tin này được gọi là độ dư thừa tâm sinh lý nhìn. Nó có thể được loại bỏ mà không ảnh hưởng đáng kể đến chất lượng ảnh. Khác với độ dư thừa mã và độ dư thừa trong pixel, độ dư thừa tâm sinh lý có liên quan đến thông tin định hướng, nó quan trọng tới việc lượng tử hoá. Điều đó có nghĩa là ánh xạ một khoảng cách rộng các giá trị đầu vào lên một số hữu hạn các giá trị đầu ra. Đó là toán tử không đảo ngược (mất thông tin) cho kết quả nén số liệu có tổn hao. III.Các phương pháp nén. Các hệ thống nén là sự phối hợp của rất nhiều các kỹ thuật xử lý nhằm giảm tốc độ bit của tín hiệu số mà vẫn đảm bảo chất lượng ảnh. Có 2 kỹ thuật nén là nén không tổn hao và nén có tổn hao. III.1.Nén không tổn hao. Nén không tổn hao là quá trình nén không mất thông tin, cho phép phục hồi lại đúng tín hiệu ban đầu sau khi giải nén. Đây là quá trình mã hoá có tính thuận nghịch. Hệ số nén phụ thuộc vào chi tiết ảnh được nén. Hệ số nén của phương pháp này luôn nhỏ hơn 2:1 Các kỹ thuật nén không mất thông tin bao gồm: III.1.1.Mã hóa với độ dài từ mã thay đổi (VLC) Phương pháp này còn được gọi là mã hoá Huffman và mã hoá entropy, dựa trên tính thống kê của tín hiệu, khả năng xuất hiện của các giá trị biên độ trùng hợp trong một bức ảnh và thiết lập một từ mã ngắn cho các từ mã có tần suất hiện cao nhất, và từ mã dài cho các giá trị còn lại. Khi thực hiện giải nén, các thiết lập mã trùng hợp sẽ được sử dụng để tạo lại giá trị tín hiệu ban đầu. Mã hoá và giải mã Huffman có thể được thực hiện một cách dễ dàng bằng cách sử dụng các bảng tìm kiếm. III.1.2.Mã hoá với độ dài của từ mã động (RLC) Phương pháp này dựa trên sự lặp lại của cùng một giá trị mẫu để tạo ra các mã đặc biệt biểu diễn sự bắt đầu và kết thúc của giá trị được lặp lại. Chỉ có các mẫu có giá trị khác 0 mới được mã hoá. Số mẫu có giá trị bằng 0 sẽ được truyền đi dọc theo cùng dòng quét. Cuối cùng, các chuổi 0 được tạo ra bằng quá trình giải tương quan như phương pháp DCT hay DPCM. III.1.3.Sử dụng khoảng xoá dòng và mành. Vùng thông tin xoá được loại bỏ khỏi dòng tín hiệu để truyền đi vùng thông tin tích cực của ảnh. Theo phương pháp này, thông tin xoá dòng và mành sẽ không được ghi giữ và truyền đi. Chúng được thay bằng các dữ liệu đồng bộ ngắn hơn tuỳ theo ứng dụng. II.1.4.Biến đổi cosin rời rạc (DCT) Quá trình DCT thuận nghịch được coi là không mất thông tin nếu độ dài từ mã hệ số 13 hoặc 14 băng tần đối với dòng Video số sử dụng 8 bit biểu diễn mẫu. Nếu độ dài từ mã hệ số nhỏ hơn hệ số của phép biến đổi DCT nhỏ hơn thì quá trình này trở nên có mất thông tin. Trong kỹ thuật truyền hình, để nén có hiệu quả người ta thường kết hợp hai phương pháp nén không tổn hao với nén có tổn hao. III.2.Nén có tổn hao. Nén có tổn hao chấp nhận mất mát một ít thông tin để gia tăng hiệu quả nén, nó rất thích hợp với nguồn thông tin là hình ảnh và âm thanh. Nó cho tỷ lệ nén ảnh cao để có thể truyền dẫn, phát sóng. Đồng thời cũng cho một tỷ lệ nén thích hợp cho xử lý và lưu trữ ảnh trong studio. Nén tổn hao thực hiện theo 3 bước: -Bước 1: biến đổi tín hiệu từ miền thời gian sang miền tần số bằng cách sử dụng các thuật toán biến đổi cosin rời rạc DCT. Bước này thực hiện việc giảm độ dư thừa của pixel trong ảnh, tuy nhiên quá trình này không gây tổn hao tín hiệu. -Bước 2: Thực hiện lượng tử hoá các hệ số DCT, làm tròn các số liệu. Việc mất mát số hiệu xảy ra ở giai đoạn làm trơn này. -Bước 3: Nén số liệu đã biến đổi và làm trơn bằng cách mã hoá entropy, ở đây dùng các mã không tổn hao như mã Huffman, RLC... IV.Các loại mã dùng trong nén. I.1.Mã RLC (Run – length Coding). RLC là loại mã xây dựng trên cơ sở sử dụng số lần lặp lại của các điểm ảnh. RLC tách chuỗi các giá trị giống nhau và biểu diễn như là một tổng. Khi dãn giá trị này tạo lại số lần biểu diễn tổng. Kỹ thuật này chỉ có thể áp dụng cho các chuỗi symbol tuyến tính. Do đó, khi áp dụng cho số hiệu ảnh hai chiều, hình ảnh được tách thành một chuỗi các dòng quét. Một loại cải biên của mã RLC là mã VLC (mã có độ dài thay đổi được), mã này dùng để biểu diễn các giá trị symbol cũng như độ dài chạy. Cách thực hiện là tính phân bố xác suất của các độ dài chạy và các giá trị symbol. RLC không thích hợp trực tiếp cho các ảnh tự nhiên có tông ảnh liên tục được mã hoá bằng một quá trình số hoá tuyến tính, vì RLC phải nén tập số liệu có bước chạy tương đối lớn giống nhau, trong khi đó ảnh có tông liên tục có tần số không gian thấp, việc thay đổi các vùng rộng được làm đầy bằng các giá trị pixel giống nhau là tương đối nhỏ. RLC tự nó sẽ không cho các mức nén có ý nghĩa. RLC được dùng kết hợp với các kỹ thuật khác như các chuẩn nén JPEG, MPEG sẽ cho kết quả nén tốt. RLC được dùng cho các hệ số lượng tử hoá tốt hơn là dùng trực tiếp cho số liệu ảnh. II.2.Mã Shannon-Fano. Mã này dựa trên xác suất xuất hiện của những symbol nguồn bên trong một lượng thông tin. Phương pháp này sử dụng những từ mã có độ dài thay đổi để mã hoá các symbol nguồn thông qua xác suất của chúng. Với những symbol có xác suất xuất hiện càng lớn thì từ mã dùng để mã hoá chúng càng ngắn. II.3.Mã Huffman. Mã Huffman thuộc loại mã entropy hoặc mã thống kê. Tư tưởng chính là dùng mã VLC, sử dụng ít bit để mã hoá các giá trị hay xảy ra, và nhiều bit để mã hoá các giá trị xảy ra. Từ đó tốc độ bit sẽ giảm đáng kể. Nói chung, mã Huffman sẽ đạt hiệu suất thấp nếu xác suất xuất hiện các phần tử gần nhau. Ngược lại hiệu suất cao nếu xác suất xuất hiện cách xa nhau. Trên thực tế mã Huffman được phát triển trên một tập ảnh, nhưng sau đó được áp dụng trên các ảnh khác, mỗi ảnh có phân bố xác suất symbol riêng của nó. Do đó, mã Huffman không cần tối ưu cho ảnh đặc biệt nào. III.4.Mã dự đoán (DPCM) Phương pháp mã dự đoán hay còn gọi là điều xung mã vi sai (DPCM). Phương pháp này không mã hoá biên độ thông tin ở mỗi mẫu, mà chỉ mã hoá các thông tin có biên độ chênh lệch giữa mẫu đã cho và mẫu dự báo. Do phân bố chênh lệch về biên độ điểm ảnh có đồ thị hình chuông xung quanh điểm 0. Nếu dựa trên các đặc trưng thống kê ảnh, thì sự khác nhau này là không lớn lắm, do vậy để mã hoá nó chỉ cần giảm một số ít bit là đủ. Phương pháp mã hoá dự đoán còn sử dụng đặc điểm của mắt người và cho phép dùng đặc trưng phi tuyến về lượng tử hoá. Sau đây là sơ đồ mã hoá và giải mã DPCM. Sơ đồ bộ mã hoá: Bộ lượng tử Mã hoá entropy Kênh Bộ dự đoán Tín hiệu Video số ồ e e ồ + - P V’ + - Sơ đồ bộ giải mã Giải mã entropy Đầu ra giải mã Bộ dự đoán Kênh tín hiệu ồ eq + - P + V’ Nhằm tránh các lỗi có thể xuất hiện trong khi truyền, một mẫu đầy đủ được gửi đi theo chu kỳ nhất định, cho phép cập nhật được các giá trị chính xác. Mã hoá DPCM cũng sử dụng thêm các kỹ thuật dự đoán và lượng tử hoá thích nghi để hoàn thiện thêm kỹ thuật nén này. II.4.1.DPCM trong mành (intraframe DPCM). Tín hiệu dự báo được tạo từ các mẫu nằm trong cùng một mành, các mẫu được biến đổi nằm trên cùng một dòng quét (mã giưa các pixel) và cùng với các dòng quét lân cận (mã giữa các dòng). Việc tạo tín hiệu dự báo của DPCM trong mành dựa trên mối liên kết giữa các điểm ảnh. Các công trình nghiên cứu cho thấy hệ số liên kết giảm nhanh khi đi xa điểm ảnh quan sát theo chiều ngang (các pixel trên cùng một dòng) và theo chiều đứng (các pixel của dòng kề nhau). Do đó khi tạo tín hiệu dự báo cần chú ý đến các mẫu tín hiệu nằm kề nhau. Tín hiệu dự báo có thể là hàm tuyến tính hoặc có thể là hàm phi tuyến của các mẫu lân cận. Việc tạo tín hiệu dự báo phi tuyến đòi hỏi thiết kế mạch phức tạp hơn, do đó trong thực tế không dùng cho tín hiệu Video. III.4.2. DPCM giữa các mành. Tín hiệu dự báo được tạo trên cơ sở các mẫu nằm ở các mành kề nhau trước đó. Phương pháp DPCM giữa các mành tận dụng quan hệ chặt chẽ giữa các mành kề nhau của ảnh và đặc trưng của mắt (nhạy méo với ảnh tĩnh hơn ảnh động). Nghiên cứu thống kê về cấu trúc ảnh cho thấy rằng sự khác nhau giữa các ảnh kề nhau là không lớn lắm. Để tạo lại một ảnh trung thực chỉ cần truyền các điểm ảnh làm biến đổi và khôi phục lại (tại phiá thu) tất cả các điểm ảnh còn lại từ mành trước hoặc ảnh trước trong bộ nhớ. Phương pháp DPCM giữa các mành thuận lợi cho truyền hình thoại. Vì tín hiệu truyền hình thoại có đặc điểm là ảnh chuyển động ít, tốc độ chuyển động chậm, do đó vùng ảnh rộng, ít hay đổi giữa các mành kề nhau. Phương pháp cơ bản của DPCM giữa các mành là mã hoá trực tiếp vi sai giữa các mành kề nhau. Đặc trưng lượng tử là phi tuyến nên sự chênh lệch nhỏ giữa các mức sẽ được khôi phục với độ chính xác cao hơn so với mức chênh lệch lớn. Điều đó khẳng định việc khôi phục một cách chính xác các vùng ảnh rộng, chuyển động chậm (mà trên đó tất cả các méo rất dễ nhận biết). Ngược lại, tại vùng ảnh có nhiều chuyển động, khi khôi phục lại sẽ kém chính xác hơn vì do đặc điểm của mắt người, độ phân giải của ảnh có thể thấp hơn. Các loại DPCM thường dùng nhất: III.4.2.1.Intraframe DPCM. Đây là phương pháp lấy mẫu từ phần ảnh chuyển động, chỉ truyền các phần ảnh chuyển động và khôi phục các điểm ảnh còn lại bằng trị trung bình các ảnh được truyền. III4.2.2.Phương pháp làm đầy có chọn lọc (Selective replenishment) Phương pháp đan chéo các mành còn gọi là phương pháp làm đầy có chọn khi ảnh truyền ít chuyển động và tốc độ thấp. Phương pháp này dựa trên nguyên tắc chỉ truyền phần điểm ảnh được chọn ở mỗi mành và nhận ảnh có độ chiếu sáng lâu. III.4.2.3 Phương pháp chia thành những phần ảnh chuyển động và tĩnh. Phương pháp này là sự kết hợp của phương pháp làm đầy có chọn lọc và phương pháp lấy mẫu từng phần trong ảnh chuyển động cùng với DPCM giữa mành với dự báo 1 phần tử. Mỗi ảnh được chia thành phần tử chuyển động và phần tử tĩnh, đối với phần ảnh tĩnh dùng phương pháp làm đầy có chọn lọc; đối với các phần tử ảnh động thì sử dụng phương pháp lấy mẫu từng phần. III.5.Mã chuyển vị (Transform Coding). Đối với việc mã hoá riêng rẽ từng điểm một sẽ không đạt được hiệu quả bởi vì không tận dụng hết được mối quan hệ giưã các khối điểm trong ảnh số. Phương pháp mã chuyển vị là một cách có hiệu quả trong việc mã hoá khối điểm thông qua biến đổi tuyến tính các điểm này thành các hệ số chuyển vị và mã hoá các hệ số chuyển vị đó. Trong hệ thống PCM (tuyến tính) và DPCM người ta căn cứ vào biên độ tín hiệu để thực hiện, còn trong mã chuyển vị thì dựa vào việc chuyển đổi tin hiệu từ

Các file đính kèm theo tài liệu này:

  • docTruyenH sovetinh-88.DOC