Đồ án Nén tín hiệu trong truyền hình số

MỤC LỤC

LỜI NÓI ĐẦU 4

PHẦN I: TỔNG QUAN VỀ TRUYỀN HÌNH 5

CHƯƠNG I: TRUYỀN HÌNH ĐEN TRẮNG 5

1.1.Sơ đồ tổng quát của hệ thống truyền hình đen- trắng 5

1.2.Đặc điểm máy thu hình 6

CHƯƠNG II: TRUYỀN HÌNH MÀU 10

2.1.Nguyên lý truyền hình màu 10

2.1.1. Sơ đồ khối hệ thống truyền hình màu 10

2.1.2.Sơ đồ khối máy thu hình màu. 12

2.2.Các hệ truyền hình màu 14

2.2.1. Hê truyền hình màu NTSC 14

2.2.2. Hệ truyền hình màu PAL 14

2.2.3.Hệ truyền hình màu SECAM 15

CHƯƠNG III: TRUYỀN HÌNH SỐ 16

3.1 Khái niệm truyền hình số 16

3.2. Đặc điểm của thiết bị truyền hình số. 18

PHẦN II: CÁC VẤN ĐỀ SỐ HOÁ TÍN HIỆU TRUYỀN HÌNH 21

CHƯƠNG I: CÁC VẤN ĐỀ SỐ HOÁ TÍN HIỆU VIDEO 21

1.1. Số hoá tín hiệu video. 21

1.1.1. Biến đổi tương tự sang số. 21

1.1.2. Tín hiệu video và biến đổi tín hiệu video. 23

1.2. Lấy mẫu tín hiệu video. 24

1.2.1. Quan hệ toán học. 24

1.2.2 Chọn tần số lấy mẫu: 27

1.2.3. Cấu trúc lấy mẫu. 30

1.2.4. Các thông số lấy mẫu tối ưu. 32

1.3. Lượng tử hoá tín hiệu video. 33

1.3.1. Lượng tử hoá tín hiệu . 33

1.3.2.Nhiễu do lượng tử hoá tín hiệu. 34

1.4. Mã hoá tín hiệu video . 35

1.4.1. Mã hoá tín hiệu rời rạc. 35

1.4.2. Các loại mã. 35

CHƯƠNG II: CÁC VẤN ĐỀ SỐ HOÁ TÍN HIỆU AUDIO. 38

2.1. Số hoá tín hiệu audio. 38

2.1.1. Số hoá tín hiệu audio. 38

2.1.2. Truyền tín hiệu âm thanh trong tín hiệu video. 39

PHẦN III: NÉN TÍN HIỆU TRONG TRUYỀN HÌNH SỐ 41

CHƯƠNG I: TỔNG QUAN VỀ NÉN. 41

1.1. Mở đầu. 41

1.2. Mô hình nén ảnh. 42

1.3. Các đặc điểm của nén tín hiệu số. 43

1.3.1.Xác định hiệu quả của quá trình nén tín hiệu số. 43

1.3.2. Độ dư thừa số liệu. 43

1.3.3. Sai lệch bình phương trung bình 44

1.4. Lí thuyết thông tin Entropy . 44

1.5. Các phương pháp nén. 45

1.5.1. Nén không tổn hao. 46

1.5.2. Nén có tổn hao 47

CHƯƠNG II: CÁC DẠNG MÃ HOÁ SỬ DỤNG TRONG CÔNG NGHỆ NÉN 48

2.1. Mã RLC (Run Length coding). 48

2.2. Mã shannon. 48

2.3. Mã huffman. 48

2.4. Phương pháp mã dự đoán (DPCM). 48

2.5. Phương pháp chuyển vị. 49

CHƯƠNG III: MỘT SỐ CÔNG NGHỆ NÉN VIDEO. 50

3.1. Nén Video công nghệ điều xung mã vi sai – DPCM. 50

3.1.1. Xử lý giải tương hỗ trong công nghệ DPCM. 50

3.1.2. Kỹ thuật tạo dự báo. 51

3.1.3. Lượng tử hoá sai số dự báo. 51

3.1.4. Khái niệm bù chuyển động (motion compensatio) và vecto chuyển động (motion vector). 52

3.1.5. Ước lượng chuyển động bằng phương pháp tìm kiếm khối tương đồng (Block matching). 53

3.1.6. Hệ thống DPCM có bù chuyển động. 54

3.2. Nén video công nghệ: Mã hoá chuyển đổi. 55

3.2.1. Xử lý tương hỗ trong công nghệ TC. 55

3.2.2. Biến đổi cosin rời rạc (discrete cosin transform-DCT). 56

3.2.3. Lượng tử hoá các hệ số DCT. 56

3.2.4. Quét các hệ số DCT. 58

3.2.5. Mã hoá các hệ số DCT. 59

3.2.6. Hệ thống nén video công nghệ mã hoá chuyển đổi. 59

3.3. Sự kết hợp các công nghệ nén. 61

CHƯƠNG IV: NÉN VIDEO THEO TIÊU CHUẨN MPEG. 63

4.1. Khái quát về các tiêu chuẩn nén. 63

4.2. Nén video theo MPEG -1. 64

4.2.1. Các thành phần ảnh cơ bản trong chuẩn nén MPEG. 66

4.2.2. Sự phân loại ảnh MPEG. 70

4.2.3. Tiêu chuẩn MPEG –1. 73

4.2.4. Hệ thống nén MPEG –1. 75

4.3. Nén tín hiệu video theo MPEG –2. 77

4.3.1. Cấu trúc dòng bit video MPEG –2. 79

4.3.2. Khả năng co dãn của MPEG –2. 80

4.3.3. Đặc tính và định mức (profile and level). 81

4.3.4. MPEG-2 4:2:2P@ML. 84

4.3.5. MPEG –2 đối với phát sóng và SXCT. 85

CHƯƠNG V: NÉN TÍN HIỆU AUDIO. 86

5.1. Cơ sở của nén tín hiệu audio. 86

5.1.1. Mô hình tâm lý thính giác. 86

5.1.2. Sự che lấp tín hiệu audio. 87

5.2. Công nghệ giảm tốc độ nguồn dữ liệu audio số. 89

5.3. Tiêu chuẩn nén Audio MPEG. 93

MPEG –2 94

KẾT LUẬN CHUNG. 95

THUẬT NGỮ TIẾNG ANH. 100

TÀI LIỆU THAM KHẢO 103

 

 

doc107 trang | Chia sẻ: maiphuongdc | Lượt xem: 5085 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Đồ án Nén tín hiệu trong truyền hình số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
n. 1.3.2. Độ dư thừa số liệu. Nén số liệu là quá trình giảm lượng số liệu cần thiết để biểu diễn cùng một lượng thông tin cho trước. Số liệu và thông tin không đồng nghĩa với nhau, số liệu chỉ là phương tiện dùng để truyền tải thông tin. Cùng một lượng thông tin cho trước có thể biểu diễn bằng các lượng số liệu khác nhau. Độ dư thừa số liệu là vấn đề trung tâm trong nén ảnh số. Đánh giá cho quá trình thực hiện giải thuật nén là tỷ lệ nén (CN) được xác định như sau: Nếu N1 và N2 là lượng số liệu trong hai tập hợp số liệu cùng được biểu diễn một lượng thông tin cho trước thì độ độ dư thừa số liệu tương đối RD của tập hợp số liệu thứ nhất với tập hợp số liệu thứ hai có thể được định nghĩa như sau: RD=1-1/CN Trong đó: CN=N1/N2 Trong trường hợp N1=N2 thì CN=1 và RD=0, có nghĩa là so với tập số liệu thứ hai thì tập số liệu thứ nhất không chứa số liệu dư thừa. Khi N2<<N1 thì CN tiến tới vô cùng và RD tiến tới 1, có nghĩa là độ dư thừa số liệu tương đối của tập số kiệu thứ nhất là khá lớn hay tập số liệu thứ hai đã được nén khá nhỏ. 1.3.3. Sai lệch bình phương trung bình Một đánh giá thống kê khác có thể đánh giá cho nhiều giải thuật nén là sai lệch bình phương trung bình so với ảnh gốc RMS (Root Mean square ) được tính bởi biểu thức: Trong đó: RMS – sai lệch bình phương trung bình Xi – Giá trị điểm ảnh ban đầu Xi’ – Giá trị điểm ảnh sau khi nén n - Tổng số điểm ảnh trong một ảnh RMS chỉ ra sự khác nhau thống kê giữa ảnh ban đầu và ảnh sau khi nén. Đa số trường hợp khi nén chất lượng của ảnh nén là tốt với RMS thấp. Tuy nhiên, trong một số trường hợp có thể xảy ra là chất lượng ảnh nén với RMS cao tốt hơn ảnh với RMS thấp hơn. 1.4. Lí thuyết thông tin Entropy . Trước khi nghiên cứu các phương pháp ta cần đánh giá lượng thông tin chủ yếu chứa đựng trong hình ảnh, để từ đó xác định dung lượng dữ liệu tối thiểu cần sử dụng để miêu tả, truyền tải thông tin về hình ảnh. Lượng thông tin chứa đựng trong hình ảnh tỷ lệ nghịch với khả năng xuất hiện hình ảnh. Nói cách khác, một sự kiện ít xảy ra sẽ chứa đựng nhiều thông tin hơn một sự kiện có nhiều khả năng xuất hiện. Đối với hình ảnh , lượng thông tin của một hình ảnh bằng tổng số lượng thông tin của từng phần tử ảnh (Pixel ). Lượng thông tin của từng ảnh được tính theo công thức: I(xi)=log2(1/P(xi)) = -log2P(xi) Trong đó: I(xi)= lượng thông tin của phần tử ảnh xi (được tính bằng bit ) P(xi)= Xác suất xuất hiện của phần tử ảnh xi Nếu một hình ảnh được biểu thị bằng các phần tử x1, x2, x3,… Xác suất xuất hiện của từng phần tử tương ứng sẽ là P(x1), P(x2), P(x3),… Biết được lượng tin tức của từng phần tử ảnh chưa đủ, còn cần phải biết được lượng tin tức bình quân của cả tập hợp các phần tử của hình ảnh . Lượng tin tức bình quân ấy người ta gọi là entropy. Entropy của hình ảnh là một giá trị có ý nghĩa quan trọng bởi xác định số lượng bit trung bình tối thiểu cần thiết để biểu diễn một phần tử ảnh. Trong công nghệ nén không tổn hao (Lossless Compression ) Entropy là giới hạn dưới của tỷ số bit/pixel. Nếu tín hiệu video được nén với tỷ số bit/pixel nhỏ hơn Entropy , hình ảnh sẽ bị mất thông tin và quá trình nén sẽ có tổn hao (lossy). 1.5. Các phương pháp nén. Các hệ thống nén số liệu là sự phối hợp của rất nhiều các kỹ thuật xử lý nhằm giảm tốc độ bit của tín hiệu số mà vẫn đảm bảo chất lượng hình ảnh phù hợp ứng với một ứng dụng nhất định. Nhiều kỹ thuật nén mất và không mất thông tin (loss/lossless data reduction techniques) đã được phát triển trong nhiều năm qua. Chỉ có một số ít trong chúng có thể áp dụng cho nén video số. Nén không mất thông tin Nén mất thông tin Video số DCT VLC RLC Loai bỏ khoảng xoá DPCM Lượng tử hoá Mẫu con JPEG MPEG –1 MPEG –2 Hình1.3: Sự phối hợp các kỹ thuật trong JPEG và MPEG Hình 1.3 minh hoạ kỹ thuật nén được sử dụng để tạo thành các tín hiệu nén JPEG (Joint Photographic Expert Group ) và MPEG (Moving picture Expert Group). Sử dụng các kỹ thuật này một cách riêng rẽ thực tế không đưa lại một kết quả nào về giảm tốc độ dòng tín hiệu . Tuy nhiên, phối hợp một số các kỹ thuật này sẽ đem lại những hệ thống nén vô cùng hiệu quả như hệ thống nén JPEG, MPEG-1, MPEG-2. 1.5.1. Nén không tổn hao. Nén không mất thông tin cho phép phục hồi lại đúng tín hiệu ban đầu sau khi giải nén. Đây là một quá trình mã hoá có tính thuận nghịch. Hệ số nén phụ thuộc vào chi tiết ảnh được nén. Hệ số nén của phương pháp nén không mất thông tin nhỏ hơn 2:1. Các kỹ thuật nén không mất thông tin bao gồm: a) Mã hoá với độ dài thay đổi (VLC). Phương pháp này còn được gọi là mã hoá Huffman và mã hoá Entropy, dựa trên khả năng xuất hiện của các giá trị biên độ trùng hợp trong một bức ảnh và thiết lập một từ mã ngắn cho các giá trị có tần suất xuất hiện cao nhất và từ mã dài cho các giá trị còn lại. Khi thực hiện giải nén, các thiết lập mã trùng hợp sẽ được sử dụng để tái tạo lại giá tri tín hiệu ban đầu. b) Mã hoá với độ dài động (RLC). Phương pháp này dựa trên sự lặp lại của cùng giá trị mẫu để tạo ra các mã đặc biệt biểu diễn sự bắt đầu và kết thúc của giá trị được lặp lại. Chỉ các mẫu có giá trị khác không mới được mã hoá. Số mẫu có giá trị bằng không sẽ được truyền đi dọc theo cùng dòng quét. c) Sử dụng khoảng xoá dòng, xoá mành. Vùng thông tin xoá được loại bỏ khỏi dòng tín hiệu để truyền đi vùng thông tin tích cực của ảnh. Theo phương pháp đó, thông tin xoá dòng và xoá mành sẽ không được ghi giữ và truyền đi. Chúng được thay bằng các dữ liệu đồng bộ ngắn hơn tuỳ theo ứng dụng. d) Biến đổi cosin rời rạc (DCT). Quá trình DCT thuận và nghịch được coi là không mất thông tin nếu độ dài từ mã hệ số là 13 hoặc 14 băng tần đối với dòng video số sử dụng 8 bit biểu diễn mẫu. Nếu độ dài từ mã hệ số của phép biến đổi DCT nhỏ hơn, quá trình này trở nên có mất thông tin . Trong truyền hình, phương pháp nén không tổn hao được kết hợp trong các phương pháp nén có tổn hao sẽ cho tỷ lệ nén tốt mà không gây mất mát về độ phân giải. 1.5.2. Nén có tổn hao Nén có tổn hao chấp nhận mất mát một ít thông tin để gia tăng hiệu quả nén, rất thích hợp với nguồn thông tin là hình ảnh và âm thanh. Như vậy, nén có tổn hao mới thật sự có ý nghĩa đối với truyền hình. Nó có thể cho tỷ lệ nén ảnh cao để truyền dẫn, phát sóng. Đồng thời cho một tỷ lệ nén thích hợp cho xử lí và lưu trữ ảnh trong studio. Nén tổn hao thường thực hiện theo 3 bước liên tục: -Bước 1: Biến đổi tín hiệu từ miền thời gian (không gian) sang miền tần số bằng cách sử dụng các thuật toán chuyển vị như biến đổi cosin rời rạc DCT. Bước này thực hiện việc giảm độ dư thừa của pixel trong ảnh, tuy nhiên quá trình này không gây tổn hao. -Bước 2: Thực hiện lượng tử hoá các hệ số DCT, số liệu được “làm trơn” bằng cách làm tròn. Việc mất mát số liệu xảy ra ở giai đoạn làm trơn này. Bước 3: Nén số liệu đã biến đổi và làm trơn bằng cách mã hoá Entropy , ở đây sử dụng các mã không tổn hao như mã Huffman, RLC,… CHƯƠNG II: CÁC DẠNG MÃ HOÁ SỬ DỤNG TRONG CÔNG NGHỆ NÉN 2.1. Mã RLC (Run Length coding). Sự liên tiếp lặp đi lặp lại các điểm ảnh trong ảnh số xuất hiện là do sự tương quan giữa các điểm ảnh. Từ sự lặp đi lặp lại này, một phương pháp nén đã được xây dựng trên cơ sở sử dụng tần số lặp lại của các điểm ảnh, phương pháp này được gọi là RLC. RLC tách chuỗi các giá trị giống nhau và biểu diễn như là một tổng. Khi giãn giá trị này tạo lại tần số biểu diễn tổng. Kỹ thuật này chỉ có thể áp dụng cho các chuỗi symbol tuyến tính. Do đó, khi áp dụng cho số liệu ảnh hai chiều, hình ảnh được tách thành một chuỗi các dòng quét. 2.2. Mã shannon. Theo lý thuyết thông tin của shannon thì tỷ lệ nén tốt nhất mà chúng ta có thể đạt được chính là Entropy nguồn. Vào cuối những năm 40, Shannon và Fano đã tìm ra một phương pháp nén mới và dựa trên xác suất xuất hiện của những symbol nguồn bên trong một lượng thông tin . Về cơ bản thì phương pháp này sử dụng những từ mã có độ dài thay đổi để mã hoá các symbol nguồn thông qua xác suất của chúng. Với những symbol có xác suất xuất hiện càng lớn thì từ mã dùng để mã hoá chúng càng ngắn. 2.3. Mã huffman. Mã Huffman thuộc loại mã Entropy hoặc mã thống kê. Tư tưởng chính là dùng VLC (Variable Length Coding), sử dụng ít bít để mã hoá các giá trị hay xảy ra (xác suất xuất hiện cao) và nhiều bit để mã hoá các giá trị hay xảy ra (xác suất xuất hiện thấp).Từ đó tốc độ bit sẽ giảm một cách đáng kể. 2.4. Phương pháp mã dự đoán (DPCM). Phương pháp mã dự đoán hay còn gọi là điều xung mã vi sai (DPCM-Differential Pulse Code Modulation ) không mã hoá thông tin có biên độ ở mỗi mẫu, mà chỉ mã hoá thông tin có biên độ vi sai (biên độ chênh lệch) giữa mẫu đã cho và vị trí dự báo (được tạo từ các mẫu trước đó). Phân tích thống kê về phân bố tín hiệu video , ta thấy phân bố biên độ các mẫu tương ứng với các điểm ảnh (pixel) về nguyên tắc là phân bố đều, ngược lại phân bố về độ chênh lệch biên độ các điểm ảnh có đồ thị hình chuông xung quanh điểm 0. Nếu dựa trên các đặc trưng thống kê ảnh, thì sự khác nhau này là không lớn lắm và để mã hoá nó chỉ cần giảm số bit là đủ( so với việc mã hoá toàn bộ biên độ các mẫu). Phương pháp DPCM còn sử dụng đặc điểm của mắt người ( kém nhạy với mức lượng tử có chênh lệch về độ chói giữa các điểm ảnh gần nhau, so với mức lượng tử hoá chênh lệch nhỏ), và cho phép dùng đặc trưng phi tuyến về lượng tử hoá. 2.5. Phương pháp chuyển vị. Đối với việc mã hoá riêng rẽ từng điểm một rẽ không đạt được hiệu quả bởi vì chúng ta không tận dụng được hết mối quan hệ giữa các khối điểm trong ảnh số. Phương pháp mã chuyển vị là một cách có hiệu quả trong việc mã hoá khối điểm thông qua biến đổi thông qua biến đổi tuyến tính các điểm này thành các hệ số chuyển vị và mã hoá các hệ số chuyển vị đó. Phương pháp này tập trung vào một số các hệ số chuyển vị mà không phải là các điểm ảnh của ảnh gốc và lượng thông tin chỉ trong một số ít hệ số chuyển vị. Như vậy, số bit dùng cho quá trình mã hoá sẽ ít đi. Một lý do nữa là do hệ thống thị giác của con người không thể nhận biết được hoàn toàn các chi tiết của ảnh khi các chi tiết đó biến đổi nhanh so với các biến đổi chậm, bởi vậy để mã hoá các hệ số chuyển vị ở tần số cao, ta chỉ cần một số ít bit mà chất lượng hình ảnh xem vẫn cao. CHƯƠNG III: MỘT SỐ CÔNG NGHỆ NÉN VIDEO. Hai công nghệ nén được sử dụng phổ biến nhất hiện nay là: công nghệ nén “Điều xung mã vi sai” (Differential pulse code modulation_DPCM) và “mã hoá chuyển đổi” (Transform Coding_TD). Chúng đóng vai trò quan trọng trong rất nhiều tiêu chuẩn nén như: JPEG, JBIG, MPEG. 3.1. Nén Video công nghệ điều xung mã vi sai – DPCM. Đây là một phương pháp nén ảnh quan trọng và hiệu quả. Nguyên lý cơ bản của nó là: chỉ truyền tải tín hiệu vi sai giữa mẫu đã cho và dự báo (được tạo ra từ các mẫu trước đó). 3.1.1. Xử lý giải tương hỗ trong công nghệ DPCM. Công nghệ DPCM thực hiện loại bỏ tính có nhớ và các thông tin dư thừa của nguồn tín hiệu bằng một bộ lọc đặc biệt có đầu ra là hiệu số giữa mẫu đầu vào và giá trị dự báo của chính nó. Rất nhiều giá trị vi sai này gần 0 nếu các điểm ảnh biến đổi không đều. Còn với ảnh có nhiều chi tiết, giá trị sai số dự báo có thể lớn. Khi đó có thể lượng tử hoá chúng bằng bước lượng tử cao hơn do đặc điểm của mắt người không nhạy cảm với những chi tiết có độ tương phản cao, thay đổi nhanh. Sự giảm tốc độ bit ở đây thu được từ quá trình lượng tử hoá và mã hoá. Biên độ 0 t a) Biên độ các điểm ảnh ban đầu b) Chênh lệch biên độ giữa các điểm kề cận Vùng ảnh nhiều chi tiết Vùng ảnh đồng đều Vùng ảnh đồng đều -255 255 Sai số dự báo e=V-P Hình 3.1: Sự suy giảm Ẻntropy của nguồn tín hiệu Hình vẽ sau đây minh hoạ quá trình suy giảm Entropy của nguồn tín hiệu: 3.1.2. Kỹ thuật tạo dự báo. Như đã đề cập, nếu trực tiếp lượng tử hoá các mẫu của một nguồn ảnh với đầy đủ thông tin dư thừa và quan hệ tương hỗ giữa các điểm ảnh thì hiệu suất nén sẽ rất thấp do lượng thông tin của nguồn phát quá lớn. Do vậy trong các công nghệ nén, cần loại bỏ đi tính có nhớ của nguồn tín hiệu, tức thực hiện “giảm tương hỗ” (deccorelation) giữa các mẫu có điểm lân cận nhau. Trong công nghệ “điều xung mã vi sai” DPCM, quá trình giải tương hỗ được thực hiện bằng một bộ lộc có đáp ứng đầu ra là hiệu số giữa các điểm đầu vào liên tiếp và một giá trị “dự báo” của mẫu điểm đó tạo được dựa trên các giá trị lân cận theo một quy luật nhất định. 3.1.3. Lượng tử hoá sai số dự báo. Giá trị biên độ vi sai phụ thuộc vào tính chất ảnh. Trong vùng ảnh thuần nhất, giá trị này thường nhỏ. Đối với các rìa ảnh và ảnh có nhiều chi tiết, giá trị dự báo sẽ kém chính xác đi dẫn tới sai số dự báo sẽ lớn lên. Do những đặc điểm này, nếu sử dụng bộ lượng tử hoá tuyến tính với một bước lượng tử, sẽ gây ra nhiều lỗi: Tại vùng ảnh thuần nhất, giá trị dự báo vi sai sấp xỉ bằng 0. Bước lượng tử lớn gây ra nhiều hạt. Tại vùng ảnh có rìa hoặc nhiều chi tiết, bậc độ tương phản giữa các điểm ảnh cao dẫn tới một sai số dự báo lớn làm quá tải tham lượng tử. Độ dốc tín hiệu giải mã không theo kịp độ dốc tín hiệu thực tế tại các rìa. Bởi vậy các nét ảnh không rõ ràng, nhoè nhoẹt. Tất cả vấn đề này sẽ giải quyết được nếu sử dụng bộ lượng tử phi tuyến có bước lượng tử lớn dần theo độ lớn mẫu lượng tử. Mặt khác sử dụng lượng tử hoá phi tuyến còn tận dụng được đặc tính của mắt người là kém nhậy cảm với các sai số tại vùng ảnh có rìa và nhiều chi tiết. Do vậy tiết kiệm được số bit cần dùng để mã hoá thông tin. Bước lượng tử quá lớn_Nhiễu hạt Bước lượng tử quá nhỏ_tràn Tín hiệu giải mã S1(n) Tín hiệu đầu vào Hình 3.2: Ảnh hưởng của lượng tử hoá 3.1.4. Khái niệm bù chuyển động (motion compensatio) và vecto chuyển động (motion vector). Trong dòng tín hiệu video thông thường, các khung liền nhau thường giống nhau. Do vậy trong dự báo Interframe một chiều (tức lấy khung liền trước làm ảnh dự báo cho khung liền sau), giá trị dự báo rất gần giá trị ảnh thực tế dẫn tới sai số dự báo nhỏ, tốc độ dòng bit dữ liệu nhỏ. Khi có chuyển động xảy ra, các điểm có cùng vị trí trong hai khung liền nhau là rất khác biệt. Do vậy sai số dự báo tăng lên, tốc độ bit tăng lên và hiệu suất nén giảm. Với trường hợp ảnh động, nếu chọn ảnh dự báo là khung liền trước sẽ không hợp lý. Để tạo một khung dự báo tối ưu ở đây ta phải sử dụng khái niệm “bù chuyển động” (motion compensation). Do chuyển động, sự tương đồng giá trị của hai khung kề nhau sẽ giảm nhưng nội dung ảnh chỉ thay đổi theo nguyên tắc: vật thể đã xuất hiện ở khung trước chỉ thay đổi vị trí ở khung ảnh kế sau. Quá trình tìm kiếm hướng chuyển động của vật thể gọi là “ước lượng chuyển động” (motion estimation). Kết quả về sự chuyển dịch của vật thể theo hai hướng x, y được phản ánh bằng giá trị vectơ gọi là “vectơ chuyển động” (motion vector). Khi có chuyển động, ảnh dự báo không phải là ảnh trước đó mà là ảnh có bù chuyển động. Giá trị sai số dự báo: P=khung trước đó- khung hiện hành + vectơ chuyển động Nên vẫn giữ được giá trị rất nhỏ. Nếu quan sát sai số dự báo, ta dễ thấy được chất lượng dự báo có bù chuyển động. Ảnh tạo bởi tín hiệu sai số biến đổi có bù chuyển động đen hơn rất nhiều trường hợp dự báo không bù chuyển động. 3.1.5. Ước lượng chuyển động bằng phương pháp tìm kiếm khối tương đồng (Block matching). Có nhiều thuật toán “ước lượng chuyển động” nhưng sử dụng phổ biến nhất là “block matching”. Kỹ thuật “block matching” dự đoán chuyển động của một khối kích thước (m × n) điểm ảnh trong khung hình hiện tại bằng sự tương quan với các điểm ở khung hình trước đó và sau đó. Khối này được so sánh với khung hình bằng cách tìm kiếm trong vùng kích thước (m+2p × n+2p) ở khung hình trước đó hoặc sau như hình minh hoạ dưới đây: Vị trí khối 8 × 8 điểm Vị trí khối khối trước đó Khung hình trước (n) Khung hình hiện tại (n+1) Vùng tìm kiếm Vị trí khối hiện tại Vectơ chuyển động Hình 3.3: Vectơ chuyển động giữa hai khung liên tiếp Trong các hệ thống triển khai MPEG điển hình, match bock (hay còn gọi là macroblock) là 16 × 16 điểm và thông số p=6. Có nhiều kỹ thuật block matching cho dự đoán vectơ chuyển động đã được phát triển và có giá trị trong khoa học như: Giải thuật tìm kiếm vét cạn Giải thuật ba bước tìm kiếm. Giải thuật tìm kiếm logarit hai chiều. Giải thuật tìm kiếm hai hướng liên hợp. Giải thuật tìm kiếm một chiều song song có thứ bậc. Giải thuật kết cấu phân tầng, phân loại sự khác nhau giữa các điểm ảnh. 3.1.6. Hệ thống DPCM có bù chuyển động. Bộ tạo dự báo ở bên thu có khối nhớ khung (frame memory or frame store) lưu trữ dữ liệu khung trước đó để tính toán đo đạc chuyển động bằng cách so sánh giữa khung cũ và khung mới. Từ đó tạo khung dự báo có bù chuyển động ở đầu ra bộ tạo dự báo. Việc thực hiện đo đạc chuyển động ở bên phát căn cứ vào khung hiện tại mà bên thu chưa có, bởi vậy một phép đo như vậy không thể đồng thời tiến hành ở cả bên thu và bên phát mặc dù thông tin vectơ chuyển động là cần cho bên thu để tạo lại dự báo. Cho nên thông tin về chuyển động (các vectơ chuyển động của các MB) được truyền tới kênh thu nhờ một kênh phụ. Hệ thống DPCM có bù chuyển động là hệ thống có bộ tạo dự báo không nhân quả. Σ lượng tử hoá Mã hoá Entropy lượng tử hoá Bộ tạo dự báo Σ e P V’ eq V + - + + Kênh Video vào Giải mã Entropy Σ Kênh + Bộ tạo dự báo V’ eq + + P Đầu ra đã giải mã Bộ mã hoá DPCM Bộ giải mã DPCM V=tín hiệu đầu vào e=V-P= sai số đầu vào eq=sai số lượng tử V’=eq+P= tín hiệu khôi phục P: Giá trị đầu ra giải mã Hình 3.4: Mã hoá / Giải mã DPCM. 3.2. Nén video công nghệ: Mã hoá chuyển đổi. Công nghệ mã hoá chuyển đổi có một vai trò vô cùng quan trọng trong nén ảnh truyền hình. Nếu công nghệ DPCM chỉ cho chất lượng ảnh chất lượng cao tại tốc độ dòng bit cao thì công nghệ nén “mã hoá chuyển đổi” (transform coding) có khả năng sử dụng cùng một thuật toán cho một dải tốc độ bit và chỉ làm giảm chất lượng ảnh phục hồi tại tốc độ dòng bit vô cùng thấp. 3.2.1. Xử lý tương hỗ trong công nghệ TC. Trong khi cong nghệ “điều xung mã vi sai” DPCM xử lý tín hiệu trong miền thời gian thì công nghệ “mã hoá chuyển đổi” TC xử lý tín hiệu trong miền tần số. Việc loại bỏ tính có nhớ của nguồn tín hiệu được thực hiện bằng một phép biến đổi có tính thuận nghịch chuyển một khối các điểm ảnh trong miền thời gian thành khối các hệ số trong miền tần số (mỗi hệ số đại diện cho một tần số tín hiệu của khối) bằng phép biến đổi thuận và phục hồi các điểm ảnh từ khối các hệ số bằng phép chuyển đổi nghịch. Phép biến đổi phù hợp nhất cho nén tín hiệu video là phép biến đổi cosin rời rạc (discrete cosin transform-DCT). Thay vì lượng tử hoá và mã hoá trực tiếp biên độ điểm ảnh, người ta sẽ lượng tử hoá và mã hoá các hệ số DCT. 3.2.2. Biến đổi cosin rời rạc (discrete cosin transform-DCT). DCT là phép biến đổi giá trị một khối các điểm ảnh thành một khối các hệ số trong miền tần số. Trong kỹ thuật nén ảnh số, kích cỡ khối được chọn là 8 x 8 vì các lý do sau: Thứ nhất, việc nghiên cứu đã chỉ ra rằng hàm hiệp phương sai (coverriance) suy giảm rất nhanh khi khoảng cách pixel mà ở đó hàm hiệp phương sai được định nghĩa vượt quá 8. Vì vậy mà phương pháp nén sử dụng việc loại bỏ các thông tin dư thừa về không gian không cần quan tâm đến các khối pixel lớn hơn 8. Thứ hai là tiện lợi cho việc tính toán và thiết kế mạch cứng. Khối 8 x 8 sau đó được biến đổi tơi vùng tần số bằng biến đổi 2_D DCT. Đầu ra bộ biến đổi là 64 giá trị biểu diễn các hệ số của các thành phần tần số trong khối 8x8. Như đã nói, hầu hết các thông tin về khối nằm ở vùng tần số thấp và giá trị các hệ số tần số cao rất nhỏ do giá trị các pixel gần nhau thường giống nhau. Bản thân DCT không nén dữ liệu, nó không làm giảm tốc độ bit. Bởi vậy, để nén dữ liệu người ta phải lượng tử hoá các hệ số DCT theo một bảng trọng số nhất định sao cho số các hệ số khác 0 ứng với lượng thông tin trong một khối là nhỏ nhất. Đồng thời, các hệ số DCT cũng được quét theo một cách đặc biệt để các hệ số 0 đi liền nhiều nhất nhằm giảm số bit cần dùng cho mã hoá hệ số DCT. 3.2.3. Lượng tử hoá các hệ số DCT. Quá trình lượng tử hoá và mã hoá các hệ số DCT chính là các quá trình làm giảm tốc độ bit vì bản thân phép biến đổi DCT không nén thông tin. Đây là khâu nhạy cảm nhất trong một hệ thống nén vì nó quyết định trực tiếp chất lượng ảnh khôi phục. 3.2.3.1. Lượng tử hoá lấy mẫu từng vùng (Zonal sampling). Phương pháp lượng tử hoá các hệ số DCT đơn giản nhất là lấy mẫu theo từng vùng (zonal sampling) theo nguyên tắc như sau: loại bỏ một phần tần số cao mà mã hoá phần còn lại bằng số lượng bit cố định. Có thể hiểu đây như một bộ lượng tử chứa một bước lượng tử duy nhất. Mặc dù phương pháp này đơn giản nhưng nó có rất nhiều hạn chế: Không tận dụng được đặc tính thị giác của con người là không nhậy cảm với tần số cao, cũng như không tận dụng được đặc tính khó nhận biết sai số trong vùng ảnh có độ linh hoạt cao. Từ mã có độ dài cố định không cho sự tối ưu trong việc giảm tốc độ bit. Đặc biệt khi dùng đồng bộ lượng tử hoá tuyến tính. Một từ mã sẽ được truyền đi cho dù hệ số giá trị lượng tử bằng 0. Có rất nhiều hệ số DCT sau khi lượng tử trở vè giá trị 0 dẫn tới hiệu suất nén rất thấp. 3.2.3.2. Lượng tử hoá có trọng số. Đây là phương pháp lượng tử hoá tối ưu cho nén ảnh. Trong đó sử dụng bộ lượng tử hoá tuyến tính có một dải các bước lượng tử. Mỗi hệ số DCT khác nhau sẽ quyết định theo bước lượng tử phù hợp. Bước lượng tử này được quyết định dựa trên nhiều yếu tố. Đó là: Bảng trọng số HVS weighting table. Đặc tính cảm nhận của mắt người chỉ nhậy cảm với tần số thấp và hướng biến đổi dọc, ngang mà không nhậy cảm với tần số cao cũng như sự thay đổi theo hướng chéo, dẫn tới mức độ quan trọng của các hệ số tuỳ thuộc vào vị trí. Những hệ số tần số cao và theo hướng chéo có thể được lượng tử hoá theo bước lượng tử thô hơn. Điều này đã được nghiên cứu và liệt kê trong một bảng trọng số gọi là HVS weighting table. Ví dụ bảng trọng số được mặc định trong tiêu chuẩn JPEG như sau: 0 7 7 i k 0 7 7 i k Bảng trọng số cho tín hiệu chói Bảng trọng số cho tín hiệu mầu Hình 3.5: Trọng số lượng tử hóa của JPEG cho tín hiệu chói và tín hiệu mầu. 3.2.4. Quét các hệ số DCT. Dòng số là dòng truyền tải các bit nối tiếp theo thời gian. Do vậy cần một quá trình sắp xếp các hệ số DCT đã lượng tử trong ma trận hai chiều thành dãy một chiều nối tiếp nhau. Quá trình đó gọi là quét hệ số DCT. Theo nghiên cứu, có hai dạng thức quét cho số hệ số “0” đứng cạnh nhau lớn nhất, tạo thuận lợi cho việc giảm tốc độ bit khi mã hoá. Đó là quét “zig_zag” và quét luân phiên “alternate”. Hình3.6:Quét Zigzag và quét alternate các hệ số DCT 3.2.5. Mã hoá các hệ số DCT. Sau khi quét, các hệ số DCT gồm rất nhiều hệ số 0 di liền nhau nên được mã hoá bằng loạt dài RLC (run length code) rồi tiếp tục mã hoá bằng mã Huffman VLC (varriable length code) cao cho giảm tốc độ tối thiểu được tốc độ dòng bit. Việc mã hoá được qui định bằng các bảng mã. Ứng với mẫu đầu vào đối chiếu theo bảng mã sẽ cho từ mã đầu ra tương ứng. 3.2.6. Hệ thống nén video công nghệ mã hoá chuyển đổi. Sơ đồ khối hệ thống nén ảnh sử dụng công nghệ “mã hoá chuyển đổi” như sau: Các tín hiệu chói Y và màu (CR, CB) được đưa vào bộ định dạng khối (block). Một Macroblock gồm hai khối Y và hai khối tín hiệu màu CR, CB . Đầu ra bộ định dạng khối, các mẫu điểm sẽ được sắp xếp thành các khối 8 × 8. Bốn khối (hai khối Y và hai khối màu CR, CB) tạo nên một khối Macroblock (MB). Các MB sẽ được sử lý tương tự , mã hoá độc lập với nhau. Các MB điểm ảnh được chuyển đổi sang vùng tần số cao bằng bộ chuyển đổi cosin rời rạc DCT. Khối hệ số DCT được lượng tử hoá và mã hoá theo mã RLC và VLC. Bộ lương tử hoá sẽ chịu sự tác động của 4 yếu tố sau: F Trọng số của bảng HVS. F Sự phân loại năng lượng khối. F Tín hiệu điều khiển chiếm cứ bộ nhớ. F Khối ID. Để cho bước lượng tử phù hợp với từng hệ số DCT. Block ID (Identification block) là các khối điểm cho phép tín hiệu chói và màu được lượng tử hoá độc lập với nhau… Do tốc độ dòng bit mã hoá thay đổi nên cần phải sử dụng bộ nhớ đệm để giữ cố định tốc độ dòng bit đầu ra. Khối 8x8 các điẻm chói Các hệ số biến đổi DCT Khối DCT được lượng tử RLC VLC Tạo định dạng khối và cấu trúc khối DCT Lượng tử hóa Quét zic-zắc RLC VLC Bộ đệm Bảng trọng số Bảng huffman DCT Mã DPCM hệ số DC Điều khiển đệm Xác định khối Phân lớp năng lượng khối Dòng tín hiệu nén Y CR CB Hình 3.7: Nén ảnh theo công nghệ Transform Coding. VLC RLC Quét zigzac ngược Giải lượng tử hoá IDCT Giải định dạng Block và Macroblock Bảng mã Huffman Bảng trọng số HVS Giải mã DPCM hệ số DC Hình 3.8: Giải mã DCT 3.3. Sự kết hợp các công nghệ nén. Nếu sử dụng một cách tách biệt, không có công nghệ nén nào có khả năng tạo một quá trình nén có dòng bit ra tốc độ thấp mà vẫn đảm bảo chất lượng ảnh đạt yêu cầu. Bởi vậy mọi cách thức hiện nay đều là sự kết hợp chuẩn xác giữa các công nghệ nén. Sự kết hợp nay sau đó được chuẩn hoá trở thành các tiêu chuẩn nén: JPEG, JBIG, MPEG. Có thể hiểu một cách đơn giản, kết hợp các công nghệ nén là tạo ra một quá trình nén nhiều bậc nhằm đạt được hiệu suất nén cao. Tiêu chuẩn nén phổ biến hiện nay là MPEG, sử dụng kết hợp hai công nghệ nén: “điều xung mã vi

Các file đính kèm theo tài liệu này:

  • doc24799.doc