Đồ án Xử lý tín hiệu truyền hình số

 

LỜI NÓI ĐẦU 1

CHƯƠNG I : GIỚI THIỆU CHUNG VỀ TRUYỀN HÌNH SỐ 2

I. Giới thiệu chung về hệ thống truyền hình 2

I.1. Kỹ thuật truyền hình 2

I.2. Sơ đồ tổng quát 2

I.3. Nguyên lý làm việc 2

I.4. Quá trình phát triển của kỹ thuật truyền hình 3

II. HỆ THỐNG TRUYỀN HÌNH SỐ: 3

II.1. Sơ đồ tổng quát 4

II.2. Nguyên lý làm việc 4

II.3. Đặc điểm của truyền hình số. 4

II.3.1. Yêu cầu về băng tần 4

II.3.2. Tỉ lệ tín hiệu/tạp âm (S/N) 5

II.3.3. Méo phi tuyến 5

II.3.4. Chồng phổ 5

II.3.5. Xử lý tín hiệu 5

II.3.6. Khoảng cách giữa các truyền hình đồng kênh 6

II.3.7. Ưu điểm của truyền hình số 6

III. Tình hình chuyển đổi từ công nghệ truyền hình tương tự sang số 6

IV. TƯƠNG LAI CỦA CÔNG NGHỆ TRUYỀN HÌNH 7

CHƯƠNG II : SỐ HOÁ TÍN HIỆU TRUYỀN HÌNH 8

I. CÁC PHƯƠNG PHÁP BIẾN ĐỔI TÍN HIỆU VIDEO 8

I.1. Tín hiệu VIDEO số tổng hợp 8

I.2. Tín hiệu video số thành phần: 8

II. Biến Đổi tín hiệu tương tự sang số 10

II.1. Lấy mẫu tín hiệu video 10

II.2. Lượng tử hoá tín hiệu video 12

II.3. Mã hoá 12

II.3.1. Khái quát 12

II.3.2. Các loại mã 13

III. BIẾN ĐỔI TÍN HIỆU SỐ SANG TÍN HIỆU TƯƠNG TỰ 14

IV. TIÊU CHUẨN SỐ HOÁ TÍN HIỆU VIDEO MÀU TỔNG HỢP 15

IV.1. Lấy mẫu tín hiệu video tổng hợp 15

IV.1.1. Tiêu chuẩn 4fsc NTSC 17

IV.1.2. Tiêu chuẩn 4fSC PAL 20

V. TIÊU CHUẨN LẤY MẪU TÍN HIỆU VIDEO THÀNH PHẦN 23

V.1. Các tiêu chuẩn lấy mẫu 23

V.1.1. Tiêu chuẩn 4:4:4 23

V.1.2. Tiêu chuẩn 4:2:2 24

V.1.3. Tiêu chuẩn 4:2:0 25

V.1.4. Tiêu chuẩn 4:1:1 25

V.2. Lấy mẫu tín hiệu video thành phần 26

V.3. Thang lượng tử và các mức lượng tử. 27

V.4. Cấu trúc lấy mẫu 28

VI. GHÉP DÒNG SỐ LIỆU PHÂN CHIA THEO THỜI GIAN 28

VII. TÍN HIỆU CHUẨN THỜI GIAN 28

VIII. TIÊU CHUẨN TRUYỀN HÌNH SỐ CƠ BẢN 29

IX. TÍN HIỆU AUDIO SỐ 30

IX.1. Khái niệm cơ bản của Audio số 30

IX.2. Nguyên tắc chuyển đổi A/D 30

IX.2.1. Lấy mẫu lý tưởng 31

IX.2.2.Lấy mẫu thực tế 32

IX.2.3. Lượng tử hoá 33

IX.2.4. Mã hoá 33

X. GIAO DIỆN TÍN HIỆU AUDIO SỐ 33

XI. Giải mã và ghếp kênh tín hiệu AES/EBU 34

XII. Đồng bộ giữa các tín hiệu Audio số 34

CHƯƠNG III: NÉN TÍN HIỆU SỐ 36

Khái niệm chung 36

I.1. Định nghĩa : 36

I.2. Mục đích của nén tín hiệu số 36

I.3. Các thông số về nén 37

I.4 Bản chất của nén 37

II. Nén không tổn hao 39

II.1. Phân loại 39

II.2. Mã hoá VLC (Variable Length Coding) – Mã hoá Huffman 39

II.3. Mã hoá RLC (Run Length Coding) 39

III. Nén có tổn hao 40

III.1. Bộ biến đổi T (Transformer) 40

III.2. Lượng tử hoá Q (Quantizer) và bộ giải lượng tử hoá R 41

III.3. Mã hoá (Coder) và giải mã (Decoder) 42

III.3.1. Mã hoá dự đoán (Predictive Coding) 42

III.3.2. Mã hoá chuyển đổi (Transform Coding) 43

IV. Một số công nghệ nén 44

IV.1. Điều xung mã vi sai – DPCM 44

IV.1.1. DPCM trong mành (intraframe DPCM) 45

IV.1.2. DPCM giữa các mành (interframe DPCM) 47

IV.2. Phương pháp mã chuyển vị (Transform Coding) 48

IV.2.1. Xử lý giải tương hỗ trong công nghệ TC 48

IV.2.2. Biến đổi cosine rời rạc (Discrete cosine transform-DCT) 49

IV.2.3. Lượng tử hoá các hệ số DCT 50

IV.2.3.1. Đặc tính thị giác của mắt người 50

IV.2.3.2. Lượng tử hoá lấy mẫu từng vùng (Zonal sampling) 51

IV.2.3.3. Lượng tử hoá có trọng số 51

IV.2.4. Quét các hệ số DCT 51

IV.2.5. Mã hoá các hệ số DCT 52

IV.2.6. Hệ thống nén video theo công nghệ mã chuyển đổi 53

V. Các tiêu chuẩn nén 55

V.1. Tiêu chuẩn nén JPEC 55

V.1.1. Mục đích của JPEC 55

V.1.2. Mã hoá và giải mã JPEG 55

V.1.3. Phân cấp cấu trúc số liệu video 56

V.2. Tiêu chuẩn nén MPEG 57

V.2.1. Giới thiệu 57

V.2.2. Sự phân loại ảnh MPEG 57

V.2.2.1. ảnh I: (Intra - Coded Picture) 57

V.2.2.2. ảnh P ( Predictive Code Picture) 58

V.2.2.3. ảnh B (Bidirectionally Predicted Pictures) 58

V.2.3. Nhóm ảnh (GOP) 59

V.2.4. Cấu trúc dòng bit video MPEG 60

V.2.5. Nguyên lý nén MPEG 61

V.2.6. Tiêu chuẩn nén MPEG 1 63

V.2.7. Tiêu chuẩn nén MPEG 2 66

V.2.7.1. Cấu trúc dòng bit video MPEG-2 67

V.2.7.2. Đặc tính và mức 69

Nén Audio 70

I. Cơ sở của nén Audio 70

I.1. Mô hình tâm lý thính giác. 70

I.2. Sự che lấp tín hiệu Audio 70

I.3. Nén Audio theo tiêu chuẩn AC-3: 72

I.3.1. Giới thiệu: 72

I.3.2. Nén Audio theo chuẩn AC-3: 73

I.3.3. Các đặc tính của AC-3 : 78

CHƯƠNG IV: TRUYỀN DẪN TÍN HIỆU SỐ 78

I. Hệ thống ghép kênh và truyền tải 79

I.1. Hệ thống truyền tín hiệu MPEG 2 79

I.2. Dòng dữ liệu đóng gói, dòng chương trình và dòng truyền tải 80

I.3. Ưu điểm của dòng truyền tải MPEG-2 82

II. Kỹ thuật điều chế và giải điều chế 83

II.1. Giới thiệu 83

II.2. Khoá dịch biên (ASK) 84

II.3. Khoá dịch pha (PSK) 85

II.4. Điều chế biên độ vuông góc (QAM) 87

III. Các phương thức truyền dẫn tín hiệu truyền hình số 88

III.1. Truyền hình cáp 89

III.2. Truyền hình số mặt đất 89

III.3. Truyền hình vệ tinh 90

KẾT LUẬN 90

 

doc95 trang | Chia sẻ: maiphuongdc | Lượt xem: 1595 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Đồ án Xử lý tín hiệu truyền hình số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Kênh truyền dẫn hay lưu trữ Giải nén (giải mã nguồn ) Truyền dẫn hay lưu trữ Thu Phát Hình 3.1: Sơ đồ nén và giải nén I.3. Các thông số về nén Tỉ số nén. Phần trăm nén. Số bit / Symbol. I.4 Bản chất của nén Khác với nguồn dữ liệu một chiều như nguồn âm, đặc tuyến đa chiều của nguồn ảnh cho thấy nguồn ảnh chứa nhiều sự dư thừa hơn các nguồn thông tin khác. Đó là: Sự dư thừa về mặt không gian (Spatial redundancy): Các điểm ảnh kề nhau trong một mành có nội dung gần giống nhau. Sự dư thừa về mặt thời gian (Temporal redundancy): Các điểm ảnh có cùng một vị trí ở các mành kề nhau có nội dung rất giống nhau. Sự dư thừa về mặt cảm nhận của con người: Mắt người nhạy cảm hơn với các thành phần tần số thấp và ít nhạy cảm với sự thay đổi nhanh tần số cao. Do vậy, có thể coi nguồn hình ảnh là nguồn có nhớ. Nén ảnh thực chất là quá trình sử dụng các phép biến đổi để loại bỏ đi các dư thừa và loại bỏ tính có nhớ của nguồn dữ liệu, tạo ra nguồn thông tin mới có lượng thông tin nhỏ hơn. Đồng thời sử dụng các dạng mã hoá có khả năng tận dụng xác suất xuất hiện của các mẫu sao cho số lượng bit sử dụng để mã hoá một lượng thông tin nhất định là nhỏ nhất mà vẫn đảm bảo được chất lượng theo yêu cầu. Các thành phần thông tin: Thông tin chứa trong một tín hiệu có thể chia làm hai thành phần chính: + Lượng tin hay entropy hay độ bất định. + Độ dư thừa. Tuỳ theo nội dung của thông tin, phần entropy lại được chia làm hai phần: + Thông tin không phù hợp: Thông tin không có giá trị đối với hệ thống cảm thụ chủ quan của con người. + Thông tin cốt lõi tức là phần còn lại của entropy: Thông tin này có thể được chia thành nhiều phần nhỏ khác nhau tuỳ theo mức độ quan trọng đối với sự cảm thụ của con người. Độ dư thừa entropy Tín hiệu Nén entropy Nén không tổn hao: Nén có tổn hao: Sau khi nén không tổn hao tín hiệu, kết quả được đem đi sàng lọc ra thông tin không phù hợp và thông tin cốt lõi, ta lại tiếp tục loại bỏ đi những thông tin không phù hợp. Thông tin cốt lõi lại được tiếp tục được sàng lọc để phân loại ra thông tin quan trọng hơn và loại bỏ thông tin ít quan trọng hơn . Với một mảng hình lớn (tần số thấp) thì quan trọng hơn những hình chi tiết (tần số cao). Nén càng nhiều chất lượng thông tin càng giảm. Vì vậy tuỳ thuộc vào chất lượng thông tin theo yêu cầu mà ta nén nhiều hay nén ít. Cơ sở toán học Nén không tổn hao: + Tốc độ bít : R = H + Є R : Tốc độ bit H : Entropy Є : Một số dương rất nhỏ tiến dần về 0 Nén có tổn hao: ã ã ã Độ méo ∆ 0 H R 100% % II. Nén không tổn hao Nén không tổn hao hay mã hoá nguồn là quy trình biểu diễn các ký hiệu dòng bit nguồn thành dòng các từ mã (Codeword), mỗi từ mã gồm một số bit, sao cho giảm được tốc độ bit. Mã hoá có hiệu quả càng cao thì số bit trung bình dùng biểu diễn một ký hiệu càng tiến gần giá trị entropy. II.1. Phân loại Nén theo mô hình thống kê (Mã hoá Symbol (VLC + RLC)). Nén theo mô hình từ điển (không dùng trong phát thanh và truyền hình). II.2. Mã hoá VLC (Variable Length Coding) – Mã hoá Huffman Trong các dạng mã hoá thì mã hoá Huffman là dạng được sử dụng phổ biến nhất. Bảng mã Huffman có thể cho độ dài trung bình để mã hoá cho một mẫu là nhỏ nhất do tận dụng được xác suất xuất hiện của các mẫu trong nguồn tín hiệu. Trong đó, mẫu có xác suất xuất hiện cao nhất sẽ được gắn với từ mã có độ dài ngắn nhất. Mặc dù có độ dài mã thay đổi song mã Huffman vẫn có khả năng giải mã đúng do có các thuộc tính tiền tố duy nhất (không có từ mã nào là phần đầu của từ mã tiếp theo). Một Symbol (8 bit) có 256 Symbol khác nhau, có những Symbol xuất hiện nhiều, có những Symbol xuất hiện ít. Những Symbol xuất hiện nhiều thì gán cho từ mã có độ dài ngắn hơn những Symbol xuất hiện ít. Trong một dòng bit, lấy xác suất xuất hiện của các Symbol để gán từ mã, kết quả cho một dòng bit ngắn hơn nhưng vẫn đảm bảo được thông tin đầy đủ. II.3. Mã hoá RLC (Run Length Coding) Mã hoá RLC chính là các ký hiệu nguồn (hoặc là ký hiệu ở đầu ra của bộ lượng tử) có độ dài thay đổi được mã hoá thành các từ mã có độ dài cố định, tiếp tục mã hoá các từ mã này lần nữa bởi từ mã Huffman. Loại mã này được áp dụng nhiều trong các phương pháp ảnh tĩnh, nén Video. Mã hoá RLC rất hiệu quả khi gặp một loạt các ký hiệu giống nhau (RUN) xuất hiện liên tiếp. Mỗi RUN được biểu diễn bằng một cặp (LEVEL, RUN). Trong đó: LEVEL biểu thị giá trị một bit hay một ký hiệu. RUN biểu thị số lần lặp lại của một bit hay một ký hiệu. Các từ mã sau khi được mã hoá RLC thì lại được mã hoá VLC (mã hoá Huffman). III. Nén có tổn hao Nguyên lý nén và giải nén (mã hoá và giải mã) có tổn hao được mô tả như sau: Biến đổi T Lượng tử hoá Q Mã hoá C Dòng bit chưa nén Dòng bit nén Hệ thống nén có tổn hao Giải mã D Giải lượng tử R Biến đổi ngược T-1 Dòng bit nén Dòng bit chưa nén Hệ thống giải nén có tổn hao Hình3.2: Hệ thống nén và giải nén có tổn hao III.1. Bộ biến đổi T (Transformer) Bộ biến đổi T áp dụng cho một phép biến đổi 1-1 đối với số liệu đầu vào. ở đầu ra bộ biến đổi T thì có một cách biểu diễn số liệu thích hợp hơn để nén. Về phía giải nén, ta có bộ biến đổi ngược T –1 , với chức năng ngược một số phép biến đổi sau: Biến đổi dự đoán tuyến tính (Linear Predictive Transform) + DPCM (Differrentral Pulse Code Modulation) Bộ dự đoán fn + - Sai số dự đoán en=fn-f’n Sai số dự đoán f’n=fn-1 + Đánh giá bù chuyển động Đây là dạng dự doán Inter có xét đến chuyển động của các vật thể trên ảnh khi nén Video. Ta lấy ảnh cũ gần giống ảnh mới dự đoán thay vì truyền ảnh chỉ truyền sai số dự đoán và vectơ chuyển động. Biến đổi Unita (Unita Transform) Biến đổi Unita là biến đổi tín hiệu số trong miền thời gian (tín hiệu Audio số) hoặc trong miền không gian 2D (ảnh tĩnh) thành các hệ số trong miền tần số. Biến đổi DCT là một trường hợp của biến đổi Unita. Biến đổi DCT (Disscrete Cosine Transform) là dựa vào phép biến đổi Forrier để chuyển mảng ảnh từ không gian 2D sang miền tần số, để thấy được miền tần số cao ở đâu và tần số thấp ở đâu rồi sau đó loại bỏ tần số cao. Biến đổi đa phân giải Biến đổi đa phân giải là chia tín hiệu thành tập các tín hiệu con có độ phân giải khác nhau. Một số biến đổi tiêu biểu : + Mã hoá giải con . + Biến đổi Wavelet . III.2. Lượng tử hoá Q (Quantizer) và bộ giải lượng tử hoá R Lượng tử hoá là quá trình biểu diễn một tập giá trị liên tục ở ngõ vào bằng một lượng giới hạn các ký hiệu ở ngõ ra. Đây chính là khâu gây ra tổn hao khi loại bỏ thông tin không phù hợp (độ dư thừa tâm sinh lý) hay thông tin ít quan trọng và chấp nhận một độ méo (độ suy giảm chất lượng) nhất định. Về phía giải nén ta có bộ giải lượng tử R với chức năng ngược lại . Có thể phân biệt hai lượng tử chủ yếu: + Lượng tử vô hướng (Scalar Quantization) là lượng tử từng giá trị một cách độc lập . + Lượng tử vectơ (Vector Quantization) là quá trình biểu diễn một tập vectơ (mỗi vectơ gồm nhiều giá trị) bằng một số hữu hạn các ký hiệu ở ngõ ra . Lượng tử hoá có thể được áp dụng cho các giá trị trong miền thời gian, không gian cũng như các hệ số trong miền tần số . III.3. Mã hoá (Coder) và giải mã (Decoder) Bộ mã hoá có hai nhiệm vụ: Loại bỏ độ dư thừa trong các ký tự ở ngõ ra bộ lượng tử hoá. ánh xạ các ký tự này thành các từ mã hợp thành dòng bit ra. Bộ mã hoá này chính là bộ mã hoá ký hiệu – mã hoá entropy vì sử dụng mô hình thống kê để mã hoá. Các loại mã hoá thông dụng thường sử dụng là VLC, RLC. ở phía giải nén ta có bộ giải mã D với chức năng ngược lại. III.3.1. Mã hoá dự đoán (Predictive Coding) Nguồn ảnh chứa một tông tin rất lớn, nếu mã hoá trực tiếp theo PCM thì tốc độ dòng bit thu được sẽ rất cao. Mặt khác, nguồn ảnh lại chứa đựng sự dư thừa và tính “có nhớ”, giữa các điểm ảnh lân cận có mối quan hệ tương hỗ với nhau. Do đó mã hoá dự đoán được xây dựng trên nguyên tắc cơ bản sau: Lợi dụng mối quan hệ tương hỗ này, từ các giá trị điểm ảnh lân cận theo một nguyên tắc nào đó có thể tạo nên một giá trị gần giống điểm ảnh hiện hành. Giá trị này gọi là giá trị “dự báo”. Loại bỏ đi tính “có nhớ” của nguồn tín hiệu bằng một bộ lọc đặc biệt có đáp ứng đầu ra là hiệu giữa tín hiệu vào s(n) và giá trị dự báo của nó . Thay vì lượng tử hoá các mẫu điểm ảnh, mã hoá dự đoán lượng tử và mã hoá các “sai số dự báo” tại đầu ra bộ lọc. Sai số dự báo là sự chênh lệch giữa giá trị dự báo và giá trị thực của mẫu hiện hành. Do nguồn “Sai số dự báo” là nguồn không có nhớ và chứa đựng lượng thông tin thấp nên số bit cần mã hoá sẽ giảm đi rất nhiều. Phương pháp tạo diểm ảnh dựa trên tổng giá trị của các điểm dự đoán và sai số dự báo gọi là : Điều xung mã vi sai – DPCM . Lượng tử hoá i(k) e(k) + e(k) - ã Bộ dự đoán i(k) i’(k) + + Hình 3.3: Bộ mã hoá DPCM Bộ dự đoán e(k) i’(k) + ã i’(k) + e(k) Hình 3.4: Bộ giải mã DPCM i(k): Mẫu điểm tuần tự . e(k): Chênh lệch dự đoán (sai số dự đoán) . e(k): Giá trị dự đoán của e(k) với lỗi lượng tử q(k) . III.3.2. Mã hoá chuyển đổi (Transform Coding) Trong phương pháp mã hoá chuyển đổi, tính có nhớ của nguồn tín hiệu được loại bỏ đi bằng một phép biến đổi. Một khối các điểm ảnh được chuyển sang miền tần số theo một ma trận biến đổi phù hợp . Từ khối N giá trị mẫu điểm lân cận nhau s = {s(n), s(n+1)……..s(n-N+1)}, thu được khối N hệ số c= (c1, c2…cN). Phép biến đổi này có tính thuận nghịch, các hệ số này hoàn toàn có thể hồi phục thành giá trị tín hiệu ban đầu bằng phép chuyển đổi ngược. So với giá trị thực của điểm ảnh, nguồn các hệ số là không có nhớ. Mặt khác thông tin của nguồn ảnh tập trung phần lớn ở các thành phần tần số thấp nên trong khối các hệ số, thông tin cũng tập trung tại số ít các hệ số chuyển đổi c1. Do vậy sẽ giảm được lượng bit nếu mã hoá các hệ số này thay cho việc mã hoá trực tiếp các mẫu. Số lượng bit mã hoá còn có thể giảm hơn nữa nếu lợi dụng đặc điểm của mắt người không nhạy cảm với sai số ở tần số cao. Bởi vậy, có thể sử dụng các bước lượng tử thô cho các hệ số ứng với tần số cao mà không giảm sút chất lượng ảnh khôi phục . q p Bpxq Biến đổi hai chiều Lượng tử, mã hoá entropy Hình 3.5: Quá trình mã hoá chuyển đổi hai chiều q p Bpxq Biến đổi ngượchai chiều Giải mã entropy Hình 3.6: Quá trình giải mã chuyển đổi hai chiều ảnh số được chia thành các khối cỡ pxq. Các khối này sẽ được chuyển đổi sang miền ttần số. Các hệ số biến đổi sẽ được lượng tử hoá và mã hoá. Quá trình giải mã sẽ được áp dụng phép biến đổi ngược đối với các hệ số để khôi phục ảnh ban đầu . Trong mã hoá chuyển đổi, một điều quan trọng là phải chọn được phép biến đổi phù hợp có khả năng giảm tối đa mối quan hệ tương hỗ giữa các điểm ảnh trong cùng một khối. Bản thân phép biến đổi trong mã hoá chuyển đổi không nén dữ liệu. Việc lựa chọn bảng lượng tử và số bit mã hoá cho các hệ số cũng rất quan trọng do phần lớn hiệu suất nén dữ liệu tập trung trong quá trình này. Cuối cùng mã hoá entropy được chọn để làm giảm tối đa dòng bit . IV. Một số công nghệ nén Điều xung mã vi sai DPCM (Differrential Pulse Code Modulation). Mã hoá chuyển đổi TC (Transform Coding). IV.1. Điều xung mã vi sai – DPCM Phương pháp mã dự đoán hay còn gọi là điều xung mã vi sai (DPCM- Differrential Pulse Code Modulation) không mã hoá thông tin có biên độ ở mỗi mẫu, mà chỉ mã hoá thông tin có biên độ vi sai (biên độ chênh lệch) giữa mẫu đã cho và trị dự báo (được tạo từ các mẫu trước đó) Phương pháp DPCM còn sử dụng đặc điểm của mắt người (kém nhạy với mức lượng tử có chênh lệch về độ chói giữa các điểm ảnh gần nhau, so với mức lượng tử hoá chênh lệch nhỏ) và cho phép dùng đặc trưng phi tuyến về lượng tử hoá. Nhằm tránh các lỗi có thể xuất hiện khi truyền, một mẫu đầy đủ được gửi đi theo chu kỳ nhất định, cho phép cập nhật được các giá trị chính xác. Mã hoá DPCM cũng sử dụng thêm các kỹ thuật dự đoán và lượng tử hoá thích nghi để hoàn thiện thêm kỹ thuật nén này. Giải mã DPCM Tín hiệu video số v + e Bộ lượng tử hoá S eq Mã hoá entropy Bộ dự đoán S v’ p + + Kênh Mã hoá DPCM v: Tín hiệu vào e= v-p (p: sai số dự đoán) eq: sai số lượng tử v= eq +p S Giải mã entropy + + v’ Kênh tín hiệu eq p Bộ dự đoán Đầu ra giải mã Hình 3.7: Sơ đồ khối bộ mã hoá và giải mã DPCM IV.1.1. DPCM trong mành (intraframe DPCM) Tín hiệu dự báo được tạo từ các mẫu nằm trong cùng một mành, các mẫu được biến đổi nằm trên cùng một dòng quét (mã giữa các pixel) và cùng với các dòng quét lân cận (mã giữa các dòng) . Việc tạo tín hiệu dự báo của DPCM trong mành dựa trên mối liên kết giữa các điểm ảnh. Các công trình nghiên cứu cho thấy hệ số liên kết giảm nhanh khi đi ra xa điểm ảnh quan sát theo chiều ngang (các pixel trên cùng một dòng) và theo chiều đứng (các pixel của các dòng kề nhau). Do vậy khi tạo tín hiệu dự báo cần chú ý đến các mẫu nằm lân cận. Tín hiệu dự báo có thể là hàm tuyến tính hoặc có thể là hàm phi tuyến của các mẫu lân cận. Tín hiệu dự báo xp (của giá trị mỗi mẫu tiếp theo xp) có thể được biểu diễn trên cơ sở giá trị của m mẫu trước đó (xp-1, xp-2, …; với m<n): Giá trị của các hệ số ai được xác định sao cho có thể đạt được chất lượng cao nhất đối với ảnh khôi phục. Có 2 phương pháp tạo tín hiệu dự báo : Dự báo cố định còn gọi là dự báo độc lập với ảnh truyền hình . Dự báo thích nghi còn gọi là dự báo phụ thuộc ảnh truyền hình . Đối với cả 2 phương pháp, dự báo sẽ tối ưu nếu như giá trị dự báo e2p (bình phương hiệu giữa giá trị mẵu đang xét và giá trị dự báo) là nhỏ nhất . Tuỳ thuộc vào số mẫu xử lý trước khi tạo trị dự báo, người ta phân biệt thành dự báo 1, 2, hoặc nhiều phần tử (còn gọi là dự báo bậc 1, bậc 2, hoặc bậc cao). Thực nghiệm cho thấy rằng, trong trường hợp dự báo chính xác, giá trị e2p sẽ giảm theo số lượng tăng các mẫu tương đối. Nếu mẵu lớn hơn 3, thì e2p sẽ là nhỏ nhất. Ngược lại, trong trường hợp tạo dự báo gần đúng thì e2p giảm rất ít . Bước tiếp theo sau của DPCM là chọn phương pháp lượng tử hoá tôí ưu. Dùng đặc trưng lượng tử hoá tuyến tính ở các lượng tử nhỏ là thích hợp nhất. Dựa trên đặc điểm của mắt người, ta có thể sử dụng đặc trưng lượng tử hoá tuyến tính lẫn phi tuyến (khoảng lượng tử nhỏ chính xác hơn khoảng lượng tử lớn). Đặc tuyến cần lựa chọn sao cho khi mã hoá tín hiệu bằng số bit nhỏ nhất mà không gây méo lượng tử lớn (nhận thấy được) . Trong DPCM, ngoài méo lượng tử, tính chất của PCM còn xuất hiện méo đặc trưng đối với các phương pháp vi sai (ví dụ: nén đường biên) . Nén đường biên (Stopped noise-load): Loại méo do nén đường biên xuất hiện, nếu hiệu giữa mẫu và dự báo lớn hơn khoảng lượng tử và mạch điện không đáp ứng kịp theo sự thay đổi nhanh chóng của biên độ tín hiệu vào, có nghĩa là tích giữa khoảng cách lượng tử cực đại và tần số lấy mẫu là quá nhỏ. Ngoài ra, trong trường hợp lượng tử hoá phi tuyến, nếu các lượng tử quá rộng sẽ xuất hiện méo ở vùng ảnh rộng đồng mức. Đó là trường hợp hiệu giữa các mẫu gần bằng 0. Méo đường biên có thể xuất hiện trong trường hợp tín hiệu video biến đổi nhanh và không có sự biến đổi trong mạch dự báo. Điều kiện để méo ít nhất là sử dụng đặc trưng lượng tử không thích nghi. Trên quan điểm nhiễu hạt, các khoảng lượng tử phải nhỏ nhất. Ngược lại, để giảm thiểu méo đường biên thì khoảng lượng tử cần phải cực đại. Trong khi đó, để giảm thiểu méo đường biên và co giãn đường biên cần sử dụng lượng tử hoá tuyến tính. Do vậy lựa chọn đặc trưng lượng tử hoá tối ưu phải kết hợp tất cả các yếu tố trên . Hệ thống DPCM có thể chia thành 3 nhóm dựa trên quan điểm tạo dự báo: DPCM tạo dự báo tương tự . DPCM tạo dự báo số . DPCM hỗn hợp . IV.1.2. DPCM giữa các mành (interframe DPCM) Tín hiệu dự báo được tạo trên cơ sở các mẫu nằm ở các mành kề nhau trước đó. Loại thứ nhất cho chất lượng cao khi xử lý ảnh động và được sử dụng cho phát sóng truyền hình. Loại thứ hai thích hợp cho các loại ảnh tĩnh hoặc hình ảnh chuyển động chậm, do đó thường dùng cho truyền hình- thoại . Phương pháp DPCM giữa các mành tận dụng quan hệ chặt chẽ giữa các mành kế nhau của ảnh và đặc trưng của mắt. Nghiên cứu cho thấy rằng sự khác nhau giữa các ảnh kề nhau là không lớn. Để tạo ảnh một cách trung thực chỉ cần truyền các điểm ảnh làm biến đổi và khôi phục lại (tại phía thu) tất cả các điểm ảnh còn lại từ mành trước hoặc ảnh trước trong bộ nhớ. Tín hiệu video ra Trễ mành Cộng Kênh truyền Cộng Lượng tử hoá m mức Trễ mành Mạch trừ Tín hiệu video vào Tín hiệu dự báo Tín hiệu dự báo ã ã ã Hình 3.8: Sơ đồ khối DPCM trong mành Phương pháp cơ bản của DPCM giữa các mành là mã hoá trực tiếp vi sai giữa các mành kề nhau. Đặc trưng lượng tử là phi tuyến nên sự chênh lệch nhỏ giữa các mức sẽ được khôi phục với độ chính xác cao hơn so với mức chênh lệch lớn. Điều đó cho thấy rằng việc khôi phục một cách chính xác các vùng ảnh rộng, chuyển động chậm là chắc chắn. Ngược lại, tại vùng ảnh có nhiều chuyển động khi khôi phục lại sẽ kém chính xác hơn . Các loại DPCM trong mành thường dùng là: Intraframe DPCM . Phương pháp làm đầy có chọn . Phương pháp chia thành những phần ảnh chuyển động và tĩnh . IV.2. Phương pháp mã chuyển vị (Transform Coding) Đối với việc mã hoá riêng rẽ từng điểm một sẽ không đạt được hiệu quả bởi vì sẽ không tận dụng được hết khối điểm trong ảnh số. Phương pháp mã chuyển vị là một cách có hiệu quả trong việc mã hoá khối điểm thông qua biến đổi tuyến tính các điểm này thành các hệ số chuyển vị và mã hoá các hệ số chuyển vị đó. Phương pháp này tập trung vào một số các hệ số chuyển vị mà không phải là các điểm ảnh của ảnh gốc và lượng thông tin chỉ trong một số ít hệ số chuyển vị. IV.2.1. Xử lý giải tương hỗ trong công nghệ TC Trong khi phương pháp “Mã dự đoán-DPCM” xử lý tín hiệu trong miền thời gian thì phương pháp “Mã chuyển vị-TC” xử lý tín hiệu trong miền tần số . Việc loại bỏ tính có nhớ của nguồn tín hiệu được thực hiện bằng một phép biến đổi có tính thuận nghịch, chuyển một khối các điểm ảnh trong miền thời gian thành khối các hệ số trong miền tần số (mỗi hệ số đại diện cho một tần số tín hiệu của khối) bằng phép biến đổi thuận và hồi phục các điểm ảnh từ khối các hệ số bằng phép chuyển đổi nghịch . Phép biến đổi phù hợp nhất cho nén tín hiệu video là phép biến đổi cosin rời rạc (Discrete cosine transform-DCT), thay vì lượng tử hoá và mã hoá trực tiếp biên độ điểm ảnh, người ta sẽ lượng tử hoá và mã hoá các hệ số DCT. IV.2.2. Biến đổi cosine rời rạc (Discrete cosine transform-DCT) DCT là phép biến đổi giá trị một khối các điểm ảnh thành một khối các số trong miền tần số . Công thức tính toán cho DCT-2D với ma trận vuông giá trị điểm NxN sinh ra ma trận vuông hệ số tuần tự : Trong đó: F(u,v): Hệ số các khối DCT NxN . F(x,y): Giá trị mẫu của khối NxN điểm ảnh . u: Tần số trục ngang . v: Tần số trục đứng . C(u), C(v) =1nếu u,v = 1,2,…,7 . DCT có một tính chất quan trọng, đó là tính biến đổi thuận nghịch. Có nghĩa là từ khối các hệ số có thể hồi phục giá trị các điểm ảnh ban đầu theo công thức chuyển đổi ngược như sau: Trong kỹ thuật nén ảnh số, kích cỡ khối được chọn là 8x8 vì các lý do : Hàm hiệp phương sai (Converriance) suy giảm rất nhanh khi khoảng cách pixel mà ở đó hàm hiệp phương sai được định nghĩa vượt quá 8. Vì vậy, phương pháp nén sử dụng việc loại bỏ thông tin dư thừa về không gian không cần quan tâm đến các khối pixel lớn hơn 8. Thuận tiện cho việc tính toán và thiết kế mạch cứng . Khối 8x8 sau đó được biến đổi tới vùng tần số bằng biến đổi 2D-DCT. Đầu ra bộ biến đổi sẽ là 64 giá trị biểu diễn các thành phần tần số trong khối 8x8. Như vậy, hầu hết các thông tin về khối nằm ở vùng tần số thấp và giá trị các hệ số tần số cao rất nhỏ do giá trị các pixel gần nhau thường giống nhau . Như vậy, biểu thức biến đổi DCT thuận cho nén ảnh số như sau : Hệ số đầu tiên có u=v=0. Khi đó : Hệ số này bằng 1/8 tổng giá trị các điểm ảnh trong khối, đại diện cho mức năng lượng trung bình của các điểm ảnh gọi là hệ số DC (tần số =0). Các hệ số còn lại đại diện cho các thành phần tần số không gian cao hơn gọi là các hệ số AC. Có 2 phép biến đổi cosin rời rạc : Phép biến đổi DCT một chiều . Phép biến đổi DCT hai chiều . IV.2.3. Lượng tử hoá các hệ số DCT Quá trình lượng tử hoá và mã hoá các hệ số DCT chính là quá trình làm giảm tốc độ bit vì bản thân phép biến đổi DCT không nén thông tin. Đây là khâu nhạy cảm nhất trong một hệ thống nén vì nó quyết định trực tiếp tới chất lượng ảnh khôi phục. IV.2.3.1. Đặc tính thị giác của mắt người Mắt người không nhạy cảm với các thành phần tần số cao tức là kém phát hiện sai số tại những vùng ảnh có nhiều chi tiết, biến đổi nhanh. Sự phân giải theo hướng xiên thì ít ảnh hưởng tới chất lượng ảnh hơn các hướng ngang và thẳng đứng. Điều này có nghĩa là sai số lượng tử của các hệ số DCT khác nhau là không đều. Sai số của các hệ số tần số cao cũng như hệ số theo hướng xiên ít ảnh hưởng hơn tới chất lượng ảnh khôi phục. Chúng ta có thể sử dụng bộ lượng tử hoá có bước lượng tử thô hơn cho các hệ số DCT tần số cao và theo hướng xiên . IV.2.3.2. Lượng tử hoá lấy mẫu từng vùng (Zonal sampling) Phương pháp lượng tử hoá các hệ số DCT đơn giản nhất là lấy mẫu theo từng vùng theo nguyên tắc: Loại bỏ một phần hệ số tần số cao mà mã hoá phần còn lại bằng số lượng bit cố định, có thể hiểu đây như bộ lượng tử chứa một bước lượng tử duy nhất. Tuy nhiên phương pháp này còn nhiều hạn chế. IV.2.3.3. Lượng tử hoá có trọng số Đây là phương pháp lượng tử hoá tối ưu cho nén ảnh. Trong đó sử dụng bộ lượng tử hoá tuyến tính có một dải các bước lượng tử. Mỗi hệ số DCT khác nhau sẽ được lượng tử tuyến tính theo bước lượng tử phù hợp. Bước lượng tử này được quyết định dựa trên các yếu tố : Bảng trọng số HVS . Mức độ linh hoạt của từng vùng ảnh . Đặc tuyến của bộ đệm dữ liệu . IV.2.4. Quét các hệ số DCT Dòng số là dòng truyền tải các bit nối tiếp nhau theo thời gian. Do vậy cần một quá trình sắp xếp các hệ số DCT đã lượng tử trong ma trận hai chiều thành dãy một chiều nối tiếp nhau. Quá trình đó được gọi là quét hệ số DCT . Có 2 dạng quét cho hệ số “0” đứng cạnh nhau lớn nhất. Quét “zigzag” . Quét luân phiên “alternate” . ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã AC DC ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã DC AC Quét Zigzag Quét Alternate Hình 3.9: Quét các hệ số DCT IV.2.5. Mã hoá các hệ số DCT Sau khi quét, các hệ số DCT gồm nhiều hệ số 0 đi liền nhau nên được mã hoá bằng loạt dài RLC rồi tiếp tục mã hoá Huffman VLC sao cho giảm tối thiểu được tốc độ dòng bit. Việc mã hoá được quy định bởi bảng mã ứng với mẫu đầu vào đối chiếu theo bảng mã sẽ cho từ mã đầu ra tương ứng . Hình vẽ sau minh hoạ cho quá trình quét và mã hoá một khối các hệ số DCT 10 2 2 -1 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 40 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 DC AC01 Chuỗi quét Zigzag AC07 AC70 AC77 0 0 3 10 40 -2 +2 0 0 0 0 0 0 0 -1 EOB 0 2 2 -2 0 3 0 10 25 7 -1 EOB 01 01 01 10 1011 1010 1110 11001 1111000 01 11111001 1 1010 RLC VLC 1110 11001 1011 01 11 1111000 01 01 01 11111001 0 1010 Hình 3.10: Quét Zigzag và mã hoá Huffman Khối hệ số DCT sau khi mã hoá VLC được đại diện bởi 48 bit IV.2.6. Hệ thống nén video theo công nghệ mã chuyển đổi Quét Zigzag PLC VLC Bộ đệm Hệ số cân bằng Lượng tử hoá DCT Định dạng Block và Macro Block Bảng trọng số Bảng Huffman Dòng tín hiệu nén Lựa chọn tốc độ dòng bit ra Xác định khối Điều khiển đệm Mã DPCM hệ số DC Y CR CB Hình 3.11: Nén ảnh theo công nghệ Transform Coding Sơ đồ khối hệ thống nén ảnh sử dụng công nghệ mã hoá chuyển đổi như sau: Các tín hiệu chói Y và màu CB, CR được đưa vào bộ định dạng khối. Một Macroblock gồm hai khối Y và hai khối tín hiệu màu CR, CB. Đầu ra bộ định dạng khối, các khối 8x8. Bốn khối tạo nên một khối Macroblock. Các Macroblock sẽ được xử lý lượng tử, mã hoá độc lập với nhau. Các Macroblock điểm ảnh được chuyển đổi sang vùng tần số bằng bộ chuyển đổi cosine rời rạc DCT. Bộ lượng tử hoá sẽ chịu tác động của 4 yếu tố sau để cho bước lượng tử phù hợp với từng hệ số DCT : Trọng số của bảng HVS . Sự phân loại năng lượng khối . Tín hiệu điều khiển chiếm bộ nhớ . Khối ID . Giải lượng tử hoá Quét Zigzaz ngược IDCT Giải định dạng Block và Macro Block RLC VLC Bảng trọng số lượng tử hoá Bảng mã Huffman Giải mã DPCM hệ số DC Y Cb CR Hình 3.12: Giải mã DCT Nén Video V. Các tiêu chuẩn nén V.1. Tiêu chuẩn nén JPEC V.1.1. Mục đích của JPEC Tiêu chuẩn JPEG được định ra cho nén ảnh tĩnh đơn sắc và màu thực hiện bởi bốn mode mã hoá. Mã hoá tuần tự: ảnh được mã hoá theo kiểu quét từ trái qua phải từ trên xuống dưới dựa trên khối DCT. Mã hoá luỹ tiến: ảnh được mã hoá bằng kiểu quét phức hợp theo chế độ phân giải không gian cho các ứng dụng trên các kiểu băng hẹp và do đó thời gian truyền dẫn có thể dài. Mã hoá không tổn thất: ảnh được đảm bảo khôi phục chính xác cho mỗi giá trị mẫu

Các file đính kèm theo tài liệu này:

  • doc28774.doc
Tài liệu liên quan