Chuyển đổi DCT thực hiện chia phổ fs/2 thành 8 dải băng tần nhỏ hơn, tương ứng với mỗi dải băng tần có một hệ số đặc trưng cho năng lượng của tín hiệu .Trong đó, ứng với thành phần tần số thấp có hệ số DCT lớn nhất được gọi là các hệ số DC. Các thành phần tấn số còn lại được gọi là các hệ số AC, khi tần số càng cao thì các hệ số DCT càng thấp.
Để tách tương quan nội dung ảnh cao hơn, chuyển đổi DCT hai chiều được sử dụng cho các khối 8*8 pixel chói gọi là DCT 2 chiều. Tương tự DCT một chiều, nó được minh hoạ như trên.
Kết quả chuyển đổi DCT 2 chiều 8*8 đã biến một ma trận 64 điểm ảnh thành một ma trận 64 hệ số DCT, trong đó phần tử có giá trị lớn nhất ở góc trên cùng bên trái ứng với phần thành phần tần số thấp nhất gọi là hệ số DC, các phần tử khác là các hệ số AC, phần tử dưới cùng góc phải tương ứng với thành phần tấn số thấp nhất theo cả chiều ngang và chiều dọc.
115 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2814 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Đồ án Truyền hình số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hoá cho các symbol trong phần một và bit 1 để mã hoá cho các symbol trong phần 2.
+bước 4: Quay trở lại bước 2 và tiếp tục làm cho tới khi mỗi phần chia chỉ còn lại 1 symbol nguồn.
3.7.3. Mã hoá huffman
Nó là một kĩ thuật mã hoá mới mà có thể tạo ra độ dài của từ mã ngắn nhất đối với tập symbol nguồn và kết hợp với xác suất của chúng.
Các bước xây dựng huffman gồm :
+bước1: Liệt kê các xác suất của các symbol nguồn (giảm dần ) và tạo ra các tập nút bằng cách cho những xác suất này thành các nhánh của cây nhị phân.
+bước2: Lấy 2 nút với xác suất nhỏ nhất từ tập nút, và tạo ra một xác mới bằng tổng các xác suất của các xác suất đó.
+bước3:Tạo tiếp tập nút mẹ với các xác suất mới, và đánh số 1 cho nút con ở trên, 0 cho nút con ở dưới.
+bước4: Tạo tiếp tập nút bằng cách thay thế 2 nút với xác suất nhỏ nhất cho nút mới. Nếu tập nút chỉ chứa một nút thì kết thúc, nếu không thì quay lại bước 2.
Nó đạt hiệu xuất thấp khi xác suất hiện các phần tử gần như nhau, nhưng đạt hiệu suất cao khi xác suất các phần tử chênh lệch nhau quá lớn.
Bộ nén phải thiết lập một bảng thông số hay bảng tra cứu và gửi kèm theo dữ liệu tới bô giải nén. Nó thường được xây dựng nhờ thiết lập cây nhị phân.
3.7.4. Phương pháp mã dự đoán DPCM(differential pulse code modulation)
DPCM không mã hoá trực tiếp biên độ mẫu mà chỉ mã hoá thông tin có biên độ vi sai (biên độ chênh lệch ) giữa mẫu đã cho và trị dự báo( được tạo ra từ các mẫu trước đó ).
Phân bố thống kê về biên độ tín hiệu video là phân bố đều. Còn phân bố về độ chênh lệch biên độ các điểm ảnh có đồ thị hình chuông xung quanh điểm 0. Nếu dựa trên các đặc trưng thống kê ảnh, thì sự khác nhau này là không lớn lắm và để mã hóa nó thì chỉ cần giảm số bit là đủ.
Sơ đồ khối bộ mã hoá và giải mã DPCM như sau:
Mã hoá DPCM
∑
Bộ lượng tử hoá
mã hoá entropy
Bộ dự đoán
∑
tín hiệu video
P
+
-
e
eq
+
V’
Kênh
+
V: tín hiệu vào
V
e=V-P:sai số dự đoán
eq: sai số lượng tử hoá
V’= eq+P: tín hiệu khôi phục
Hình 3.3. Sơ đồ khối bộ mã hoá DCPM
Bộ giải mã DPCM
giải mã
∑
Bộ dự đoán
V’
+
eq
Kênh tín hiệu
P
+
Đầu ra
giải mã
Hình 3.4. Sơ đồ khối giải mã DCPM
Nhằm tránh các lỗi có thể xảy ra trong khi truyền, một mẫu đầy đủ được gửi đi theo một chu kì nhất định, cho phép cập nhập các giá trị chính xác. Mã hoá DPCM cũng sử dụng thêm các kĩ thuật dự đoán và lượng tử hoá thích nghi để hoàn thiện thêm các kĩ thuật này.
3.7.4.1. DPCM trong mành
Tín hiệu dự báo được tạo từ các mẫu trong cùng một mành, các mẫu được biến đổi nằm trên cùng một dòng quét(giữa các pixel) và các dòng quét lân cận(mã giữa các dòng).
Việc tạo tín hiệu dự báo DPCM trong mành dựa trên mỗi liên kết giữa các điểm ảnh. Thực nghiệm cho thấy hệ số liên kết giảm nhanh khi đi ra xa điểm ảnh quan sát theo chiều ngang và theo chiều đứng. Do đó, khi tạo tín hiệu dự báo cần chú ý đến các mẫu nằm lân cận.
Tín hiệu dự báo xp^ (cho mẫu tiếp theo xp) có thể được biểu diễn trên cơ sở giá trị của m mẫu trước đó(xp-1xp-2,.......)
xp^ =Sai.xp-i; i=1,2,3.......m
Giá trị của ai được lựa chọn sao cho có thể đạt được chất lượng cao đối với ảnh khôi phục.
Có hai phương pháp tạo tín hiệu dự báo là:
+Dự báo cố định :tín hiệu dự báo độc lập với ảnh truyền hình .
+Dự báo thích nghi: tín hiệu dự báo phụ thuộc vào ảnh truyền hình .
Cả hai phương pháp, dự báo sẽ tối ưu nếu như giá trị dự báo e2p ( bình phương hiệu giữa các giá trị mẫu đang xét và giá trị dự báo ) là nhỏ nhất.
3.7.4.2. DPCM giữa các mành
Tín hiệu dự báo được tạo trên cơ sở các mẫu nằm ở các mành kề nhau trước đó.Loại trên(DPCM trong mành ) cho chất lượng ảnh cao khi xử lí ảnh động. Còn loại này thích hợp cho các ảnh tĩnh hoặc hình ảnh chuyển động chậm, nên thường dùng cho truyền hình thoại.
Phương pháp DPCM giữa các mành tận dụng quan hệ chặt chẽ giữa các mành kế nhau của ảnh và đặc trưng của mắt. Sự khác nhau giữa các ảnh kề nhau là không lớn lắm. Vì vậy, để tạo các ảnh một cách trung thực chỉ cần truyền các điểm ảnh làm biến đổi và khôi phục lại (tại phía thu) tất cả các điểm ảnh còn lại từ mành trước hoặc ảnh trước trong bộ nhớ bằng phương pháp nội suy.
Mạch trừ
lượng tử hoá m mức
Trễ mành
tín hiệu video vào
Kênh truyền
Cộng
Trễ mành
Cộng
tín hiệu dự báo
tín hiệu dự báo
tín hiệu video ra
Hình 3.5. Sơ đồ khối DPCM trong mành
Sơ đồ khối DPCM giữa các mành là:
DPCM giữa các mành mã hoá trực tiếp vi sai giữa các mành kề nhau. Hoạt động của nó giống DPCM trong mành với dự báo1 phần tử. Độ trễ của mạch phản hồi đúng bằng thời gian một mành.
Nội suy tín hiệu tương tự dựa trên nguyên tắc thay thế đặc tuyến tín hiệu tương tự bằng hàm điện áp(đa thức) có đặc tuyến và thời gian gần giống với nó. Nếu biết được đặc tuyến của hàm nội suy và giá trị của đặc tuyến tại một vài điểm thì có thể khôi phục các giá trị trung bình của tín hiệu. Trong trường hợp tín hiệu rời rạc, các trị chưa biết của các mẫu có thể được suy ra từ các mẫu trước hoặc sau. Đối với tín hiệu video, thường sử dụng hàm nội suy tuyến tính. Lúc đó, trị chưa biết của các mẫu khôi phục được coi như trị trung bình của các mẫu lân cận.
Các loại DPCM giữa các mành được sử dụng bao gồm:
a) Phương pháp lấy mẫu từ phần ảnh chuyển động: Chỉ truyền phần các điểm ảnh chuyển động và khôi phục phần các điểm ảnh còn lại bằng trị trung bình các điểm ảnh được truyền.
b) Phương pháp làm đầy có chọn: Là phương pháp đan chéo các mành, còn gọi là phương pháp làm đầy có chọn khi ảnh truyền ít chuyển động và tốc độ thấp. Nguyên tắc là chỉ truyền phần ảnh được chọn ở mỗi mành và nhận ảnh có độ chiếu sáng lâu.
c) Phương pháp chia thành những phần ảnh chuyển động và tĩnh: Nó là sự kết hợp giữa phương pháp làm đầy có chọn và phương pháp lấy mẫu từng phần ảnh chuyển động cùng với DPCM giữa mành với dự báo một phần tử.
3.8. PHƯƠNG PHÁP MÃ CHUYỂN ĐỔI (TC-TRANSFORM CODING)
Trong mã hoá DPCM, nó xử lí tín hiệu trong miền thời gian, còn trong công nghệ mã chuyển đổi TC: Nó xử lí thông tin trong miền tần số. Nó làm giảm thông tin dư thừa trong vùng không gian. Một phương pháp chuyển đổi phổ biến là :Biến đổi cosin rời rạc(DCT): Thay vì lượng tử hoá và mã hoá trực tiếp biên độ điểm ảnh, người ta sẽ lượng tử hoá và mã hoá các hệ số DCT.
3.8.1. Biến đổi cosin rời rạc (DCT)
DCT là phép biến đổi giá trị một khối các điểm ảnh thành một khối các hệ số trong miền tần số.
Công thức tính toán cho DCT hai chiều với ma trận vuông giá trị điểm ảnh(n*n) sinh ra ma trận vuông hệ số tuần tự như sau:
Trong đó:
F(u,v): Hệ số DCT của N*N điểm ảnh .
Còn f(x,y) là giá trị biên độ của khối N*N điểm ảnh.
u: tần số trục ngang
v: tấn số trục đứng
C(u),C(v)=nếu u,v=0
C(u),C(v)=1 nếu u,v¹0
DCT có một tính chất quan trọng, đó là tính biến đổi thuận nghịch. Có nghĩa là :Từ các khối các hệ số DCT có thể hồi phục được giá trị biên độ các điểm ảnh ban đầu theo công thức chuyển đổi ngược sau:
Trong kĩ thuật nén ảnh số, kích thước khối được chọn là 8*8 pixel vì:
Thực nghiệm chỉ ra rằng, hàm hiệp phương sai suy giảm rất nhanh khi khoảng cách pixel mà ở đó hiệp phương sai được định nghĩa là vượt quá 8. Vì vậy phương pháp nén sử dụng việc loại bỏ các thông tin dư thừa về mặt không gian, không cần quan tâm đến các khối pixel lớn hơn 8. Mặt khác, khối 8*8 pixel là vừa đủ để thuận tiện cho việc tính toán ,thiết kế mạch cứng.
98
92
95
80
75
82
68
50
98
Biên độ chói
Mức DC điểm chói
t
t
Biên độ giá trị điểm chói
Năng lượng
t
f
fs/2
Năng lượng
Năng lượng
fs/2
f
f
591
106
- 18
28
-34
14
18
3
Hệ số DC
Các Hệ số AC
3.6. Mã hoá DCT một chiều
Để hiểu rõ hơn, ta xét DCT một chiều gôm 8 điểm ảnh chói liền kề nhau trên cùng một dòng quét như sau:
98
92
95
80
75
82
68
50
97
91
94
79
74
81
67
49
95
89
92
77
72
79
65
47
93
87
90
75
70
77
63
45
91
85
88
71
76
73
50
41
89
83
86
71
76
73
50
41
87
81
84
69
64
71
57
39
85
79
82
67
62
69
56
37
591
106
-18
28
-34
14
18
3
35
0
0
0
0
0
0
0
-1
0
0
0
0
0
0
0
3
0
0
0
0
0
0
0
-1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
-1
0
0
0
0
0
0
00
0
0
0
0
0
0
0
0
t
t
Tần số
u
Tần số
v
Năng lượng
Năng lượng
t
t
Biên độ điểm chói
Biên độ điểm chói
Biên độ điểm chói
Biên độ điểm chói
Hình 3.7. Minh hoạ quá trình mã hoá DCT hai chiều
Giá trị các điểm ảnh của khối 8x8
Chuyển đổi DCT thực hiện chia phổ fs/2 thành 8 dải băng tần nhỏ hơn, tương ứng với mỗi dải băng tần có một hệ số đặc trưng cho năng lượng của tín hiệu .Trong đó, ứng với thành phần tần số thấp có hệ số DCT lớn nhất được gọi là các hệ số DC. Các thành phần tấn số còn lại được gọi là các hệ số AC, khi tần số càng cao thì các hệ số DCT càng thấp.
Để tách tương quan nội dung ảnh cao hơn, chuyển đổi DCT hai chiều được sử dụng cho các khối 8*8 pixel chói gọi là DCT 2 chiều. Tương tự DCT một chiều, nó được minh hoạ như trên.
Kết quả chuyển đổi DCT 2 chiều 8*8 đã biến một ma trận 64 điểm ảnh thành một ma trận 64 hệ số DCT, trong đó phần tử có giá trị lớn nhất ở góc trên cùng bên trái ứng với phần thành phần tần số thấp nhất gọi là hệ số DC, các phần tử khác là các hệ số AC, phần tử dưới cùng góc phải tương ứng với thành phần tấn số thấp nhất theo cả chiều ngang và chiều dọc.
Trước khi thực hiện biến đổi các hệ số DCT, cả ảnh sẽ được chia thành các khối lớn riêng biệt không chồng lên nhau(MB_macro block).Mỗi MB này gồm 4 bock tín hiệu chói và 2;4;hoặc 8 bock tín hiệu màu. Số block tín hiệu màu phụ thuộc vào tiêu chuẩn lấy mẫu tín hiệu video. Quá trình này gọi là tiền xử lí.
Nếu dung DCT cho tín hiệu số thành phần Y,CR,CB. Thì các biên độ CR, CB có biên độ max là ±128(giá trị nhị phân trong hệ thống 8 bit). Còn giá trị Y có khoảng cực đại là từ 0¸255(giá trị nhị phân). Để đơn giản cho việc thiết kế bộ chuyển đổi DCT, tín hiệu Y được dịch mức xuốn dưới bằng cách trừ 128 vào từng giá trị pixel trong khối để có khoảng cực đại giống như CR,CB. Ở phần giải mã DCT, giá trị 128 được cộng vào các giá trị pixel chói.
3.8.2. Lượng tử hoá các hệ số DCT
Quá trình lượng tử hóa và mã hoá các hệ số DCT là quá trình nén thông tin, vì bản thân phép biến đổi DCT không nén thông tin .
3.8.2.1. Đặc trưng thị giác của mắt người
Mắt người không nhạy cảm với thành phần tần số cao cũng như với sai số ở vùng ảnh có nhiều chi tiết, biến đổi nhanh. Hơn nữa, sự phản ánh theo hướng xiên ít ảnh hưởng hơn các hướng ngang và thẳng đứng. Nó đồng nghĩa với : Sai số lượng tử của các hệ số DCT khác nhau là không đều. Sai số của các hệ số tần số cao cũng như sai số hệ số theo đường chéo ít ảnh hưởng hơn tới chất lượng ảnh khôi phục. Nó cho phép sử dụng bộ lượng tử hoá có bước lượng tử thô hơn cho các hệ số DCT tần số cao hon và theo hướng chéo. Còn hệ số một chiều DC đòi hỏi độ chính xác cao nhất, bởi lẽ nó biểu thị độ chói trung bình của từng khối phần tử ảnh.
3.8.2.2. Lượng tử hoá hệ số DCT
Trong bảng hệ số DCT, sai số hệ số một chiều DC co khả năng nhận biết một cách dễ ràng, bởi nó làm thay đổi mức chói trung bình của khối điểm ảnh. Còn với các hệ số AC tần số cao, giá trị nhỏ thì có thể biểu diễn lại bằng tập giá trị nhỏ hơn hẳn các giá trị cho phép. Quá trình này có thể được thực hiện bằng cách cho những khoảng cách giữa các bước lượng tử hóa thay đổi theo các hệ số.
Lượng tử hoá theo trọng số
Bảng lượng tử (8x8)
F(u,v)
Foo/Qoo
Fq(u,v)
64 hệ số DCT
Q(u,v)
64 hệ số lượng tử hoá
Hình 3.8. Lượng tử hoá có trọng số
Lượng tử hóa được thực hiện bằng việc chia các hệ số F(u,v) cho các hệ số ở vị trí tương ứng trong bảng lượng tử Q(u,v) để biểu diễn số lần nhỏ hơn các giá tri cho phép của hệ số DCT : Các hệ số tần số thấp được chia cho các giá trị nhỏ, còn các hệ số ứng với tần số cao được chia cho các hệ số lớn hơn. Sau đó hệ số được làm tròn. Kết quả ta nhận được bảng Fq(u,v) mới, trong đó phần lớn các hệ số có tần số cao sẽ bằng 0. Hệ số bảng lượng tử hoá thuận được xác định theo biểu thức:
Fq(u,v) =int
k=0÷7
Giá trị Fq(u,v) sẽ được mã hoá trong các công đoạn tiếp theo.
Việc xây dựng bảng lượng tử hoá Q(u,v), tuỳ thuộc vào nhiều yếu tố sao cho được tối ưu nhất sẽ được sử dụng. Bảng này sẽ được ghi lại và truyền đi. Hệ thống giải nén sẽ nhận biết để khôi phục dữ liệu.
Hình sau đây là một ví dụ minh hoạ giá trị khối xác định giá trị cho phép các giá trị tín hiệu chói và tín hiệu màu được lượng tử hoá khác nhau. Nhiễu lượng tử đối với tín hiệu màu khó nhận biết hơn đối với tín hiệu chói, cho nên có thể lượng tử hóa thô với tín hiệu màu.
Bảng trọng số (theo tiêu chuẩn JPEG cho mẫu tín hiệu màu )
Bảng trọng số (theo tiêu chuẩn JPEG cho mẫu tín hiệu chói )
Hình 3.9. Các bảng lượng tử hoá tín hiệu chói và tín hiệu mà theo màu JPEG
Quá trình lượng tử hoá có trọng số này có gây mất thông tin, tức có tổn hao. Đây là bước tổn hao duy nhất trong thuật toán nén, và không ảnh hưởng lắm đến sự khôi phục ảnh.
3.8.2.3. Quét các hệ số DCT
Dòng số là dòng truyền tải các bit nối tiếp theo thời gian. Do vậy, cần một quá trình sắp xếp các hệ số DCT đã lượng tử trong ma trận 2 chiều thành dãy một chiều nối tiếp nhau. Quá trình đó gọi là quét các hệ sô DCT.
Theo nghiên cứu, có hai dạng thức quét cho hệ số 0 đứng cạnh nhau là lớn nhất để thuận lợi cho việc mã hoá cũng như giảm tốc độ bít khi truyền. Đó là quét “zig-zag” và quét luân phiên.
3.8.3. Mã hoá hệ số DCT
Sau khi quét các hệ số DCT gồm rất nhiều hệ số 0 đi liền nhau, nên được mã hoá bằng loại mã RLC (độ dài chạy) rồi tiếp tục được mã hoá bằng mã huffmanVLC ( mã có độ dài thay đổi) sao cho giảm tối thiểu được tốc độ dòng bít. Việc mã hoá được quy định bởi các bảng mã cho từ mã đầu ra tương ứng.
Bảng phân nhóm hệ số AC
Phân loại
Mức hệ số
NA
0
1
-1 1
2
-3,-2 2,3
3
-7,….,-4 4…………7
4
-15,………,-8 8,…………..15
5
-31,………,-16 16,………….,31
6
-63,………,-32 32,………….,63
7
-127,………,-64 64,…………..,127
8
-255,………..,-65 65,…………..,255
9
-511,……….,-256 256,………….,511
10
-1023,……..,-512 512,…………,1023
…
………………….. …………………..
Bảng mã hoá Huffman hệ số AC
Số chạy
Phân loại
độ dài mã
Từ mã
0
1
2
00
0
2
2
01
0
3
3
100
0
4
4
1011
0
5
5
11010
0
6
6
111000
0
7
7
1111000
.
.
.
.
1
1
4
1100
1
2
6
111001
1
3
7
1111001
1
4
9
111110110
.
.
.
.
2
1
5
11011
2
2
8
11111000
.
.
.
.
3
1
6
111011
3
2
9
111110111
.
.
.
.
4
1
6
111011
5
1
7
1111010
6
1
7
1111011
7
1
8
11111011
8
1
8
11111010
9
1
9
111111000
10
1
9
111111010
.
.
.
.
EOB
4
1010
Bảng các hệ số DC cho mã VLC
Các giá trị sai lệch
Phân loại
Từ mã cho tín hiệu chói
Từ mã cho tín hiệu màu
-255 đến -128
8
1111 110
1111 1110
-127 đến -64
7
1111 10
1111 110
-63 đến -32
6
1111 0
1111 10
-31 đến -16
5
1110
1111 0
-15 đến -8
4
110
1110
-7 đến -4
3
101
110
-3 đến -2
2
01
10
-1
1
00
01
0
0
100
00
1
1
00
01
2 đến 3
2
01
10
4 đến 7
3
101
110
8…..15
4
110
1110
16,……,31
5
1110
1111 0
32,….., 63
6
1111 0
1111 10
64,…..,127
7
1111 10
1111 110
128,…., 255
8
1111 110
1111 1110
Quá trình được minh hoạ bằng ví dụ sau:
40
10
3
0
RLC
0
-2
2
0
0
0
0
0
0
0
-1
0
0
.
.
.
0
25
0,10
0,3
VLC
2,-2
0,2
7,-1
EOB
1110 11001
1011 1010
01 10
11111000 01
01 10
11111001 0
1010
Chuỗi quét zig-zag
AC 0,7
40
10
-2
2
-1
0
0
0
3
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
DC AC 0,1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
AC 0,7
0
AC 7,7
giá trị DC có trong khối trước =15, Vì vậy giá trị DC khi mã hoá RLC còn lại là 40-15=25
Các hệ số DCT của khối sau khi mã hoá VLC còn lại 48 bit
1110 11001 1011 1010 01 10 1111100001 01 10
Hình 3.11. Ví dụ về mã của RLC
Trong ví dụ này, mã hoá RLC như sau:
Trứơc hệ sô “10” và “3” không có sô o nào nên biểu diễn là: (o,10)và (o,3), trước hệ số “-2” có 2 hệ sô o nên biểu diễn là: (2,-2). Tương tự ta có (0,2) và )và (7,-2). Kí tự EOB được dùng để đánh dấu vị trí bắt đầu của chuỗi các số “0” liên tiếp.
Việc mã hoá được quy định theo bảng mã hoá. Bảng này sẽ được gửi đi kèm, để bên thu có thể giải mã chính xác.
Sơ đồ khối mã hoá VLC/ mã hoá huffman cho các hệ số DC và AC (theo tiêu chuẩn JPEG) được cho như sau:
Sơ đồ mã hoá VLC cho các hệ số DC
Cột phân loại trong bảng hệ số DC =5
Δ=DC1-DCo =25
Hệ số DC=40 (từ bộ lượng tử hoá DCT
Bảng mã huffman
Bảng
phân loại
Mã hoá
DPCM
Từ mã DC
1110 11001
Mã hoá
nhị phân
độ lớn
Hình 3.12. Sơ đồ mã hoá VLC cho hệ số DC
Các hệ số AC (DC,10,3,..) từ bộ lượng tử hoáDCT
mã hoá mức và RLC
Bảng phân loại
mã hoá nhị phân
Bảng mã Huffman AC
10111 1010
Số chạy,mức =(0,10)
Cột phân loại trong bảng hệ số AC=4
độ lớn
Từ mã AC
MứC 10
Hình 1.13. Sơ đồ mã hoá VLC cho hệ số AC
Trong đó, bảng phân loại các hệ số DC và AC và bảng mã hoá tương ứng được cho sẵn trong các tiêu chuẩn khác nhau và được gửi kem đến nơi thu.
3.9. PHƯƠNG PHÁP NÉN LIÊN ẢNH
3.9.1. Mã hoá bù chuyển động
Ảnh động tạo ra sự dư thừa đáng kể từ khung hình này đến khung hình kế tiếp. Rất nhiều phần trong khung hình có thông tin không thay đổi- một vài phần có thể đứng im và các phần khác có thể là các phần của khung hình trước dịch chuyển đi chút ít. Theo nguyên lí nay, bất cứ thứ gì đã tồn tại trong khung hình trước đều không cần phải được truyền lại- Nó chỉ cần được sao chép bằng máy thu hình từ một bản lưu trữ của khung hình trước. Chức năng chỉ ra một cái mới hay cũ trong một khung hình được gọi là :Bù chuyển động. Đây là một trong những nhiệm vụ phức tạp nhất của nén video. Thực tế, hiệu quả của bù chuyển động luôn luôn bị hạn chế do khả năng tính toán và tốc độ.
Bù chuyển động được dựa vào quá trình xử lí ảnh trong khối. Đưa ra một khung hình (đầu tiên) hoàn chỉnh như là điểm xuất phát,các khối từ khung hình tiếp theo được lấy và so sánh với các vùng của khung hình thứ nhất, để xác định xem có điểm nào trùng khớp ở bất kì vị trí nào trên khung hình thứ nhất hay không (khối có thể đã dịch chuyển giữa các khung hình). Nếu tìm thấy điểm trùng khớp, một véc tơ chuyển động sẽ được tạo ra cho máy thu sử dụng để dự đoán vùng của khung hình thứ 2 bằng cách sao chép nó từ khung hình thứ nhất. Biết rằng số lượng chuyển động giữa các khung hình thương không quá lớn nên chỉ việc tìm kiếm trong một khu vực nhỏ xung quanh vị trí của khối được kiểm tra. Thậm chí, như vậy số lượng thao tác ở đây cũng rất lớn và cần phải hạn chế phạm vi tìm kiếm so với thực tế cần thiết. Các khối không được tìm thấy ở khung hình trước, phải được mã hoá bằng các phương tiện khác và truyền đi đầy đủ.
Khung hình trước
vị trí 8x8 điểm
vị trí 8x8 điểm trứơc đó
vị trí khối hiện tại
Vùng tìm kiếm
Khung hình sau
véc tơ chuyển động
Hình 3.14. Véc tơ chuyển động giữa hai khung hình liền nhau
3.9.2. Mô hình nén liên ảnh
Bù chuyển động
Nén trong ảnh
Nguồn ảnh
ảnh nén
Hình 3.15: Mô hình nén liên ảnh
a) Ảnh dự đoán trước(ảnh P):Ảnh hiện tại được dự báo từ các pixel của frame hiển thị trước đó.
Phương pháp này rất hiệu quả khi chuỗi ảnh biểu diễn là chuỗi ảnh tĩnh hoàn toàn:Trong trường hợp này chỉ cần truyền ảnh đầu tiên là đủ,và thông tin lần lượt mỗi ảnh không khác nhau mấy so với ảnh trước. Khi xuất hiện vật thể chuyển động nào đó trong ảnh, thì cần phải phát hiện các vật thể này và biểu diễn đặc trưng về sự thay đổi vị trí của nó. Bằng cách này và trên cơ sở phân tích các ảnh trước, có thể dự báo gần đúng nội dung ảnh đang xét.
Trong trường hợp ảnh đang xét khác với dự báo của nó, thì cần phải truyền thêm các thông tin về sự khác nhau đó, giữa các ảnh nói trên.
Khi đó vị trí Block được biểu diễn bằng véc tơ biểu thị sự dịch chuyển Block này so với vị trí của MB trong ảnh dự báo trước. Kết quả ta nhận được các véc tơ chuyển động cho mỗi MB.
Sơ đồ sau chỉ ra quá trình tạo ảnh dự báo trước ảnh P:
X¸c ®Þnh vect¬ chuyÓn ®éng
Bï chuyÓn ®éng
¶nh tríc ®ã (¶nh so s¸nh)
Bé céng
Bé trõ
+
-
+
+
T¹o ¶nh hiÖn t¹i ®Ó sö dông cho dù ®o¸n ¶nh tiÕp theo
Vect¬ chuyÓn ®éng
¶nh kh¸c biÖt
¶nh hiÖn t¹i
¶nh dù ®o¸n
Hình 3.16: Nén liên ảnh(ảnh dự đoán trước)
Trong đó, ảnh trước đó được lưu trữ trong bộ nhớ với đầy đủ độ phân dải, đầy đủ dữ liệu . Còn trong khối “xác định véc tơ chuyển động” với véc tơ chuyển động được tính toán sao cho ảnh hiện tại được dự đoán một cách chính xác nhất. Hiệu giữa ảnh hiện tại và ảnh dự báo sẽ cho ảnh khác biệt ở đầu ra. Số liệu về véc tơ chuyển động và ảnh khác biệt sẽ được truyền đi. Nó không truyền toàn bộ ảnh.
b) Ảnh dự đoán hai chiều(ảnh B):
Đối với mỗi MB ảnh dự đoán 2 chiều sẽ tìm các block giống nhau của các pixel trong hai ảnh là ảnh trước và ảnh sau. Do đó ta nhận được 2 véc tơ chuyển động.
Hình vẽ dưới đây là mạch tạo dự báo ảnh hai chiều (B) :
Xác định vectơ chuyển động
Bù chuyển động
ảnh trước đó (ảnh so sánh)
Bộ cộng
Bộ trừ
+
-
+
+
Vectơ chuyển động
ảnh khác biệt
ảnh hiện tại
ảnh dự đoán
ảnh sau đó (ảnh so sánh)
Hình 3.17. Nén liên ảnh (ảnh dự đoán hai chiều)
Sự khác nhau cơ bản giữa hai mạch trên là :Bộ nhớ ảnh so sánh. Để tạo được dự báo ảnh trước ta chỉ cần nhớ ảnh trước đó. Còn để tạo được ảnh dự báo hai chiều, ta phải nhớ cả hai ảnh : ảnh trước và ảnh sau ảnh đang xét.
Có thể xem ảnh dự báo hai chiều là kết quả nội suy giữa hai ảnh để xác định chuẩn của nó.Vì để tạo được ảnh 2 chiều, bộ giải mã phải xác định nội dung của hai ảnh xác định chuẩn của nó, nên sẽ làm thay đổi thứ tự truyền các ảnh. Bộ mã hoá đầu tiên phải truyền cả hai ảnh chuẩn, sau đó mới truyền đến ảnh dự đoán hai chiều. Điều đó dẫn đến:
_Bộ mã hoá và giải mã phải đánh số lại các frame, lên lam tăng công việc .
_Bộ mã hoá và giải mã phải dùng bộ nhớ lớn .
Cũng có thể có nhiều hơn một khung hình B giữa hai khung hình tham chiếu xuất hiện trước và sau nó.
CHƯƠNG IV: CÁC TIÊU CHUẨN NÉN TÍN HIỆU TRUYỀN HÌNH SỐ
4.1. TIÊU CHUẨN NÉN JPEG
4.1.1. Mục đích
Tiêu chuẩn này được định ra cho nén ảnh tĩnh đơn sắc, thực hiện bởi 4 mode mã hoá. Thuật toán được sử dụng là JPEG Baseline: Nó thực hiện giảm dữ liệu bằng phương pháp nén trong ảnh.
Trên quan điểm coi ảnh động là một chuỗi liên tiếp các ảnh tĩnh. Khi đó, tiêu chuẩn JPEG được áp dụng cho việc nén ảnh động và gọi là nén M-JPEG.
4.1.2. Mã hóa và giải mã JPEG.
Sơ đồ mã hoá và giải mã JPEG
Block 8*8
DCT
lượng tử hoá
mã hoá etropy
Số liệu ảnh nén
Bảng lượng tử
Bảng mã hoá
Số liệu ảnh nén
Giải mã rntrropy
Giải lượng tử
IDCT
Block 8*8
Bảng lượng tử
Bảng mã hoá
Hình 4.1.Sơ đồ khối mã hoá và giải mã JPEG
Quá trình mã hoá và giải mã là hai quá trình ngược nhau. Đặc trưng dùng trong qua trình mã hoá cho ra dòng số liệu sau khi nén và sau đó được đưa tới phần giãn. ở bộ giải nén, bộ mã hoá entropy biến đổi dòng bit được nén thành một bảng zig-zag mới các hệ số DCT. Các hệ số này được nhân với các hệ số giải lượng tử hoá và đưa đến quá trình biến đổi DCT ngược. Đầu ra ta có một khối 8*8 các pixel có thể không tạo lại được ảnh chính xác tín hiệu gốc vì thông tin có thể bị mất trong quá trình mã hoá có tổn hao.
4.1.3. Phân cấp cấu trúc dòng số video
Các tiêu chuẩn nén video ra đời nhằm đạt được các mục đích trình bầy chi tiết các dư thừa thông tin trong tín hiệu và dư thừa do cảm nhận của mắt người, qua đó ta giảm được tốc độ dòng video số, đưa ra dòng số liệu video đã được nén theo một khuôn dang nhất định. Cấu trúc số liệu video JPEG gồm 6 cấp khác nhau, phụ thuộc vào chế độ làm việc của JPEG.
a) Đơn vị số liệu(DU): Nó bao gồm một khối 8*8 các mẫu thành phần trong dạng nén mất thông tin.
b) Đơn vị mã hoá nhỏ nhất(MCU): Là nhóm nhỏ nhất các DU xen kẽ. Nó bao gồm 2 khối Y, một khối Cr và một khối Cb.
c) Đoạn mã entropy(ESC): Gồm các MCU.
d) Quét : Tính chất xác định phương pháp quét cho toàn bộ ảnh.
e) Khung hình : Có thể tạo thành từ một hay nhiều quá trình quét.
f) Lớp ảnh: ảnh là phân cấp trên cùng của phân cấp số liệu nén, bao gồm lớn các khung và các mã cho toàn bộ bức ảnh.
4.1.4. Các tham số theo tiêu chuẩn JPEG
THAM Số
Đặc Điểm
Tín hiệu mã hoá
RGB hoặc Y,Cr ,Cb
Cấu truc lấy mẫu
4:4:4; 4:2:2; 4:2:0
Kích thước ảnh tối đa
65 536* 65 536
Biểu diễn mẫu
8bit cho hệ thống cơ bản
Độ chính xác của quá trình lượng tử và biến đổ DCT
9bit
Phương pháp lượng tử hóa hê số DC
DPCM
Cấu trúc khối trong quá trình lượng tử hoá thích nghi
16*16
Độ chính xác cực đại của hệ số dc
11bit
Bảng lượng tử
Sai lệch giữa các giá trị Y và Cr, Cb
Biến đổi RLC
Mã Huffman
Hệ số cân bằng các khối
Có thể biến đổi
Bù chuyển động
Không
Quét
Tuần tự hay xen kẽ
Kênh truyền
được quản lí lỗi
4.1.5. Tiêu chuẩn M-JPEG
Thực hiện nén JPEG cho từng ảnh động. Nó sẽ đạt kết quả tốt nếu như ảnh có tốc độ chem. Nó có ưu điểm khi sử dụng trong công nghệ sản xuất chương trình truyền hình . Vì các ảnh được mã hoá độc lập với nhau, nên việc thực hiện dựng chính xác tới từng ảnh là hoàn toàn có thể thực hiện được. Đây chính là điểm mạnh của M-JPEG, sử dụng ở trong các thiết bị sản xuất chương trình tiện dụng cho studio và dựng hậu kì, làm kĩ xảo với giá thành hệ thống phù hợp, không gây tổn hao trong quá trình dựng.
4.2. TIÊU CHUẨN NÉN ẢNH MPEG
4.2.1. Giới thiệu về MPEG
T
Các file đính kèm theo tài liệu này:
- BK 1026.docx