Chương I: Hiện trạng và xu hướng phát triển của truyền hình số 2
1.1 Truyền hình số và những vấn đề đặt ra trên con đường chuyển đổi công nghệ 2
1.2 Giới thiệu tổng quan về truyền hình số 5
1.2.1. Đặc điểm chung về truyền hình số
1.2.2. Sơ đồ tổng quát hệ thống truyền hình số
1.3. Khái niệm về DVB
1.3.1. Giới thiệu chung
1.3.2. Cơ sở lý thuyết cho các tiêu chuẩn DVB
1.3.3. Một số tiêu chuẩn DVB chính
1.3.3.1. Truyền hình số qua vệ tinh (DVB - S)
1.3.3.2. Truyền hình số qua mạng cáo (tiêu chuẩn DVB - C)
1.3.3.3. Truyền hình số qua mạng cáp (tiêu chuẩn DVB - C)
1.3.3.4. Nhận xét
Chương 2: Các tiêu chuẩn truyền hình số
2.1. Chuẩn ATSC
2.2.2. Đặc điểm chung
2.1.2. Phương pháp điều chế VSB của tiêu chuẩn ATSC
2.1.3. Máy phát VSB
2.1.4. Máy thu VSB
2.2. Chuẩn DVB
2.2.1. Đặc điểm chung
2.2.2 Phương pháp điều chế COFDM trong tiêu chuẩn DVB
Phần II: Nén tín hiệu số
Chương I: Tổng quan về nén
1.1. Khái niệm chung
1.1.1 Định nghĩa
1.1.2 Mục đích của nén tín hiệu số
1.1.3. Mã hoá (Coder) và giải mã D (Dicoder)
1.3.3.1. Mã hoá dự đoán (Predictive coding)
1.3.3.2. Mã hoá chuyển đổi (Transform Coding)
Chương II: Một số công nghệ nén
2.1. Nén vidieo: Điều xung mã vi sai - DPCM (Differrential puse code modulation).
2.1.1. Xử lý giải tương hỗ trong công nghệ DPCM
2.1.2 Kỹ thuật tạo dự báo
2.1.2.1 Sai số dự báo (Prendiction error)
2.1.2.2 Tạo dự báo cho ảnh truyền hình - các phương thức thực hiện 34
2.1.2.3 Tạo dự báo intra (intra prediction)
2.1.2.5 Sự giảm tốc độ dòng bít từ việc tạo giá trị dự báo
2.1.3. Lượng tử hoá sai số dự báo
2.1.4. Khái niệm bù chuyển động (motion compensation) và vectơ chuyển động (motion vecto)
2.1.5. Ước lượng chuyển động bằng phương pháp tìm kiếm khối tương đồng (Block matching)
2.1.5.1. Tìm kiếm ba bước véc tơ chuyển động
2.1.5.2 Giải thuật tìm kiếm hai chiều
2.1.5.3 Giải thuật tìm kiếm hai hướng liên hợp
2.1.6. Hệ thống DPCM có bù chuyển động
2.2. Nén Video: Công nghệ mã hoá chuyển đổi (Tc - Tranform Coding)
2.2.1. Xử lý giải tương hỗ trong công nghệ TC
2.2.2 Biến đổi cosin rời rạc (discrete cosine tranform - DCT)
2.2.3.3 Lượng tử hoá lấy mẫu từng vùng (zonal sampling)
2.2.3.3. Lượng tử hoá có trọng số
2.2.4 Quét các hệ số DCT
2.2.5 Mã hoá các hệ số DCT
2.2.6 Hệ thống nén Video công nghệ mã hoá chuyển đổi
2.3. Sự kết hợp các công nghệ nén
Chương 3: Nén Video theo chuẩn MPEG
3.1. Khái quát về các tiêu chuản nén
3.2. Nén video theo MPEG - 1
3.2.1 Các thành phần ảnh cơ bản trong chuẩn nén MPEG
3.2.2. Sự phân loại ảnh MPEG
3.2.3. Tiêu chuẩn MPEG - 1
3.2.4 Hệ thống nén MPEG - 1
3.3. Nén tín hiệu video theo MPEG - 2
3.3.1. Tiêu chuẩn nén video MPEG -2
3.3.2. Khả năng co giãn của MPG - 2
3.3.3 MPEG - 2 : Profile và Level
3.4. Ghép kênh Audio - Viedeo số theo tiêu chuẩn MPEG -2
3.4.1. Hệ thống truyền tín hiệu MPEG-
3.4.2 Dòng dữ liệu đóng gói, dòng chương trình và dòng truyền tải
3.4.2.1 Dòng dữ liệu đóng gói (Packetized Elementary Stream - PES)
3.4.2.2. Dòng chương trình (Program Stream - PS) và dòng truyền tải (Transport Stream - TS).
3.4.3. Dòng truyền tải MPEG - 2
3.4.3.1 Tính linh hoạt của dòng truyền tải
3.4.3.2. Khả năng liên vận hành của dòng truyền tải
3.4.3.3. Sự phân loại dòng truyền tải - dòng truyền tải đa chương trình
3.4.3.4 Thông tin đặc tả chương trình PSI (Program specific information)
3.4.4 Đình thời và đồng bộ sử dụng dòng truyền tải MPEG - 2
Chương 4: Nén tín hiệu Audio
4.1 Cơ sở của nén dữ liệu audio
4.1.1 Mô hình tâm lý thính giác
4.1.2 Sự che lấp tín hiệu audio
4.2. Công nghệ giảm tốc độ nguồn dữ liệu audio số
4.3. Tiêu chuẩn nén Audio MPEG
Kết luận
Mục lục
93 trang |
Chia sẻ: huong.duong | Lượt xem: 1743 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Đề tài Nghiên cứu về nén tín hiệu trong truyền hình số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
có khối nhớ khung (frame memory or frame store) lưu trữ dữ liệu khung trưóc đó để tính toán đo đạc chuyển động bằng cách so sánh giữa khung cũ và khung mới. Từ đó tạo dựng khung dự báo có bù chuyển động ở đầu ra bộ tạo dự báo. Việc thực hiện đo đạc chuyển động ở bên phát căn cứ vào khung hiện tại mà bên thu chưa có. Bởi vậy, một phép đo như vậy không thể đồng thời tiến hành ở cả bên thu và bên phát mặc dù thông tin vectơ chuyển động là cần cho bên thu để tạo dự báo. Cho nên thông tin về chuyển động (các vectơ chuyển động của các MB (Macroblock)) được truyền tới bên thu nhờ một kênh phụ. Hệ thống DPCM có bù chuyển động là hệ thống có bộ tạo dự báo không nhân quả.
eq
e e
Mã hoá
entropy
Lượng tử
hoá
Kênh
V’
V=tín hiệu đầu vào
e=V-P= sai số dự báo
eq =sai số lượng
V'=e q+p=tín hiệu khôi phục
q
Bộ tạo dự báo
Bộ mã hoá DPCM
Giải mã entropy
V'
Kênh + eq + Đầu ra đã mã hoá +
Bộ tạo dự báo
p
Bộ giải mã DCPM
Hình 3.7 . Mã hoá, giải mã DPCM.
3.2. Nén Video: Công nghệ mã hóa chuyển đổi (TC - Tranform Coding).
Công nghệ mã hóa chuyển đổi có một vai trò quan trọng trong nén ảnh truyền hình. Nếu công nghệ DPCM chỉ cho ảnh chất lượng cao tại tốc độ dòng bit cao thì công nghệ nén “mã hóa chuyển đổi - Tranform Coding” có khả năng sử dụng cùng một thuật toán cho một dải tốc độ bit và chỉ làm suy giảm chất lượng ảnh phục hồi tại tốc độ dòng bít vô cùng thấp.
3.2.1. Xử lý giải mã tương hỗ trong công nghệ TC.
Trong khi công nghệ “điều xung mã vi sai” DPCM xử lý tín hiệu trong miền thời gian thì công nghệ nén “mã hóa chuyển đổi TC” xử lý tín hiệu trong miền tần số. Việc loại bỏ tính có nhớ của nguồn tín hiệu được thực hiện bằng một phép biến đổi có tính thuận nghịch, chuyển một khối các điểm ảnh trong miền thời gian thành khối các hệ số trong miền tần số (mỗi hệ số đại diện cho một tần số tín hiệu của khối) bằng phép biến đổi thuận và hồi phục các điểm ảnh từ khối các hệ số bằng phép chuyển đổi nghịch.
Phép biến đổi phù hợp nhất cho nén tín hiệu video là phép biến đổi cosin rời rạc (Discrete consine tranform - DCT), thay vì lượng tử hóa và mã hóa trực tiếp biên độ điểm ảnh, người ta sẽ lượng tử hóa và mã hóa các hệ số DCT.
3.2.2. Biến đổi cosin rời rạc (Discrete consine tranform - DCT).
DCT là phép biến đổi giá trị một khối các điểm ảnh thành một khối các hệ số trong miền tần số.
Công thức tính toán cho DCT - 2D với ma trận vuông giá trị điểm NxN sinh ra ma trận vuông hệ số tuần tự như sau:
Trong đó:
F(u,v) = hệ số các khối DCT N x N.
F(x,y) = giá trị mẫu của khối N x N điểm ảnh.
u = tần số trục ngang
v = tần số trục đứng.
C (u), C (v) = 1 nếu u,v = 1,2,...,7
DCT có một tính chất quan trọng, đó là tính biến đổi thuận ngịch. Có nghĩa là từ khối các hệ số có thể hồi phục giá trị các điểm ảnh ban đầu theo công thức chuyển đổi ngược, như sau:
Trong kỹ thuật nén ảnh số, kích cỡ khối được chọn là 8 x 8 vì các lý do sau:
* Thứ nhất: việc nghiên cứu đã chỉ ra rằng Hàm hiệp phương sai (converriance) suy giảm rất nhanh khi khoảng cách pixel mà ở đó Hàm hiệp phương sai được định nghĩa vượt quá 8. Vì vậy, phương pháp nén sử dụng việc loại bỏ các thông tin dư thừa về không gian không cần quan tâm đến các khối pixel lớn hơn 8.
* Thứ hai: Là thuận tiện cho việc tính toán và thiết kế mạch cứng.
Khối 8x8 sau đó được biến đổi với vùng tần số bằng biến đổi 2-D DCT. Đầu ra bộ biến đổi sẽ là 64 giá trị biểu diễn các hệ số của các thành phần tần số trong khối 8x8. Như vậy, hầu hết các thông tin về khối nằm ở vùng tần số thấp và giá trị các hệ số tần số cao rất nhỏ do giá trị các pixel gần nhau thường giống nhau.
Như vậy biểu thức biến đổi DCT thuận cho nén ảnh số như sau:
Hệ số đầu tiên có u=v=0.
Khi đó:
Hệ số này =1/8 tổng giá trị các điểm ảnh trong khối, đại diện cho mức năng lượng trung bình của các điểm ảnh, gọi là hệ số DC (tần số = 0). Các hệ số còn lại, đại diện cho các thành phần tần số không gian cao hơn, gọi là các hệ số AC. Sự biến đổi (mức chênh lệch) giá trị biên độ các điểm ảnh theo hướng nào càng lớn thì các hệ số AC theo hướng đó càng cao. Nếu trong khối ảnh có sự dư thừa không gian lớn thì rất nhiều hệ số AC xấp xỉ hoặc bằng 0.
Sau đây là ví dụ về phép biến đổi DCT 1 chiều cho 8 giá trị tín hiệu chói của dãy 8 điểm ảnh liên tiếp nhau:
Trong đó:
* b,c biểu diễn giá trị trung bình DC và thay đổi mức chói của các điểm ảnh.
* d biểu diễn sự biến đổi biên độ giữa 8 điểm ảnh trong dải tần từ 0 Hz đến 6,75 Hz.
Phép biến đổi DCT chia dải phổ này thành 8 băng, sẽ cho 8 hệ số xác định năng lượng phổ của sóng trong từng dải băng tần này.
591
105
-18
28
-34
14
18
3
Hệ số AC
98
92
95
80
75
82
68
50
DC
FS/2 tần số
8 điểm chói liên tiếp từ một dòng
0 T0 2t0 3t0 thời gian
a: Biên độ chói của 8 điểm liên tiếp b: Mức năng lượng trung bình của khối 1 x 8
Sự biến đổi Năng lượng
độ chói của
điểm
c: Sự biến đổi so với mức trung bình d: Phổ của khối 1 x 8 điểm chói
Năng lượng
Tần số
0 F0 2F0 3F0
e: Sự chia băng tần phổ chói
Hệ số DC
f: Khối 1 x 8 hệ số DCT
Hình 3.8 Phép biến đổi DCT một chiều
Phép biến đổi DCT-2D thực chất được xây dựng từ hai biến đổi DCT - 1D theo chiều ngang và theo chiều đứng. Phép biến đổi cosin rời rạc hai chiều cho một khối 8x8 điểm ảnh được minh hoạ bằng hình sau đây:
Khối 8 X 8 giá trị điểm ảnh
98
92
95
80
75
82
68
50
97
91
94
78
74
81
67
49
95
89
92
77
72
79
65
47
93
87
91
75
70
77
63
45
91
85
88
73
68
75
61
43
89
83
86
71
66
73
59
41
87
81
84
69
64
71
57
39
85
79
82
67
62
69
55
37
Hàng cuối cùng
àng đầu tiên
0 T0
Biên độ điểm chói
Thời gian
2T 0
3T0
Biên độ điểm chói
Thời gian
2T0
3T0
0 T0
98
Biên độ điểm
Thời gian (chiều đứng)
Biên độ điểm
Th ời gian (chiều đứng)
Tần số u
Chiều ngang
Tần số v
Chiều đứng
Thời gian (chiều đứng)
Năng lượng
591
106
18
28
34
14
18
3
35
0
0
0
0
0
0
0
-1
0
0
0
0
0
0
0
3
0
0
0
0
0
0
0
-1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
-1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
7
V
0
u
7
Khối 8x8 hệ số biến đổi DCT
Hình 3.9. Biến đổi DCT 2 chiều khối 8x8 điểm ảnh.
Trên thực tế, phép biến đổi DCT cho một giá trị hệ số DC cao và các giá trị hệ số AC rất nhỏ. Giá trị điểm - điểm của khối thay đổi theo hướng nào càng nhiều thì giá trị các hệ số AC theo hướng tương ứng càng cao.
Bản thân DCT không nén dữ liệu, nó không làm giảm tốc độ bít. Bởi vậy, để nén dữ liệu người ta cần lượng tử hóa các hệ số DCT theo một bảng trọng số nhất định sao cho các hệ số khác 0 ứng với lượng thông tin trong một khối là nhỏ nhất. Đồng thời các hệ số DCT cũng được quét theo một cách đặc biệt để số hệ số 0 đi liền nhau liền nhất nhằm giảm bớt số bit cần dùng cho mã hóa hệ số DCT.
3.2.3. Lượng tử hóa các hệ số DCT.
Quá trình lượng tử hóa và mã hóa các hệ số DCT chính là quá trình làm giảm tốc độ bit vì bản thân phép biến đổi DCT không nén thông tin. Đây là khâu nhạy cảm nhất trong một hệ thống nén vì nó quyết định trực tiếp chất lượng ảnh khôi phục.
3.2.3.1. Đặc tính thị giác của mắt người .
Mắt người không nhạy cảm với các thành phần tần số cao tức là kém phát hiện sai số tại những vùng ảnh có nhiêù chi tiết, biến đổi nhanh. Sự phân giải theo hướng xiên thì ít ảnh hưởng tới chất lượng ảnh hơn các hướng ngang và thẳng đứng. Điều này có nghĩa là sai số lượng tử của cá hệ số DCT khác nhau là không đều. Sai số của các hệ số tần số cao cũng như hệ số theo đường chéo ít ảnh hưởng hơn tới chất lượng ảnh khôi phục.
` Để minh hoạ cho vấn đề trên, ta xét ví dụ sau đây:
Trong bảng hệ số DCT của ảnh, làm nhiễu đi mỗi nửa ảnh giá trị ba hệ số:
* Nửa bên trái làm sai khác ba hệ số C11, C12, C21của tần số thấp.
* Nửa bên phải làm sai khác ba hệ số C1010, C1011, C1110 của tần số cao.
Thì nhận thấy rằng: Dù mức nhiễu là như nhau cho cả hai nửa ảnh song dễ dàng nhận thấy lỗi ở nữa bên trái hơn (chất lượng ảnh kém hơn).
Điều này cho thấy hoàn toàn có thể sử dụng bộ lượng tử hóa có bước lượng tử thô hơn cho các hệ số DCT tần số cao và theo hướng chéo.
3.2.3.2. Lượng tử hóa lấy mẫu từng vùng (zonal sampling).
Phương pháp lượng tử hóa các hệ số DCT đơn giản nhất là lấy mẫu theo từng vùng, theo nguyên tắc sau: Loại bỏ một phần hệ số tần số cao mà mã hóa phần còn lại bằng số lượng bit cố định, có thể hiểu đây như một bộ lượng tử cửa một bước lượng tử duy nhất. Phương pháp này đơn giản nhưng rất nhiều hạn chế:
* Không tận dụng được đặc tính thị giác của con người là không nhạy cảm với tần số cao, cũng như không tận dụng được đặc tính khó nhận biết sai số trong vùng ảnh có độ linh hoạt cao.
* Từ mã có độ dài cố định không cho sự tối ưu trong việc giảm tốc độ bit. Đặc biệt khi dùng đồng bộ lượng tử hóa tuyến tính. Một từ mã sẽ được truyền đi cho dù giá trị hệ số lượng tử là 0, có rất nhiều hệ số DCT sau khi lượng tử trở về giá trị 0 dẫn đến hiệu suất nén rất thấp.
3.2.3.3. Lượng tử hóa có trọng số.
Đây là phương pháp lượng tử hóa tối ưu cho nén ảnh. Trong đó sử dụng bộ lượng tử hóa tuyến tính có một dải các bước lượng tử. Mỗi hệ số DCT khác nhau sẽ được lượng tử tuyến tính theo bước lượng tử phù hợp. Bước lượng tử này được quyết định dựa trên nhiều yếu tố. Đó là:
a Bảng trọng số HVS weighiting table.
Đặc tính cảm nhận của mắt người chỉ nhạy cảm với tần số thấp và hướng biến đổi dọc, ngang mà không nhạy cảm với tần số cao cũng như sự thay đổi theo hướng chéo, dẫn đến mức độ quan trọng của các hệ số tuỳ thuộc vào vị trí. Những hệ số tần số cao và theo hướng chéo có thể được lượng tử hóa theo bước lượng tử thô hơn. Điều này đã được nghiên cứu và liệt kê trong một bảng trọng số dành cho lượng tử hóa gọi là HVS. Ví dụ bảng trọng số được mặc định trong tiêu chuẩn nén JPEG như sau:
Bảng 3.1 Trọng lượng tử hóa của chuẩn JPEG cho tín hiệu chói và tín hiệu màu.
a Mức độ linh hoạt của từng vùng ảnh.
Trong vùng ảnh có độ linh hoạt cao, lỗi mã hóa khó nhận biết hơn nên tại đây có thể sử dụng bước lượng tử hóa lớn hơn. Người ta tiến hành phân đoạn ảnh và đo đạc mức linh hoạt M cho từng đoạn, từ đó tạo ra một tác nhân trọng số ak (k = 1,2,...,M) cho M mức. Tham số ak sẽ càng nhỏ nếu mức độ linh hoạt càng cao và chỉ được đánh giá cho hệ số AC bởi hệ số DC chưa năng lượng trung bình của khối. Chỉ có các hệ số AC xác định độ tương phản và biến thiên giá trị các điểm ảnh trong khối.
a Đặc tuyến của bộ đệm dữ liệu.
Có thể dễ dàng nhận thấy số bit truyền tải của mỗi đoạn ảnh này tuỳ thuộc vào nội dung của đoạn ảnh đó. Đối với đoạn ảnh có độ tương phản thấp, số bit mã hóa sẽ thấp vì năng lượng của cả đoạn sẽ tập trung vào hệ số DC. Với vùng ảnh có hoạt tính cao, ngoài hệ số DC còn có một số các hệ số AC cần mã hóa dẫn đến làm tăng số bit. Trong khi đó, tốc độ các kênh truyên tải luôn là hằng số, nên các bit mã hóa phải được đưa qua một bộ nhớ đệm để điều chỉnh tốc độ bít đầu ra không thay đổi cho dù có sự biến thiên của tốc độ bit đầu vào.
Dung lượng của bộ nhớ này hạn chế nên khả năng tràn bộ nhớ là hoàn toàn có thể xảy ra khi tốc độ bít đầu vào quá lớn. Để tránh điều này cần có sự điều khiển bộ nhớ đệm. Trạng thái B của bộ nhớ tạo ra một tác nhân trọng số f (B) tác động lên thang lượng tử. B càng lớn (bộ đệm càng đầy) thì trọng số càng nhỏ tức bước lượng tử càng lớn để giảm bớt tốc độ bít đầu vào.
Hình 3.10 : Đặc tuyến của bộ đệm dữ liệu.
Tổng hợp tất cả các tác nhân đã xét:
* Trọng số từ bảng HVS: Wij.
* Trọng số mức linh hoạt: ak.
* Trọng số tình trạng bộ đệm: f(B).
Kết hợp với nhau tác động lên thang lượng tử để có bước lượng tử phù hợp nhất cho các hệ số DCT. Chất lượng bộ lượng tử càng cao nếu sự kết hợp này càng chính xác. Khi đó, chất lượng ảnh khôi phục là tốt nhất và vẫn đạt được tốc độ dòng bít thấp. Thông thường, bước lượng tử thấp cho hệ số DC và AC tần số thấp, bước lượng tử thô dành cho các hệ số AC tần số cao.
3.2.4. Quét các hệ số DCT.
Dòng số là dòng truyền tải các bít nối tiếp nhau theo thời gian. Do vậy cần một quá trình sắp xếp các hệ số DCT đã lượng tử trong ma trận hai chiều thành một dãy chiều nối tiếp nhau. quá trình đó gọi là quét hệ số DCT.
Qua nghiên cứu ta thấy rằng; có hai dạng thức quét cho hệ số “0” đứng cạnh nhau lớn nhất, tạo thuận lợi cho việc giảm tốc độ bít khi mã hóa. Đó là quét “zig zag” và quét luân phiên “alternate”.
Hình 3.11. Quét các hệ số DCT
3.2.5. Mã hóa các hệ số DCT.
Sau khi quét, các hệ số DCT gồm rất nhiều hệ số 0 đi liền nhau nên được mã hóa bằng loạt dài RLC (run length coding) rồi tiếp tục mã hóa Huffman VLC (variable length coding) sao cho giảm tối thiểu được tốc độ dòng bit. Việc mã hóa được quy định bởi các bảng mã, ứng với mẫu đầu vào đối chiếu theo bảng mã sẽ cho từ mã đầu ra tương ứng.
Hạng
Giá trị hệ số
NA
0
1
-1
1
2
-3,-2
2,3
3
-7,-6,-5,-4
4,5,6,7
4
-15..........-8
8..........15
5
-36................-31
31................36
6
-63.....................-32
32..................... 63
7
-127...........................-68
68...........................127
8
-255...............................-128
128...............................255
.....
..........
Bảng 3.2. Giá trị hệ số AC và phân hạng
Vi sai giá trị DC
Hạng
Từ mã cho tín hiệu màu
Từ mã cho tín hiệu chói
-255............-128
8
1111
110
1111
1110
-127..........- 64
7
1111
10
1111
110
-63.........-32
6
1111
0
1111
10
-31......-16
5
1110
1111
0
-15....-8
4
110
1110
-7....-4
3
101
110
-3...-2
2
01
10
-1
1
00
01
0
0
10
00
1
1
00
01
2...3
2
01
10
4....7
3
101
110
8....15
4
110
1110
16......31
5
1110
1111
0
32.........63
6
1111
0
1111
10
64............127
7
1111
10
1111
110
128..............255
8
1111
110
1111
1110
Bảng 3.3. Bảng mã hóa Huffman cho hệ số DC
Chuỗi 0
Hạng
Độ dài mã
Từ mã
0
1
1
00
0
2
2
01
0
3
3
100
0
4
4
1011
0
5
5
11010
0
6
6
111000
00
7
7
11110000
...
...
...
...
1
1
4
1100
1
2
6
111001
1
3
7
1111001
1
4
9
111110110
...
...
...
...
20
1
5
11011
2
2
8
11111000
...
...
...
...
3
1
6
111010
3
2
9
111110111
...
...
...
...
4
1
9
111011
500
1
7
1111010
6
1
7
1111011
7
1
8
11111001
8
1
8
11111010
9
1
9
11111000
10
1
9
11111001
11
1
9
111111010
...0
...
...
...
End of block
4
1010
Bảng 3.4. Bảng mã Huffman cho hệ số AC mặc định trong tiêu chuẩn JPEG.
Hình vẽ sau minh hoạ cho quá trình quét và mã hóa một khối các hệ số DCT.
Hình 3.12 Quét Zig Zag và mã hóa Huffman.
3.2.6. Hệ thống nén Video công nghệ mã hóa chuyển đổi.
Sơ đồ hệ thống nén ảnh sử dụng công nghệ “mã hóa chuyển đổi” như sau:
Các tín hiệu chói Y và màu (CR, CB) được đưa vào bộ định dạng khối. Một Macroblock gồm hai khối Y và hai khối tín hiệu màu CR, CB. Đầu ra bộ định dạng khối, các mẫu điểm sẽ được sắp xếp thành các khối 8x8. Bốn khối (hai khối Y và hai khối màu CR, CB tạo nên một khối Macroblock (MB). Các MB sẽ được xử lý lượng tử, mã hóa độc lập với nhau. Các MB điểm ảnh được chuyển đổi sáng vùng tần số bằng bộ chuyển đổi cosin rời rạc DCT. Khối hệ số DCT được lượng tử hóa và mã hóa theo RLC và VLC. Bộ lượng tử hóa sẽ chịu sự tác động của 4 yếu tố sau, để cho bước lượng tử phù hợp với từng hệ số DCT:
* Trọng số của bảng HVS.
* Sự phân loại năng lượng khối.
* Tín hiệu điều khiển chiếm cứ bộ nhớ.
* Khối ID.
Block ID (Indentificcation Block) là các khối điểm cho phép tín hiệu chói và màu được lượng tử hóa độc lập với nhau. Do tốc độ dòng bit mã hóa thay đổi nên cần sử dụng một bộ nhớ đệm để giữ cố định tốc độ dòng bít đầu ra.
Hình 3.13 . Nén ảnh theo công nghệ Transform Coding.
Hình 3.14 Giải mã DCT.
2.3. Sự kết hợp các công nghệ nén.
Nếu sử dụng một cách tách biệt, không có công nghệ nén nào có khả năng tạo một quá trình nén có dòng bít ra tốc độ thấp mà vẫn đảm bảo chất lượng ảnh đạt yêu cầu. Bởi vậy mọi cách thức nén hiện nay đều là sự kết hợp chuẩn xác giữa các công nghệ nén. Sự kết hợp này sau đó được chuẩn hóa trở thành các tiêu chuẩn nén: JPEG, JPIG, MPEG, kết hợp các công nghệ nén được hiểu là tạo ra một quá trình nén nhiều bậc nhằm đạt được hiệu suất nén cao. Tiêu chuẩu nén phổ biến hiện nay là MPEG, sử dụng kết hợp cả hai công nghệ nén “Điều xung mã vi sai” DPCM và “mã hóa chuyển đổi” - TC. Sự kết hợp này còn được gọi là “DPCM/DCT cân bằng”. Sơ đồ quá trình nén như sau:
Hình 3.15. Mã hóa DCT dự báo có bù chuyển động
(Bộ mã hóa MPEG -2)
a Quá trình nén như sau:
* ảnh truyền đi được định dạng thành các khối 8x8 điểm ảnh, các khối này sẽ được xử lý độc lập với nhau.
* Trước tiên sử dụng công nghệ DPCM liên ảnh có bù chuyển động để tạo được khung dự báo rất tương đồng với khung hiện hành, tạo sai số dự báo là hiệu giữa khung hiện hành và khung dự báo có bù chuyển động của nó. Khung sai số dự báo có lượng thông tin thấp.
+ Khung sai số dự báo sẽ chuyển sang miền tần số bằng phép biến đổi cosin rời rạc và tiếp tục được nén bằng công nghệ mã hóa chuyển đổi và truyền sang phía thu.
+ Vectơ chuyển động kết quả của qúa trình ước lượng chuyển động sẽ được ghép kênh với thông tin gửi sang bên thu phục vụ cho quá trình tạo dự báo có bù chuyển động ở bên thu khi khôi phục ảnh.
+ Bộ cộng S1: Lấy hiệu giữa khung dự báo vào khung hiện hành để tạo khung sai số dự báo.
+ Do quá trình ước lượng và bù chuyển động cũng như tạo dự báo cho khung (n+1) cần sử dụng khung (n) và chính bản thân khung (n+1). Nên sai số dự báo của khung (n) đã chuyển đổi DCT và lượng tử hoá sẽ được khôi phục lại bằng giải lượng tử và chuyển đổi DCT ngược và cộng với dự báo của khung (n) bằng bộ cộng S2. Kết quả khung (n) được khôi phục cùng khung (n+1) đưa từ đầu video vào tới bộ ước lượng chuyển động để so sánh, tính toán vevthoặc chuyển động tạo khung dự báo (n+1).
+ Bộ đệm dữ liệu đầu vào nhằm điều chỉnh tốc độ bit ra ổn định dù có sự biến thiên tốc độ đầu vào.
+ Bộ tạo dự báo của công nghệ DPCM nằm trong khối gạch rời.
Chương iiii :
Nén Video theo chuẩn MPEG.
Các công nghiệp nén ảnh “Điều xung mã vi sai - DPCM”, “Mã hoá chuyển đổi - TC” và một số công nghệ nén khác được kết hợp với nhau nhằm tạo một cách thức nén ảnh có hiệu suất cao, chất lượng ảnh khôi phục tốt. Sự kết hợp này được tiêu chuẩn hoá trong các tiêu chuẩn nén sử dụng hiện nay: JPEC, JBIG, MPEG.
4.1. Khái quát về các tiêu chuẩn nén.
Tại sao cần phải có các tiêu chuẩn nén?
Tiêu chuẩn nén cũng như ngôn ngữ chính thống của mỗi quốc gia, mỗi nước lại có nhiều dân tộc với nhiều ngôn ngữ khác nhau. Nhưng để giao tiếp thuận tiện thì cần có một ngôn ngữ thống nhất cho mỗi quốc gia. Như vậy chìa khoá cho “ sự giao tiếp được dễ dàng” là cần có các tiêu chuẩn nén để thuận tiện trao đổi giữa các hệ thống khác nhau.
Vậy tại sao cần nhiều tiêu chuẩn nén?
Có rất nhiều ứng dụng khác nhau trong thực tế vì vậy chúng ta cần có nhiều tiêu chuẩn khác nhau, không có bất cứ tiêu chuẩn nén nào có thể đáp ứng được tất cả các yêu cầu ứng dụng đó.
Các tiêu chuẩn nén gồm hai mức: Mức quốc gia và mức quốc tế.
* ở mức quốc gia có: ANSI (American National Srandard Institute)
AIIM (Association of Image and Information).
Tại Canađa có tổ chức tiêu chuẩn của Canađa (Canadian Standards Assciation and the Standars Council lf Canada).
* ở mức quốc tế: ISO (Internationnal Standards Organization)
IEC (Internationnal Electrotechnnical Commission)
ITU (Internationnal Telecommuniccation Union)
CCITT và một số tổ chức khác.
Các tiêu chuẩn nén với ứng dụng của chúng được khái quát trong bảng sau đây:
Chuẩn
Phạm vi ứng dụng
CCITT T.4
Fax, ảnh dữ liệu
CCITT T.6
Fax, ảnh dữ liệu
JPEG
ảnh
IBIG
Fax, ảnh dữ liệu
CCITT H.261
Điện thoại hình
MPEG - 1
ảnh, lưu trữ dữ liệu số (DSM)
MPEG - 2
ảnh, HDTV, DSM
MPEG - 4
Truyền thanh thông thường, quảng bá, cảm nhận từ xa.
*Chuẩn nén MPEG:
MPEG là một chuỗi các chuẩn : MPEG - 1, MPEG - 2 và MPEG - 4. Trong đó MPEG - 1 là cơ bản, MPEG - 2 và MPEG - 4 được mở rộng và phát triển từ MPEG - 1.
MPEG - 1 còn được gọi là tiêu chuẩn ISO/IEC 11172, là chuẩn nén Audio và Video với tốc độc khoảng 1,5 Mb/s.
MPEG - 2 nén tín hiệu video và audio với một dải tốc độ 1,5 - 60Mb/s. Tiêu chuẩn này còn được gọi là chuẩn quốc tế ISO/IEC 13818, là chuẩn nén ảnh động và âm thanh. Nó cung cấp một dải ứng dụng như: Lưu trữ dữ liệu số, truyền hình quảng bá và truyền thông.
MPEG - 4 là sự hợp nhất cung cấp cho rất nhiều ứng dụng truyền thông truy cập, điều khiển dữ liệu âm thanh số như : điện thoại hình, thiết bị đầu cuối đa phương tiện, thư điện tử ... MPEG - 4 cho khả năng truy cập rộng rãi và hiệu suất nén rất cao.
4.2. Nén vieo theo MPEG - 1
Tiêu chuẩn MPEG - 1 gồm 4 phần:
* Phần 1: Hệ thống (ISO/IEC 11172 - 1)
* Phần 2: Nén video (ISO/IEC 11172 - 2)
* Phần 3: Nén audio (ISO/IEC 11172 - 3)
* Phần 4: Kiểm tra (ISO/IEC 11172 - 4)
MPEG - 1 nghiên cứu cách thức ghép nối một hoặc vài dòng dữ liệu chứa thông tin thời gian để hình thành nên một dòng dữ liệu. Nó cung cấp quy tắc cú pháp đồng bộ hoá quá trình phát lại cho một dải ứng dụng Video rộng.
MPEG - 1 coi ảnh chuyển động như dạng thức dữ liệu máy tính (gồm các điểm ảnh), cũng như các dữ liệu máy tính (ảnh và văn bản), ảnh video chuyển động có khả năng truyền và nhận bằng máy tính và mạng truyền thông, chúng cũng có thể được lưu trữ trong các thiết bị lưu trữ dữ liệu số như đĩa CD, đĩa Winchester và ổ quang.
MPEG - 1 cung cấp cả các ứng dụng đối xứng và không đối xứng:
* Trong ứng dụng không đối xứng, ảnh động được nén một lần, sau đó giải nén nhiều lần để truy cập thông tin (VD: trò chơi games).
* Trong ứng dụng đối xứng, quá trình nén và giải nén phải cân bằng nhau (VD: Điện thoại hình, thư điện tử).
Để đạt được hiệu suất nén cao mà vẫn giữ tốt chất lượng ảnh phục hồi, chuẩn MPEG -1 sử dụng cả công nghệ nén trong ảnh (Intraframe) và liên ảnh (Intraframe) để loại bỏ được sự dư thừa và không gian và thời gian.
Do MPEG - 1 được phát triển cho lưu trữ dữ liệu số nên đòi hỏi có sự truy cập ngẫu nhiên ( Random Acccess). Cách thức mã hoá tốt nhất cho sự truy cập ngẫu nhiên là mã hoá Intraframe đơn thuần. Song sự dư thừa thông tin về thời gian chưa được loại bỏ nên hiệu suát nén rất thấp. Do vậy trong tiêu chuẩn nén MPEG - 1 có sự cân bằng giữa nén trong ảnh và nén liên ảnh bằng cách sử dụng các công nghệ sau đây:
* Bù chuyển động
* Dự báo
* Nội suy
* Biến đổi cosin rời rạc
* Lượng tử hoá
* Mã hoá độ dài thay đổi (mã Huffman - VLC)
Tức là có sự kết hợp hai công nghệ nén: Biến đổi cosin rời rạch DPCM và mã hoá chuyển đổi (TC). Thuật toán nén MPEG - 1 sử dụng bù chuyển động khối để giảm sự dư thừa thời gian với véc tơ chuyển động cho mỗi khối kích thước 16 x 16 điểm ảnh
Bù chuyển động được sử dụng cho cả dự báo nhân quả và không nhân quả. Dự báo nhân quả tạo dự báo ảnh hiện hành từ ảnh trước đó. Dự báo không nhân quả tạo dự báo cho ảnh hiện hành dựa trên ảnh quá khứ và cả tương lai.
Vòng lặp DPCM được sử dụng để tạo khung sai số dự báo. Sau đó, công nghệ mã hoá chuyển đổi chuyển khung sai số này sang miền tần số để nén các hệ số nhờ lượng tử hoá và mã hoá Huffman trước khi chuyển tải hay lưu trữ.
4.2.1. Các thành phần ảnh cơ bản trong chuẩn nén MPEG
Các tiêu chuẩn MPEG cấu trúc dữ liệu dạng lớp, bao gồm các thành phần cơ bản sau đây:
* Khối (Bock): Đây là đơn vị cơ bản cho chuyển đổi DCT, bao gồm 8x8 điểm ảnh tín hieuẹ hoặc tín hiệu màu.
* Macro Block: Đây là nhóm các khối DCT tương ứng với thông tin của một cửa sổ 16 x 16 điểm ảnh gốc, có nhiều dạng Macro Block khác nhau phụ thuộc vào cấu trúc lấy mẫu được sử dụng
4:2:2 Macroblock
Y CB CR
1
2
4
3
5
6
8
7
4:4:4 Macroblock
1
2
5
6
9
10
3
4
7
8
11
12
Y/G CB CR
4:2:0 Macroblock
1
2
5
6
3
4
Y
CB
CR
4:1:1 Macroblock
1
2
3
4
5
6
Y
CB
CR
Hình 4.1. Cấu trúc Macroblock của các dạng lấy mẫu
Phần đầu đề (Header) của Macroblock chứa thông tin phân loại (Y, CBvà CR) và véc tơ bù chuyển động tương ứng.
* Lát (Slice):
Slice được cấu thành tư một hay một số MB liên tiếp nhau. Phần header của Slice chứa thông tin về vị trí của nó trong ảnh và tham số quét lượng tử (quantized scaling factor). Kích cỡ của Slice quyết định bởi mức bảo vệ lỗi cần có trong ứng dụng vì bộ giải mã sẽ bỏ qua Slice bị lỗi. Hệ số một chiều DC được định vị tại điểm bắt đầu mỗi Slice.
* ảnh:
Lớp ảnh cho bên thu biết về loại mã hóa khung I,P,B. Phần header mang thứ tự truyền tải của khung để bên thu hiển thị theo đúng thứ tự, ngoài ra còn có một số thông tin bổ sung như thông tin đồng bộ, độ phân giải và véctơ chuyển động.
* Nhóm ảnh:
Bao gồm cấu trúc các ảnh I, B và P. Mỗi nhóm bắt đầu bằng ảnh I cung cấp điểm vào ra và tìm kiếm. Phần header chứa 25 bit thời gian và chế độ điều khiển cho VTR và thông tin thời gian.
Trong MPEG có cấu trúc nhóm ảnh điển hình như sau:
Hình 4.2. Cấu trúc các nhóm ảnh.
* Chuỗi Video.
Lớp chuỗi bao gồm phần header, một hoặc một số nhóm ảnh và phần kết thúc chuỗi. Thông tin quan trọng nhất của phần header là kích thước (dọc, ngang) của mỗi ảnh. Tốc độ bít, tốc độ ảnh và dung lượng đòi hỏi bộ đệm dữ liệu bên thu. Thông tin chuỗi ảnh và phần header của chuỗi là dòng bít đã mã hóa,
Các file đính kèm theo tài liệu này:
- 6247.doc