Thuật toán nén MPEG cũng dựa trên phép biến đổi DCT cho các khối ảnh 8x8 picxel để tìm ra sự thừa kế không gian một cách hiệu quả giữa các điểm ảnh trong cùng một bức ảnh. Tuy nhiên, trong trường hợp mối tương quan chặt chẽ giữa các điểm ảnh trong các bức ảnh kế tiếp nhau tức là trong trường hợp hai bức ảnh liên tiếp có nội dung trùng nhau
30 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2334 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Kỹ thuật nén video số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Gi i thi u nhóm và môn h cớ ệ ọ
K thu t nén Video sỹ ậ ố
+ Gi i thi u chungớ ệ
+Mô hình nén nhả
+Các tham s hình nhố ả
+Lý thuy t thông tin – Entropyế
+Các ph ng pháp nénươ
+Mã RLC
+Mã Shannon – Fano
+Mã Huffman
+Nén trong nhả
+Nén liên k t nhế ả
+Chu n JPEGẩ
+Chu n MPEGẩ
+Chu n MPEG - 2ẩ
Vài nét v k thu t nén video ề ỹ ậ
dùng MPEG
• Nói chung, tín hi u video th ng ch a đ ng ệ ườ ứ ự
m t l ng l n các thông tin th a, chúng ộ ượ ớ ừ
th ng đ c chia thành hai lo i: th a tĩnh ườ ượ ạ ừ
bên trong t ng frame (statistical) và th a ừ ừ
đ ng gi a các frame (subjective). M c đích ộ ữ ụ
c a nén video là nh m làm gi m s bit khi ủ ằ ả ố
l u tr và khi truy n b ng cách phát hi n đ ư ữ ề ằ ệ ể
lo i b các l ng thông tin d th a này và ạ ỏ ượ ư ừ
dùng các k thu t Entropy mã hoá đ t i ỹ ậ ể ố
thi u hoá l ng tin quan tr ng c n gi l i.ể ượ ọ ầ ữ ạ
GI I THI UỚ Ệ
• K thu t nén nh s đang đóng m t vai trò c c kỳ quan ỹ ậ ả ố ộ ự
tr ng trong các h th ng vi n thông và multimedia đ ọ ệ ố ễ ể
gi i quy t v n đ băng thông c a đ ng truy n. Các k ả ế ấ ề ủ ườ ề ỹ
thu t nén video đ u c g ng làm gi m l ng thông tin ậ ề ố ắ ả ượ
c n thi t cho m t chu i các b c nh mà không làm ầ ế ộ ỗ ứ ả
gi m ch t l ng c a nó đ i v i ng i xem. Nói chung, ả ấ ượ ủ ố ớ ườ
tín hi u video th ng ch a đ ng m t l ng l n các ệ ườ ứ ự ộ ượ ớ
thông tin th a, chúng th ng đ c chia thành hai lo i: ừ ườ ượ ạ
th a tĩnh bên trong t ng frame (statistical) và th a đ ng ừ ừ ừ ộ
gi a các frame (subjective). M c đích c a nén video là ữ ụ ủ
nh m làm gi m s bit khi l u tr và khi truy n b ng ằ ả ố ư ữ ề ằ
cách phát hi n đ lo i b các l ng thông tin d th a ệ ể ạ ỏ ượ ư ừ
này và dùng các k thu t Entropy mã hoá đ t i thi u ỹ ậ ể ố ể
hoá l ng tin quan tr ng c n gi l i.ượ ọ ầ ữ ạ
Nén không m t d li uấ ữ ệ
• Đ i v i d ng nén không m t d li u, nh đ c ố ớ ạ ấ ữ ệ ả ượ
khôi ph c hoàn toàn gi ng nh g c, tuy nhiên ụ ố ả ố
đi u này đòi h i ph i có thi t b l u tr và đ ng ề ỏ ả ế ị ư ữ ườ
truy n l n h n. Các thu t toán c a nén không ề ớ ơ ậ ủ
m t d li u th ng d a vào vi c thay th m t ấ ữ ệ ườ ự ệ ế ộ
nhóm các ký t trùng l p b i m t nhóm các ký t ự ặ ở ộ ự
đ c bi t khác ng n h n mà không quan tâm t i ý ặ ệ ắ ơ ớ
nghĩa c a dòng bit d li u. Các ví d c a d ng ủ ữ ệ ụ ủ ạ
nén không m t d li u là Run-Length Encoding ấ ữ ệ
(RLE), Huffman Coding, Arithmetic coding,
Shannon-Fano Coding, LZ78, LZH, LZW....
Nén m t d li uấ ữ ệ
• Đ i v i d ng nén có m t d li u, nh đ c khôi ố ớ ạ ấ ữ ệ ả ượ
ph c không gi ng hoàn toàn v i nh g c, d ng ụ ố ớ ả ố ạ
nén này thích h p cho vi c l u tr và truy n nh ợ ệ ư ữ ề ả
tĩnh, video qua m t m ng có băng thông h n ộ ạ ạ
ch . Các d ng nén này th ng cho h s nén ế ạ ườ ệ ố
cao h n, nó liên quan t i vi c dùng các phép ơ ớ ệ
bi n đ i tín hi u t mi n này sang mi n khác. ế ổ ệ ừ ề ề
Các ví d c a bi n đ i có m t d li u g m: ụ ủ ế ổ ấ ữ ệ ồ
Differential Encoding, Discrete Cosine
Transform(DCT), Vector Quantization, JPEG
(Joint Photographic Experts Group) và MPEG
(Motion Picture Experts Group).
Các ph ng pháp nén nh có m t ươ ả ấ
tín hi u g m có 4 b c ệ ồ ướ
• nh g c đ c bi n đ i theo nhi u cách khác nhau. Vào Ả ố ượ ế ổ ề
nh ng năm 1980, vi c nén và gi i nén tín hi u video ữ ệ ả ệ
d a trên k thu t DPCM (differential pulse code ự ỹ ậ
modulation) đã đ c CCITT chu n hoá theo tiêu chu n ượ ẩ ẩ
H.120. Các ph ng pháp nén dùng DPCM d a trên ươ ự
nguyên t c phát hi n s gi ng nhau và khác nhau gi a ắ ệ ự ố ữ
các đi m nh (pixels) g n nhau đ tìm cách lo i b các ể ả ầ ể ạ ỏ
thông tin th a. Tuy nhiên, ch t l ng nh đ ng không ừ ấ ượ ả ộ
đ t đ c các yêu c u c n thi t. Đ c i thi n ch t l ng ạ ượ ầ ầ ế ể ả ệ ấ ượ
nh đ ng mà không làm tăng s l ng bit so v i yêu ả ộ ố ượ ớ
c u, k thu t mã hoá chuy n sang dùng các phép bi n ầ ỹ ậ ể ế
đ i mà chúng có th x lý đ ng th i m t nhóm các ổ ể ử ồ ờ ộ
pixels và ta có khái ni m v các b mã hoá trên các kh i ệ ề ộ ố
(block-based codecs). Đ i v i các b mã hoá trên các ố ớ ộ
kh i nh, m i đi m nh (pixel) s c n ít h n 1 bit đ mã ố ả ỗ ể ả ẽ ầ ơ ể
hoá.
• Các b mã hoá kh i có th d a trên hai nguyên t c bi n ộ ố ể ự ắ ế
đ i c b n: Discrete Cosine Transform (DCT) và Vector ổ ơ ả
Quantization (VQ). DCT đ c dùng đ bi n đ i các kh i ượ ể ế ổ ố
nh hai chi u có kích th c 8X8 t mi n không gian ả ề ướ ừ ề
sang mi n t n s .ề ầ ố
• Bi n đ i DCT là t ng t nh bi n đ i DFT (Discrete ế ổ ươ ự ư ế ổ
Fourier Trransform). Các h s DCT nh n đ c s đ c ệ ố ậ ượ ẽ ượ
l ng t hoá (Quantization) và mã hoá (Encode).ượ ử
• Các h s DCT nh n đ c s đ c l ng t hoá ệ ố ậ ượ ẽ ượ ượ ử
(Quantisation coding) thành t p các h s đ n gi n h n ậ ệ ố ơ ả ơ
n a. M c đích c a nó là làm gi m h n n a s bit đ c ữ ụ ủ ả ơ ữ ố ặ
tr ng cho m t h s . T i b mã hoá s có m t b ng mã ư ộ ệ ố ạ ộ ẽ ộ ả
(code book) và b ng các ch s n i b , t đó có th ả ỉ ố ộ ộ ừ ể
ch n đ c các t mã (code word) t ng ng m t cách ọ ượ ừ ươ ứ ộ
t t nh t cho t p các h s đ c t o ra. Quá trình l ng ố ấ ậ ệ ố ượ ạ ượ
t hoá cũng đ ng th i làm tròn giá tr c a các h s ử ồ ờ ị ủ ệ ố ở
m c nh h n, đây chính là nguyên nhân gây ra m t tín ứ ỏ ơ ấ
hi u, tuy v y nh đ c khôi ph c đ t ch t l ng m c ệ ậ ả ượ ụ ạ ấ ượ ở ứ
đ có th ch p nh n đ c đ i v i ng i xem.ộ ể ấ ậ ượ ố ớ ườ
• Trong ph ng pháp VQ, b c nh đ c chia ươ ứ ả ượ
thành các kh i có kích th c c đ nh, m t b ng ố ướ ố ị ộ ả
mã (code book) đ c xây d ng v i các ch s ượ ự ớ ỉ ố
t ng ng v i các kh i nh này. Nh v y, thay ươ ứ ớ ố ả ư ậ
cho vi c ph i truy n l n l t các kh i c a b c ệ ả ề ầ ượ ố ủ ứ
nh, ta ch c n truy n các ch s t ng ng c a ả ỉ ầ ề ỉ ố ươ ứ ủ
các kh i nh ho c ch s t ng ng g n đúng ố ả ặ ỉ ố ươ ứ ầ
nh t so v i các kh i nh c n truy n. Hai ph ng ấ ớ ố ả ầ ề ươ
pháp này cho k t qu không khác nhau nhi u v ế ả ề ề
ch t l ng nén nh đ ng, tuy nhiên ngày nay ấ ượ ả ộ
bi n đ i DCT t ra đ c ng d ng r ng rãi h n ế ổ ỏ ượ ứ ụ ộ ơ
trong các s đ nén và gi i nén các b c nh tĩnh ơ ồ ả ứ ả
(theo tiêu chu n JPEG) và x lý nh đ ng (theo ẩ ử ả ộ
tiêu chu n c a MPEG). ẩ ủ
NÉN TÍN HI U NH DÙNG MPEGỆ Ả
• MPEG (Moving Picture Expert Group)
đ c ra đ i vào năm 1988 nh m m c ượ ờ ằ ụ
đích chu n hoá cho nén tín hi u âm thanh ẩ ệ
và video. MPEG - 1 có th nén tín hi u ể ệ
video t i 1.5Mbit/s v i ch t l ng VHS và ớ ớ ấ ượ
âm thanh l p th (stereo audio) v i t c đ ậ ể ớ ố ộ
192 bit/s. Nó đ c dùng đ l u tr video ượ ể ư ữ
và âm thanh trên CD-ROM.
• Vào nh ng năm 1990, MPEG-2 đã ra đ i nh m đáp ng ữ ờ ằ ứ
các tiêu chu n nén video cho truy n hình. MPEG-2 có ẩ ề
kh năng mã hoá tín hi u truy n hình t c đ 3-15Mbit/s ả ệ ề ở ố ộ
và truy n hình đ nét cao t c đ t i 15-30Mbit/s. ề ộ ở ố ộ ớ
MPEG-2 cho phép mã hoá tín hi u video v i nhi u m c ệ ớ ề ứ
đ phân gi i khác nhau, chúng có kh năng đáp ng cho ộ ả ả ứ
nhi u ng d ng khác nhau. Nhi u thu t toán t ng ng ề ứ ụ ề ậ ươ ứ
v i nhi u các ng d ng khác nhau đã phát tri n và đ c ớ ề ứ ụ ể ượ
t p h p l i thành m t b tiêu chu n đ y đ c a MPEG. ậ ợ ạ ộ ộ ẩ ầ ủ ủ
Vi c áp d ng toàn b các đ c đi m c a chu n MPEG-2 ệ ụ ộ ặ ể ủ ẩ
trong t t c các b mã hoá và gi i mã là không c n thi t ấ ả ộ ả ầ ế
do s ph c t p c a thi t b cũng nh s t n kém v d i ự ứ ạ ủ ế ị ư ự ố ề ả
thông c a đ ng truy n Vì v y trong h u h t các tr ng ủ ườ ề ậ ầ ế ườ
h p ta ch s d ng m t ph n nh t đ nh trong toàn b các ợ ỉ ử ụ ộ ầ ấ ị ộ
đ c đi m c a chu n MPEG-2, chúng th ng đ c g i là ặ ể ủ ẩ ườ ượ ọ
profiles và levels. M t profile s xác đ nh m t thu t toán ộ ẽ ị ộ ậ
(đi u ch nh bitstream và đ phân gi i màu) và m t level ề ỉ ộ ả ộ
s xác đ nh m t s tiêu chí b t bu c cho các tham s ẽ ị ộ ố ắ ộ ố
c a b c nh (ví d nh kích th c nh và s l ng bit). ủ ứ ả ụ ư ứơ ả ố ượ
• MPEG-4 tr thành m t tiêu chu n cho nén nh ở ộ ẩ ả
k thu t truy n hình s , các ng d ng v đ ho ỹ ậ ề ố ứ ụ ề ồ ạ
và video t ng tác hai chi u (games, ươ ề
videoconferencing) và các ng d ng multimedia ứ ụ
t ng tác hai chi u (World Wide Web ho c các ươ ề ặ
ng d ng nh m phân phát d li u video nh ứ ụ ằ ữ ệ ư
truy n hình cáp, Internet video...) vào năm 1999. ề
Ngày nay, MPEG-4 đã tr thành m t tiêu chu n ở ộ ẩ
công ngh trong quá trình s n xu t, phân ph i và ệ ả ấ ố
truy c p vào các h th ng video. Nó đã góp ph n ậ ệ ố ầ
gi i quy t v n đ v dung l ng cho các thi t b ả ế ấ ề ề ượ ế ị
l u tr , gi i quy t v n đ v băng thông c a ư ữ ả ế ấ ề ề ủ
đ ng truy n tín hi u video ho c k t h p c hai ườ ề ệ ặ ế ợ ả
v n đ trên. ấ ề
• MPEG không ph i là m t công c nén ả ộ ụ
đ n l mà u đi m c a nén nh dùng ơ ẻ ư ể ủ ả
MPEG chính là ch MPEG có m t t p ở ỗ ộ ậ
h p các công c mã hoá chu n, chúng có ợ ụ ẩ
th đ c k t h p vói nhau m t cách linh ể ượ ế ợ ộ
đ ng đ ph c v cho m t lo t các ng ộ ể ụ ụ ộ ạ ứ
d ng khác nhau. ụ
Nén MPEG là s k t h p hài hoà c a b n k thu t c b n: Ti n x lý ự ế ợ ủ ố ỹ ậ ơ ả ề ử
(Preprocessing), đoán tr c s chuy n đ ng c a các frame b ướ ự ể ộ ủ ở ộ
mã hoá (temporal prediction), bù chuy n đ ng b gi i mã (motion ể ộ ở ộ ả
compensation) và mã l ng t hoá (quatisation coding). Các b l c ượ ử ộ ọ
ti n x lý s l c ra nh ng thông tin không c n thi t t tín hi u video ề ử ẽ ọ ữ ầ ế ừ ệ
và nh ng thông tin khó mã hoá nh ng không quan tr ng cho s ữ ư ọ ự
c m th c a m t ng i. K thu t đoán chuy n đ ng d a trên ả ụ ủ ắ ườ ỹ ậ ể ộ ự
nguyên t c là các nh trong chu i video d ng nh có liên quan ắ ả ỗ ườ ư
m t thi t v i nhau theo th i gian: M i frame t i m t th i đi m nh t ậ ế ớ ờ ỗ ạ ộ ờ ể ấ
đ nh s có nhi u kh năng gi ng v i các frame đ ng ngay phía ị ẽ ề ả ố ớ ứ
tr c và ngay phía sau nó. Các b mã hoá s ti n hành quét l n ướ ộ ẽ ế ầ
l t t ng ph n nh trong m i frame g i là macro blocks, sau đó nó ượ ừ ầ ỏ ỗ ọ
s phát hi n macro block nào không thay đ i t frame này t i frame ẽ ệ ổ ừ ớ
khác. B mã hoá s tiên đoán tr c s xu t hi n c a các macro ộ ẽ ướ ự ấ ệ ủ
blocks khi bi t v trí và h ng chuy n đ ng c a nó. Do đó ch ế ị ướ ể ộ ủ ỉ
nh ng s thay đ i gi a các kh i trong frame hi n t i (motion ữ ự ổ ữ ố ệ ạ
compesated residual) và các kh i đ c tiên đoán m i đ c truy n ố ượ ớ ượ ề
t i bên phía thu. Phía bên thu t c b gi i mã đã l u tr s n nh ng ớ ứ ộ ả ư ữ ẵ ữ
thông tin mà không thay đ i t frame này t i frame khác trong b ổ ừ ớ ộ
nh đ m c a nó và chúng đ c dùng đ đi n thêm m t cách đ u ớ ệ ủ ượ ể ề ộ ề
đ n vào các v trí tr ng trong nh đ c khôi ph c. ặ ị ố ả ượ ụ
• Nh chúng ta đ u bi t, nén tín hi u video đ c th c hi n nh vi c ư ề ế ệ ượ ự ệ ờ ệ
lo i b c s d th a v không gian (spatial coding) và th i gian ạ ỏ ả ự ư ừ ề ờ
(temporal coding). Trong MPEG, vi c lo i b d th a v th i gian ệ ạ ỏ ư ừ ề ờ
(nén liên nh) đ c th c hi n tr c h t nh s d ng các tính ch t ả ượ ự ệ ướ ế ờ ử ụ ấ
gi ng nhau gi a các nh liên ti p (Inter-frame techniques). Chúng ố ữ ả ế
ta có th s d ng tính ch t này đ t o ra các b c nh m i nh vào ể ử ụ ấ ể ạ ứ ả ớ ờ
nh ng thông tin t nh ng nh đã g i tr c nó (“predicted”). Do v y ữ ừ ữ ả ử ướ ậ
phía b mã hoá, ta ch c n g i nh ng b c nh có thay đ i so v i ở ộ ỉ ầ ử ữ ứ ả ổ ớ
nh ng nh tr c, sau đó ta l i dùng ph ng pháp nén v không ữ ả ướ ạ ươ ề
gian đ lo i b s d th a v không gian trong chính b c nh sai ể ạ ỏ ự ư ừ ề ứ ả
khác này. Nén v không gian d a trên nguyên t c là phát hi n s ề ự ắ ệ ự
gi ng nhau c a các đi m nh (pixels) lân c n nhau (Intra-frame ố ủ ể ả ậ
coding techniques). JPEG ch áp d ng ph ng pháp nén theo ỉ ụ ươ
không gian vì nó đ c thi t k đ x lý và truy n các nh tĩnh. Tuy ượ ế ế ể ử ề ả
nhiên nén tín hi u theo ph ng pháp c a JPEG cũng có th đ c ệ ươ ủ ể ượ
dùng đ nén các b c nh m t cách đ c l p trong dãy tín hi u ể ứ ả ộ ộ ậ ệ
video. ng d ng này th ng đ c g i là JPEG đ ng (Motion ứ ụ ườ ượ ọ ộ
JPEG). Trong m t chu kỳ g i m t dãy các b c nh theo ki u JPEG ộ ử ộ ứ ả ể
đ ng, nh đ u tiên đ c nén nh s lo i b đ d th a v không ộ ả ầ ượ ờ ự ạ ỏ ộ ư ừ ề
gian, sau đó các nh ti p theo đ c nén nh s lo i b đ d th a ả ế ượ ờ ự ạ ỏ ộ ư ừ
v th i gian (nén liên nh). Quá trình đ c l p đi l p l i cho m t ề ờ ả ượ ặ ặ ạ ộ
dãy các b c nh trong tín hi u video. ứ ả ệ
Thu t toán nén MPEG cũng d a trên phép bi n đ i DCT ậ ự ế ổ
cho các kh i nh 8x8 picxels đ tìm ra s th a v không ố ả ể ự ừ ề
gian m t cách có hi u qu gi a các đi m nh trong ộ ệ ả ữ ể ả
cùng m t b c nh. Tuy nhiên, trong tr ng h p có m i ộ ứ ả ườ ợ ố
t ng quan ch t ch gi a các đi m nh trong các b c ươ ặ ẽ ữ ể ả ứ
nh k ti p nhau t c là trong tr ng h p hai b c nh ả ế ế ứ ườ ợ ứ ả
liên ti p có n i dung trùng nhau, k thu t Inter-frame ế ộ ỹ ậ
coding techniques s đ c dùng cùng v i vi c tiên đoán ẽ ượ ớ ệ
s d th a v không gian đ t o thành k thu t tiên ự ư ừ ề ể ạ ỹ ậ
đoán bù chuy n đ ng gi a các b c nh (Motion ể ộ ữ ứ ả
compesated prediction between frames). Trong nhi u s ề ơ
đ nén MPEG, ng i ta th ng k t h p c vi c tiên ồ ườ ườ ế ợ ả ệ
đoán bù chuy n đ ng theo th i gian và phép bi n đ i ể ộ ờ ế ổ
thông tin theo không gian đ đ t hi u qu nén cao ể ạ ệ ả
(Hybrid DPCM/DCT coding of video).
H u h t các s đ nén MPEG đ u dùng k thu t l y m u b xung ầ ế ơ ồ ề ỹ ậ ấ ẫ ổ
(Subsampling) và l ng t hoá (Quantization) tr c khi mã hoá. ượ ử ướ
L y m u b xung nh m m c đích đ làm gi m kích th c b c nh ấ ẫ ổ ằ ụ ể ả ướ ứ ả
đ u vào theo c theo chi u ngang và chi u d c, nh v y s gi m ầ ả ề ề ọ ư ậ ẽ ả
s l ng các đi m nh tr c mã hoá. Cũng nên nh r ng trong ố ượ ể ả ướ ớ ằ
m t s tr ng h p ng i ta còn l y m u b xung theo th i gian đ ộ ố ườ ợ ườ ấ ẫ ổ ờ ể
làm gi m s l ng các b c nh trong dãy nh tr c khi mã hoá. ả ố ượ ứ ả ả ướ
Đây đ c xem nh là m t k thu t r t c b n nh m lo i b s d ượ ư ộ ỹ ậ ấ ơ ả ằ ạ ỏ ự ư
th a d a vào kh năng l u nh c a m t ng i c m th . Th ng ừ ự ả ư ả ủ ắ ườ ả ụ ườ
th ng, chúng ta có th phân bi t s thay đ i v đ sáng c a nh ườ ể ệ ự ổ ề ộ ủ ả
(changes in Brightness) t t h n so v i s thay đ i v màu ố ơ ớ ự ổ ề
(Chromaticity changes). Do đó tr c h t các s đ nén MPEG s ướ ế ơ ồ ẽ
ti n hành chia b c nh thành các thành ph n Y (Luminance hay ế ứ ả ầ
brightness plane) và UV (Chrominance hay color planes) t c là m t ứ ộ
thành ph n v đ sáng và hai thành ph n v đ màu. Các tín hi u ầ ề ộ ầ ề ộ ệ
video thành ph n này s đ c l y m u (samples) và s hoá ầ ẽ ượ ấ ẫ ố
(digitised) đ t o nên các đi m nh r i r c theo t l 4 : 2 : 2 và 4 : ể ạ ể ả ờ ạ ỷ ệ
2 : 0.
• K thu t tiên đoán bù chuy n đ ng đ c s d ng nh là m t trong ỹ ậ ể ộ ượ ử ụ ư ộ
nh ng công c m nh đ làm gi m s d th a v không gian gi a ữ ụ ạ ể ả ự ư ừ ề ữ
các b c nh. Khái ni m v bù chuy n đ ng là d a trên s phán ứ ả ệ ề ể ộ ự ự
đoán h ng chuy n đ ng c a các b c nh t c là các nh thành ướ ể ộ ủ ứ ả ứ ả
ph n trong dãy video s đ c thay th g n đúng. K thu t tiên ầ ẽ ượ ế ầ ỹ ậ
đoán bù chuy n đ ng gi a các b c nh đ c xem nh là bi n ể ộ ữ ứ ả ượ ư ệ
pháp đ h n ch b t các thông s c a chuy n đ ng b i vi c dùng ể ạ ế ớ ố ủ ể ộ ở ệ
các vector chuy n đ ng đ mô t s d ch chuy n c a các đi m ể ộ ể ả ự ị ể ủ ể
nh. K t qu tiên đoán t t nh t c a m t đi m nh là d a trên s ả ế ả ố ấ ủ ộ ể ả ự ự
tiên đoán bù chuy n đ ng t m t b c nh đã mã hoá đ c truy n ể ộ ừ ộ ứ ả ượ ề
phía tr c c a nó. C hai thông s , sai s chuy n đ ng (biên đ ) ướ ủ ả ố ố ể ộ ộ
và các vectors chuy n đ ng (h ng chuy n đ ng) đ u đ c truy n ể ộ ướ ể ộ ề ượ ề
t i phía bên nh n. Tuy nhiên do có m i quan h t ng quan ch t ớ ậ ố ệ ươ ặ
ch gi a các đi m nh v không gian (trùng v không gian), m t ẽ ữ ể ả ề ề ộ
vector chuy n đ ng có th đ c dùng cho m t kh i các đi m nh ể ộ ể ượ ộ ố ể ả
g m các pixels lân c n nhau (MPEG -1 và MPEG -2 dùng các kh i ồ ậ ố
16 x16 pixels).
• Trong MPEG-2, có nhi u ph ng pháp đ tiên đoán s ề ươ ể ự
chuy n đ ng. Ví d m t kh i nh có th đ c tiên đoán ể ộ ụ ộ ố ả ể ượ
xuôi t nh ng nh đã đ c truy n tr c nó (Forward ừ ữ ả ượ ề ướ
Predicted), có th đoán ng c t nh ng nh truy n sau ể ượ ừ ữ ả ề
nó (Backward Predicted) ho c theo c hai chi u ặ ả ề
(Bidirectionally Predicted). Các ph ng pháp dùng đ ươ ể
tiên đoán các kh i trong cùng m t nh cũng có th ố ộ ả ể
không gi ng nhau, chúng có th thay đ i t kh i n ố ể ổ ừ ố ọ
sang kh i kia. H n n a, hai tr ng (fields) trong cùng ố ơ ữ ườ
m t kh i cũng có th đ c tiên đoán theo hai cách khác ộ ố ể ượ
nhau dùng các vector đ c l p nhau ho c chúng có th ộ ậ ặ ể
dùng chung m t vector. Đ i v i m i kh i nh, b mã ộ ố ớ ỗ ố ả ộ
hoá s ch n các ph ng pháp tiên đoán thích h p, c ẽ ọ ươ ợ ố
g ng đ m b o ch t l ng nh t t nh t khi đ c gi i mã ắ ả ả ấ ượ ả ố ấ ượ ả
trong đi u ki n yêu c u kh t khe v s bit. Các thông ề ệ ầ ắ ề ố
s liên quan t i ch n ph ng pháp tiên đoán cũng đ c ố ớ ọ ươ ượ
truy n t i b gi i mã cùng v i d đoán sai s nh m khôi ề ớ ộ ả ớ ự ố ằ
ph c g n chính xác nh g c. ụ ầ ả ố
Trong MPEG, có 3 ki u nh khác nhau ể ả
đ c dùng đ mã hoá cho các kh i nh. ượ ể ố ả
Ki u nh ‘Intra’ (I-pictures) là nh đ c ể ả ả ượ
mã hoá m t cách đ c l p mà không c n ộ ộ ậ ầ
tham kh o t i các nh khác. Hi u qu nén ả ớ ả ệ ả
tín hi u đ t đ c do lo i b s th a v ệ ạ ượ ạ ỏ ự ừ ề
không gian mà không có y u t th i gian ế ố ờ
tham gia vào quá trình. I-pictures đ c ượ
dùng m t cách tu n hoàn đ t o thành ộ ầ ể ạ
các đi m t a cho dòng d li u trong quá ể ự ữ ệ
trình gi i mã. ả
nh ‘Predictive’ (P-pictures) có th s d ng Ả ể ử ụ
các nh I ho c P ngay sát phía tr c nó ả ặ ướ
đ bù chuy n đ ng và chính nó cũng có ể ể ộ
th đ c dùng đ tham kh o cho vi c tiên ể ượ ể ả ệ
đoán các nh khác ti p theo. M i kh i ả ế ỗ ố
nh trong P-picture có th ho c đ c mã ả ể ặ ượ
theo ki u tiên đoán (predicted) ho c đ c ể ặ ượ
mã m t cách đ c l p (intra-coded). Do s ộ ộ ậ ử
d ng c nén theo không gian và th i gian, ụ ả ờ
hi u qu nén c a P-pictures đ c tăng ệ ả ủ ượ
lên m t cách đáng k so v i I-pictures. ộ ể ớ
• nh ‘Bidirectionally-Predictive’ pictures hay B- Pictures Ả
có th s d ng các nh I ho c P phía tr c ho c phía ể ử ụ ả ặ ướ ặ
sau nó cho vi c bù chuy n đ ng và do v y cho k t qu ệ ể ộ ậ ế ả
nén cao nh t. M i kh i trong B-pictures có th đ c tiên ấ ỗ ố ể ượ
đoán theo chi u ng c, xuôi, c hai h ng ho c đ c ề ượ ả ướ ặ ượ
mã m t cách đ c l p. Đ có th tiên đoán ng c t m t ộ ộ ậ ể ể ượ ừ ộ
b c nh phía sau nó, b mã hoá s ti n hành s p x p ứ ả ộ ẽ ế ắ ế
l i các b c nh t th t xu t hi n m t cách t nhiên ạ ứ ả ừ ứ ự ấ ệ ộ ự
sang m t th t khác c a các nh trên đ ng truy n. ộ ứ ự ủ ả ườ ề
Do v y t đ u ra c a b mã hoá, B-pictures đ c ậ ừ ầ ủ ộ ượ
truy n sau các nh dùng đ tham kh o phía tr c và ề ả ể ả ở ướ
phía sau c a nó. Đi u này s t o ra đ tr do ph i s p ủ ề ẽ ạ ộ ễ ả ắ
x p l i thông tin, đ tr này l n hay nh là tuỳ thu c vào ế ạ ộ ễ ớ ỏ ộ
s các b c nh B-pictures liên ti p nhau đ c truy n. ố ứ ả ế ượ ề
S Đ C A B MÃ HOÁ VÀ Ơ Ồ Ủ Ộ
GI I MÃ DÙNG MPEG-2Ả
Mã hoá MPEG-2
• D li u t các kh i nh (macroblocks) c n đ c mã hoá ữ ệ ừ ố ả ầ ượ
s đ c đ a đ n c b tr (Subtractor) và b đoán ẽ ượ ư ế ả ộ ừ ộ
chuy n đ ng (Motion Estimator). B đoán chuy n đ ng ể ộ ộ ể ộ
s so sánh các kh i nh m i đ c đ a vào này v i các ẽ ố ả ớ ượ ư ớ
kh i nh đã đ c đ a vào tr c đó và đ c l u l i nh ố ả ượ ư ướ ượ ư ạ ư
là các nh dùng đ tham kh o (Reference Picture). K t ả ể ả ế
qu là b đoán chuy n đ ng s tìm ra các kh i nh ả ộ ể ộ ẽ ố ả
trong nh tham kh o g n gi ng nh t v i kh i nh m i ả ả ầ ố ấ ớ ố ả ớ
này. B đoán chuy n đ ng sau đó s tính toán vector ộ ể ộ ẽ
chuy n đ ng (Motion Vector), vector này s đ c tr ng ể ộ ẽ ặ ư
cho s d ch chuy n theo c hai chi u d c và ngang c a ự ị ể ả ề ọ ủ
kh i nh m i c n mã hoá so v i nh tham kh o. Chúng ố ả ớ ầ ớ ả ả
ta l u ý r ng vector chuy n đ ng có đ phân gi i b ng ư ằ ể ộ ộ ả ằ
m t n a do th c hi n quét xen k . ộ ử ự ệ ẽ
• B đoán chuy n đ ng cũng đ ng th i g i ộ ể ộ ồ ờ ử
các kh i nh tham kh o này mà chúng ố ả ả
th ng đ c g i là các kh i tiên đoán ườ ượ ọ ố
(Predicted macroblock) t i b tr đ tr ớ ộ ừ ể ừ
v i kh i nh m i c n mã hoá (th c hi n ớ ố ả ớ ầ ự ệ
tr t ng đi m nh t ng ng t c là Pixel ừ ừ ể ả ươ ứ ứ
by pixel). K t qu là ta s đ c các sai s ế ả ẽ ượ ố
tiên đoán (Error Prediction) ho c tín hi u ặ ệ
d , chúng s đ c tr ng cho s sai khác ư ẽ ặ ư ự
gi a kh i nh c n tiên đoán và kh i nh ữ ố ả ầ ố ả
th c t c n mã hoá. ự ế ầ
• Tín hi u d hay sai s tiên đoán này s ệ ư ố ẽ
đ c bi n đ i DCT, các h s nh n đ c ượ ế ổ ệ ố ậ ượ
sau bi n đ i DCT s đ c l ng t hoá ế ổ ẽ ượ ượ ử
đ làm gi m s l ng các bits c n truy n. ể ả ố ượ ầ ề
Các h s này s đ c đ a t i b mã hoá ệ ố ẽ ượ ư ớ ộ
Huffman, t i đây s bits đ c tr ng cho các ạ ố ặ ư
h s ti p t c đ c làm gi m đi m t cách ệ ố ế ụ ượ ả ộ
đáng k . D li u t đ u ra c a mã hoá ể ữ ệ ừ ầ ủ
Huffman s đ c k t h p v i vector ẽ ượ ế ợ ớ
chuy n đ ng và các thông tin khác (thông ể ộ
tin v I, P, B pictures) đ g i t i b gi i ề ể ử ớ ộ ả
mã
• Đ i v i tr ng h p P-pictures, các h s DCT ố ớ ườ ợ ệ ố
cũng đ c đ a đ n b gi i mã n i b (n m ngay ượ ư ế ộ ả ộ ộ ằ
trong b mã hoá). Tín hi u d hay sai s tiên ộ ệ ư ố
đoán đ c bi n đ i ng c l i dùng phép bi n ượ ế ổ ượ ạ ế
đ i IDCT và đ c c ng thêm vào nh đ ng ổ ượ ộ ả ứ
tr c đ t o nên nh tham kh o ( nh tiên đoán). ướ ể ạ ả ả ả
Vì d li u nh trong b mã hoá đ c gi i mã ữ ệ ả ộ ượ ả
luôn nh vào b gi i mã n i b ngay chính bên ờ ộ ả ộ ộ
trong b mã hoá, do đó ta có th th c hi n thay ộ ể ự ệ
đ i th t các b c nh và dùng các ph ng ổ ứ ự ứ ả ươ
pháp tiên đoán nh đã trình bày trên. ư ở
TÀI LI U THAM KH OỆ Ả
• [1]. P.N TUDOR, “MPEG-2 Video Compression”, Electronics and
Communication Engineering Journal, December 1995.
• [2]. THOMAS SIKORA, “MPEG-1 and MPEG-2 Digital Video Coding
Standards”, McGraw Hill Publishing Company.
• [3]. THOMAS SIKORA, “MPEG-1 and MPEG-2 Digital Video Coding
Standards”, IEEE Signal Processing Magazine, tobe published.
• [4]. “Introduction to MPEG”, http://
tektronix.com/Measurement/AppNotes/Mpegfund.
• [5]. KEVIN JEFFAY, “ The video Data Type, Coding and
Compression Basics”,
Các file đính kèm theo tài liệu này:
- ky_thuat_nen_video_so_.pdf