Đối với phân cực ngang và phân cực đứng ta dùng một đầu thu SHF nhưng phải có thêm mạch đảo phân cực, để có thể điều chỉnh phân cực cho tín hiệu và được điwuf khiển từ xa. Còn đối với phân cực vòng phải, vòng trái ta gắn thêm một đầu thu trên chảo Parabol khác và cũng có mạch đảo phân cực điều khiển từ xa và đặt cạnh máy thu.
Tần số của các vệ tinh cần thu có trên 2 băng tần:
Thông thường là trên băng tần thấp và cao. Thật vậy, các băng tần phát sóng trên băng tần này chủ yếu theo hệ PAL và với phân cực ngang đứng, làm cho đơn giản phần thu. Ta sử dụng một chảo Parabol cho một băng tần thuộc một kênh.
Ống dẫn sóng cung cấp cho 2 đầu thu SHF, một dành cho băng tần thấp một dành cho băng tần cao. Một mạch đảo phân cực sẽ điều chỉnh đầu dò tuỳ theo phân cực. Nó được điều khiển từ xa tại nơi đặt máy thu.
Thiết lập nơi thu tín hiệu truyền hình cho một khu tập thể:
Trong trường hợp này thì phải làm sao cho mỗi thuê bao, có thể nhận được tín hiệu các chương trình truyền hình theo yêu cầu trong bấy cứ lúc nào. Vì vậy cần thiết phải có:
+ Bao nhiêu Anten cố định thì có tương ứng bấy nhiêu vệ tinh nằm ở các vị trí khác nhau trên quỹ đạo địa tĩnh cần thu.
+Bao nhiêu đầu thu SHF thì có tương ứng bấy nhiêu băng tần và phân cực khác nhau cần thu.
108 trang |
Chia sẻ: huong.duong | Lượt xem: 1233 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Thiết kế hệ thống thu tín hiệu truyền hình qua vệ tinh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
do giá đỡ phễu gây nên. Tỷ số cho phép không vượt quá 2.0. Giá trị làm việc trong phạm vi cho phép S = 1.5/1.
Bởi vì phễu thu sóng còn thu các sóng phản xạ từ bề mặt chảo đồng thời phải phân biệt các loại sóng phân cực đứng hay ngang, vòng phải hay trái. Có thể đưa ra thông số cách ly này vào chỉ tiêu của chảo Anten, giá trị của độ phân biệt này không nhỏ hơn 25dB.
Còn một thông số nữa là độ suy hao phản xạ trở về phễu của các tia phản xạ phụ không nhỏ hơn -15dB.
Điều không được quên là tín hiệu đến bề mặt chảo cực kỳ nhỏ nên cần giữ lòng chảo sạch sẽ với lớp bụi 0.1mm sẽ làm giảm dến 3%, hạt to đến 1mm sẽ làm giảm độ lợi đến 20%.
Vật liệu làm chảo tốt nhất là nhôm, nhựa dẻo phủ nhôm hay lưới kiml loại không gỉ phủ nhựa mỏng. Nó sẽ cho giá trị về độ lợi, hiệu suất và tỷ số sóng đứng tốt nhất.
Dưới đây là một số sản phẩm của Nhật Bản và Đài Loan:
Chảo Parabol của hãng Toshiba ( Nhật Bản ) làm việc ở băng C.
Độ lợi ( dB )
Hiệu suất ( % )
Tỉ số S ở ngõ ra Anten
Vật liệu chế tạo
38,05
37,5
37,50
37,25
75,60
73,90
68,10
68,90
1,20
1,25
1,18
1,18
Nhôm
Lưới kim loại phủ chất dẻo
Lưới nhôm phủ chất dẻo
Chất dẻo phủ nhôm
Chảo Parabol của hãng spacelab ( Đài Loan ) làm bằng nhôm phủ nhựa
Kiểu
Thông số
KSA- 3406
KSA- 3408
KSA- 3410
KSA- 3412
KSA- 3416
KSA- 3420
Đường kính (ft)
Độ lợi giữa băng(dB)
Tỷ số F/D
Tiêu cự ( inch )
6
36
8
38
10
39,8
12
41
16
43
20
45
0,4
0,395
0,395
0,395
0,4
0,4
28,8
38,4
48
57,6
76,8
96
Phân cực
Tuyến tính hay quay vòng
Nhiệt độ làm việc
-30°C đến +55°C
Cường độ trường sẽ quyết định đến độ lợi Anten hay đường kính Anten, theo tiêu chuẩn Anten thương mại của các nước, với mức EIRP = 32 á 36dBw thì đường kính Anten là: 2.5 á 4m.
ở Việt Nam, mức EIRP = 32 á 35 dBw ( Asiasat 1 ), có thể dùng đường kính Anten có độ lợi trung bình theo bảng sau:
Thông số
Băng C
BăngKu
D ( m )
1.2
1.8
3
0.6
1.5
G ( dB)
34
36.7
41
37
43
Thực tế cho thấy đường kính Anten 1.8m sẽ nhận được hình ảnh tốt nhất.
Chương III
Hệ thống thu đài digital qua vệ tinh
I. Sơ đồ khối hệ thống thu đài digital.
1. Sơ đồ khối hệ thống thu tuyền hình số:
Hình16: Sơ đồ khối hệ thống thu truyền hình số.
Tín hiệu từ vệ tinh qua bộ lọc LNB tại đây được biến đổi thành L-Band sau đó biến đổi thành trung tần 480 MHz và 70 MHz. Sau đó biến đổi tương tự số, đến dải điều chế M-PSK, sau đó giải mã PEC (Viterbi) và R.S (Solomon) tách kênh dòng truyền tải MPEG, giải mã MPEG cho tín hiệu Video và Audio.
Bộ xử lý điều khiển hoạt động toàn bộ máy thu, tại đây dữ liệu qua cổng RS -232.
Hệ thống truy nhập có điều kiện và bộ đọc card thông minh cho phép tách kênh dịch cho thuê bao.
Các thông số cơ bản của bộ giải mã MPEG - 2.
+ Tần số thu f = SHF (MHz), phân cực: V-H-Cycle Pohriastion.
+ Symbol rate
+ FEC: mã sửa lỗi tiến
+ Digital SNG = RAS code (Remote Authorisation System)
+ Digital Decode: M-PSK.
Lưu ý: + Dùng video Guard hoặc Ras code là truy cập mã có điều kiện (Con ditional Access)
+ Dùng phần mềm DVB-PSI để giải mã tách ngõ ra dòng truyền tải (Transport Saream Output)
2. Điều chế Q - PSK.
a. Biểu thức và vách biểu diễn tín hiệu Q - PSK.
Trong điều chế QPSK, luồng số d(t) cần tryền sẽ được truyền đi từng bộ gồm 2 bít, mỗi bộ 2 bít này gọi là một Symbol. Mỗi Symbol như vậy có thể có 4 trạng thái khác nhau nên cần 4 tín hiệu khác nhau S1(t), S2(t), S3(t) để mã hoá, trong QPSK các tín hiệu này được chọn từ một sóng mang với 4 trạng thái pha khác nhau. Nếu gọi b0(t) là bít lẻ và be (t) là bít chẵn trong mỗi cặp bít, biểu thức QPSK có thể cho dưới dạng như bảng dưới.
VQPSK (t) = .A .Cos( w0t + j(t))
Trong đó:
B0(t)
B0(t)
j(t)
1
1
1
0
0
0
hay
0
1
hay
Hình 17: Giản đồ pha của điều chế QPSK.
Tuy vậy, QPSK thường được diễn theo một dạng khác thuận lợi hơn cho việc phân tích. Từ giản đồ trên, có thể phân mỗi Vecter sóng mang 2 thành phần, một trên trục I và một trên trục Q. Với quy ước bo(t) và be(t) là 2 luồng bít lẻ và bít chẵn tách ra từ d(t) và có dạng NRZ với mức xung ±1 chọn trục I là trục trùng pha với sóng mang chuẩn cos (w0t) trục Q sẽ cùng pha với sin (wot+p), tín hiệu QPSK sẽ có dạng.
VQPSK (t) = A. be(t). cos(w0t) + A.b0(t). Sin (w0t+
nếu chọ A= biên độ tổng hợp của QPSK sẽ là A = , công suất trung bình của tín hiệu sẽ là Ps ta viết lại:
VQPSK (t) = be(t). cos(w0t) + .b0 (t).Sin (w0t+
Nếu tốc độ bít của luồng số d(t) là fb, hay thời gian của mỗi bít Tb, thời gian tồn tại của bít lẻ và bít chẵn trong các luồng bo(t) và be(t) sẽ là 2Ts hay nói cách khác thời gian tồn tại của mỗi kí hiệu là Ts = 2Tb. Như vậy có thể nói sóng mang QPSK đã dùng một năng lượng.
Es = Ps.Ts =Ps.2Tb
Để tryền một ký hiệu, năng lượng để truyền mỗi bít là:
Eb=Ps.Ts = (do 1 symbol chứa 2bít)
Trong không gian tín hiệu, do hàm cos và hàm sin trực giao với nhau nên trạng thái của tín hiệu QPSK được biểu diễn với 2 vectơ đơn vị trực chuẩn.
U1 (t) =
và Us (t) =
Khi đó: S1(t) = S11(t) =
=
S2(t) = S10(t) = .U1(t) - .U2(t)
=
S3(t) = S00(t) = -.U1(t) - .U2(t)
=
S4(t) = S10 = -.U1(t) +.U2(t)
= -
Khoảng cách giữa hai tiêu điểm biểu diễn tín hiệu (hay các điểm trạng thái pha) gần nhất là:
dm = =
= =
= 2
u2(t) =
-
u1(t) =
-
Hình 18: Biểu diễn tín hiệu QPSK trong không gian tín hiệu.
Lưu ý: Khoảng cách gần nhất giữa các tín hiệu của QPSK tương đương với khoảng cách giữa 2 tín hiệu của BPSK nếu cả hai cùng truyền một luồng số với cùng công suất sóng mang. Điều này do sự khác biệt về thời gian chuyển trạng thái của BPSK là Tb còn QPSK là Ts = 2 Tb nên các vectơ đơn vị khác nhau.
b. Phổ tín hiệu QPSK:
Trong biểu thức:
VQPSK(t) = A. be (t) .cos(w0t) + A.bo(t).sin (w0t+p)
Có thể thấy rằng VQPSK(t) chính là tổ hợp tuyến tính của hai tín hiệu điều chế BPSK trong đó có thành phần thứ 2 dùng sóng mang sin(w0t + ) thay cho Cos(w0)t, tốc độ bít của bo(t) và be(t) là Tb/2 = TS và biên độ của mỗi thành phần là A= phổ mật độ công suất của VQPSK(t) có thể nhận được từ tổ hợp tuyến tính các phổ của các tín hiệu thành phần.
Như vậy phổ của QPSK có dạng tương tự như phổ của BPSK, nhưng do fs = 1/Ts = fb/2 nên phổ mật độ công suất của VQPSK (t) hẹp hơn phổ mật độ công suất VBPSK(t) hai lần nếu truyền một luồng số có cùng tốc độ.
c. Mạch điều chế và giải điều chế QPSK:
Trong phần mạch giải điều chế phần tái tạo sóng mang được dùng theo kiểu tăng bậc luỹ thừa sóng mang (luỹ thừa 4) để loại ảnh hưởng của việc dịch pha do điều chế, cũng có thể tạo ra sóng mang theo nguyên lý vòng Costans.
Hình 19: Sơ đồ bộ giải điêu chế QPSK
Hình 20: Sơ đồ bộ giả điều chế QPSK.
3 . Mã hoá MPEG-2.
Tín hiệu Video và Audio lần luợt luân phiên được mã hoá MPEG-2, tạo dòng cơ sở sau đó đóng gói tạo dòng chương trình Ts hay dòng truyền tải của kênh 1.
a. cấu trúc dòng truyền tải.
Hình 21: Ghép dòng truyền tải MPEG-2
Hình22: Cấu trúc dòng truyền tải TS kênh
b. Ghép dòng truyền tải nhiều chương trình:
Các dòng truyền tải kênh TS1 TSn được ghép kênh từ 4 đến 5 kênh. Thông thường do hạn chế tốc độ truyền TSn cỡ 40Mbps, nghĩa là băng thông truyền bị giới hạn. Trong 5 kênh này, có thể lập trình cho các kênh có tốc độ truyền khác riêng biệt.
Hình 23: Ghép dòng truyền tải n chương trình ( n = 4 á 5 ).
Các tín hiệu hình, tiếng, dữ liệu của mỗi chương trình được nén và mã hoá một cách độc lập. Tín hiệu hình và hệ tiếng được nén theo chuẩn MPEG - 2
Các tín hiệu được ghép kênh tạo dòng bit kênh Ts và dòng bít chương trình nhiều kênh TSN. Hệ thống ghép kênh theo nguyên tắc thống kê cho phép các kênh thay đổi tốc độ bít truỳ vào mức độ phức tạp của hình và tiếng.
Tín hiệu sau khi ghép kênh đưa đến khối mã hoá Scrambling được điều khiển bởi hệ thống máy tính lập trình truy nhập có điều kiện nhằm.
+ Bảo vệ bản quyền nhà dịch vụ.
+ Phục vụ cho người xem trả tiền
Do vật phải dùng mã nhận dạng gói (packet Identifier-PID) mã này nằm ở Header, 1 Header có 4 byte theo thứ tự sau:
Byte thứ 1: đồng bộ (synchronisation)
Byte thứ 2: PID
Byte thứ 3: Bộ đếm gói (Continuty Counter)
Bety thứ 4: mã tổng hợp (mã tổng hợp (Miscellaneous Flags)
PID bao gồm: Video data PID
Audio data PID
Cho phép nhận dạng từ các gói nguồn khai ghép kênh thành dòng chương trình, phía thu sẽ tách các gói này theo mã quy ước.
Hệ thống mã truy nhập có điều kiện dựa vào bảng thông tin các chương trình (PSI-Program Specific Information). PSI gồm 4 bảng sau:
+ Program Association table (PAT)
+ Program Map Table (PMT )
+ Network Information Table (NIT)
+ Conditional Access Table (CAT)
Hình 24: Các bảng MPEG-2 PSI.
PAT chứa danh mục dịch vụ các chương trình và thông số PID của chúng. Bảng này có PID =0. PMT chỉ chi tiết thông số PID của các thành phần.
NIT quy định cho chương trình không bởi hệ MPEG2. Đây là quy định của nhà dịch vụ, nếu các dòng cơ bản (ES) được mã hoá tức truy cập có điều kiện thì bảng thứ 4( CAT ) sẽ chứa các thông tin chi tiết của hệ thống mã.
Tín hiệu tiếp tục đưa đến khối sửa lỗi, bảo vệ lỗi truyền Reed Solomon gồm 16 byte cho 1TS có khả năng sửa 8 đến 9 bit liên tục.
Tiếp tục mã được điều chế M-PSK và đưa đến khối IF/RF.
Từ vệ tinh tín hiệu ở băng tần SHF được đưa vào bộ LNB biến đổi IF 1 có dải từ 950 đến 2150 MHz = L band.
Khối chọn kênh sẽ chọn một kênh f tương ứng trong dải L band. Khi đó bộ tách mã dịch vụ ghép của kênh được chọn cho phép ta chọn một số tổ hợp nào đó của mã. Cuối cùng tách các tín hiệu Video, Audio và Data.
III. Nén video.
1. Khái niệm chung.
Tín hiệu Video sau khi đã được số hoá ( 8bit ) có tốc độ bằng 216Mbps.
Để có thể truyền trong một kênh truyền thông thường, tín hiệu Video số cần phải được nén trong khi vẫn phải đảm bảo chất lượng hình ảnh.
Khái niệm “ Nén Video” hiện nay vẫn chưa được định nghĩa một cách chính xác, mặc dù Video đã dược nén từ những năm 1950. Cùng với sự ra đời của truyền hình màu: 3 tín hiệu màu thành phần ( R, G, B ) với tổng bề rộng dải thông 15 MHz đã được nén trong một tín hiệu Video màu tổng hợp duy nhất với bề rộng dải thông là 5MHz. Dải thông tần số được giảm ba lần ( hệ số nén la 3:1 ).
Nén Video trong những năm 1950 được thực hiện bằng công nghệ tương tự với tỷ số nén thấp. Ngày nay công nghệ nén đã đạt được những thành tựu cao hơn bằng việc chuyển đổi tín hiệu Video từ tương tự sang số.
Công nghệ nén đòi hỏi năng lực tính toán nhanh song ngày nay với sự phát triển của công nghệ thông tin thì điều đó đã được giải quyết.
Tín hiệu Video có dải phổ từ 0 đến 6 MHz, tuy nhiên trong nhiều trường hợp năng lượng phổ chủ yếu tập trung ở miền tần số thấp, do thành phần tần số cao chỉ xuất hiện tại các đường viền của hình ảnh. So với toàn bộ hình ảnh các đường viền chiếm tỷ lệ rất nhỏ. Như vậy các phần thông tin của hình ảnh tập trung ở miền tần số thấp và chỉ có rất ít thông tin được chứa đựng ở miền tần số cao.
+
Ma Trận
C
A
M
E
R
A
R(0á5MHz) Y(0á5MHz)
Tín hiệu
G(0á5MHz) R-Y(0á1,5MHz) Video màu
B(0á5MHz B-Y (0á1,5MHz) tổng hợp (0á1,5MHz)
Điều
Chế
R Y
Video C
G 5MHz f
5MHz f
5MHz f
B
5MHz f
Hình 25: Nén Video tương tự
Đối với tín hiệu Video số, số lượng bit để sử dụng truyền tải thông tin đối với mỗi miền tần số khác nhau, có nghĩa là miền tần số thấp – nơi chứa đựng nhiều thông tin được sử dụng một số lượng bit lớn hơn và miền tần số cao – nơi chứa đựng ít thông tin, được sử dụng số lượng bit ít hơn.
Tổng số bit cần thiết để truyền tải thông tin về hình ảnh sẽ được giảm một cách đáng kể và dòng dữ liệu được nén mà chất lượng hình ảnh vẫn được đảm bảo.
ENTROPY
Trước khi nói về các phương pháp nén, thì ta cần phải đánh giá lượng thông tin chủ yếu được chứa đựng trong hình ảnh, để từ đó xác định dung lượng dữ liệu tối thiểu cần sử dụng để miêu tả, truyền tải thông tin về hình ảnh.
Lượng thông tin chứa đựng về hình ảnh tỷ lệ nghịch với khả năng xuất hiện hình ảnh. Nói một cách khác, một sự kiện ít xảy ra sẽ chứa đựng nhiều thông tin hơn một sự kiện có nhiều khả năng xảy ra.
Dự đoán “ngày mai mặt trời mọc” có xác suất là 100% ( p = 1 ) vì hiện tượng này luôn đúng. “Ngày mai mặt trời không mọc”không chứa đựng thông tin, đó là hiện tượng hiếm có, xác suất gần như bằng 0 ( P ằ 0 ) và do vậy sự kiện này chứa đựng một lượng thông tin vô cùng lớn.
Đối với hình ảnh, lượng thông tin của một hình ảnh bằng tổng số lượng thông tin của từng phần tử ảnh ( Pixel ).
Trong đó:
I(xI): Lượng thông tin của từng phần tử ảnh xi (được tính bằng bit)
P(xI): Xác suất phần tử ảnh xi xuất hiện.
Nếu một hình ảnh được biểu thị bằng các phần tử x1, x2, x3, .xác suất của từng phần tử là Px1, Px2, Px3,
Gọi lượng thông tin trung bình của hình ảnh là: H(x), H(x) là ENTROPY của hình ảnh và được tính theo công thức:
H(x) =
ETROPY của hình ảnh là một giá trị có ý nghĩa quan trọng bởi nó xác định số lượng bit trung bình tối thiểu cần thiết để biểu diễn một phần tử ảnh.
Trong công nghệ nén không tổn hao ENTROPY là giới hạn dưới của tỷ số bit/pixel. Nếu tín hiệu Video được nén với tỷ lệ bit/ pixel nhỏ hơn ENTROPY thì hình ảnh sẽ bị mất thông tin và quá trình nén sẽ có tổn hao.
Xét 2 Block ảnh trên 2.10, mỗi block co 8´ 8 = 64 phần tử ảnh. Block 1 bao gồm 63 phần tử có giá trị từ “0” và một phần tử có giá trị “1”, Block 2 có 32 phần tử có giá trị “0” và 32 phần tử có giá trị “1”.
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 1
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 1 1 0 1 0 1 0
1 0 1 0 1 0 0 1
1 1 0 1 0 1 1 0
0 1 0 0 1 1 0 0
1 0 0 0 1 0 1 1
0 0 1 0 1 1 1 1
0 1 0 1 1 1 0 1
0 1 0 0 0 1 0 0
Block ảnh 1 Block ảnh 2
Hình 26: Lượng thông tin trong ảnh.
Như trên đã trình bày, lượng thông tin của một ảnh được tính bằng:
ENTROPY = H( x ) = - ồ P( xi ) . log2 P( xi )
Trong đó : N: là số phần tử
P( xi ): Xác suất của từng phần tử ảnh.
ENTROPY Block ảnh 1 bằng:
H1( x ) = = 0,116 bit/ phần tử.
ENTROPY của Block ảnh 2 bằng:
H2 ( x ) = = 1,0 bit/ phần tử.
Như vậy, lượng bit trung bình tối thiểu cần thiết để truyền một phần tử ảnh đối với Block ảnh 1 bằng 0,116 bit/ phần tử và đối với Block ảnh 2 bằng 1,0 bit/ phần tử. Block ảnh 2 chứa thông tin nhiều hơn Block ảnh 1.
2. Nén Video:
Nén cơ bản là một quá trình trong đó lưọng thông tin của một ảnh hoặc nhiều ảnh được giảm bớt bằng cách loại bỏ các thông tin dư thừa trong tín hiệu video.
Công đoạn đầu tiên của hầu hết các quá trình nén là xác định thông tin dư thừa trong miền không gian của một manh hay một ảnh của tín hiệu video. Nén không gian được thực hiện bởi phép biến đổi Cosin rời rạc ( Discrete Transform – DCT ).
DCT là phép biến đổi toán học không tổn hao có tính thuận nghịch được sử dụng trong công việc nén không gian.
Phép biến đổi Cosin rời rạc (DCT ) được biểu thị bằng công thức:
Phép biến đổi ngược DCT-1 được biểu thị bằng:
DCT biến đổi dữ liệu dưới dạng biên độ thành dữ liệu dưới dạng tần số. Các phép tính được thực hiện trong phạm vi các khối 8 ´ 8 mẫu tín hiệu chói Y và các khối tương ứng của tín hiệu màu CB và CR.
Hệ số DCT tương ứng với góc trái phía trên là thành phần một chiều của khối. Các hệ số khác, giá trị thành phần một chiều biểu thị các tần số theo chiều ngang.
Các hệ số khác ứng với những phối hợp khác nhau của các tần số theo chiều dọc và theo chiều ngang.
Do bản chất của tín hiệu Video, phép biến đổi DCT cho ta những hệ số ứng với các thành phần tần số cao với gía trị rất nhỏ. Do bản chất của thị giác, các hệ số ứng với các thành phần tần số cao có thể được biểu thị bằng số lượng bit rất nhỏ hoặc loại bỏ mà không nhận biết được sự suy giảm chất lượng.
DCT về lý thuyết, không giảm bớt dung lượng dữ liệu, DCT cho phép biến đổi không tổn hao và hoàn toàn có tính thuận nghịch.
Hình 27: Tính thuận – nghịch của phép biến đổi DCT .
Hình 28: Biến đổi DCT .
Hình 29: Một khối các phần tử ảnh (pxixel Blok ) gồm các sọc đen và sọc trắng theo chiều dọc sau khi biến đổi DCT sẽ chỉ còn là các hệ số nằm dọc theo trục ngang.
Hình 30: Một khối các phần tử ảnh (pxixel Blok ) gồm các sọc đen và sọc trắng theo chiều dọc, sau khi biến đổi DCT sẽ chỉ còn là các hệ số nằm dọc theo trục dọc.
ã Nén trong ảnh ( Intra – Frame Compression ):
Nén trong ảnh là loại nén nhằm giảm bớt thông tin dư thừa trong miền không gian. Nén trong ảnh sử dụng cả cả hai quá trình tổn hao và không có tổn hao để giảm bớt dữ liệu trong một ảnh. Quá trình này không sử dụng thông tin của ảnh trước và sau ảnh đang xét.
Thuật ngữ “ ảnh ” ở đây cần được hiểu một cách chính xác, bởi lẽ trong kĩ thuật nén ảnh. Ví dụ MPEG cho phép sử dụng màn hình ( Filed ) hoặc ảnh ( Frame ) như một ảnh gốc.
Nếu kỹ thuật nén dùng mành ( Filed ), nén trong ảnh sẽ tách ra 2 ảnh trong mỗi ảnh .
Hình 31: Nén theo ảnh (Frame).
Hình 32: Nén theo mành.
Hình 33: Nén trong ảnh (Intra – Frame compression).
DCT: không mất thông tin, không giảm dung lượng dữ liệu.
LƯợNG Tử Hoá: mất thông tin, giảm dung lượng dữ liệu, số lượng bít ứng với mỗi hệ số khác nhau.
Mã Hoá ENTROPY:
+ VLC: việc sử dụng từ mã ngắn với các giá trị xảy và từ mã dài với các giá trị ít xảy ra.
+ RLC: truyền một từ mã duy nhất thay vì phải truyền đi chuỗi “ 0 ”
ã Lượng tử hoá ( Quantization ):
Sức mạnh của nén MPEG là ở chỗ lượng tử hoá một cách thông minh các hệ số của phép biến đổi DCT. Lượng tử hoá là một quá trình giảm bớt số lượng các bít cần thiết để biểu diễn các hệ số trong quá trình lượng tử hoá có thể dùng 11 bit cho hệ số một chiều ( DC ) và rất ít bit cho hệ số thay đổi lớn hơn. Mức độ lượng tử hoá xác định cho từng Macroblock ( 8 ´ 8 phần tử ảnh ) hoặc một nhóm Macroblock.
Hệ số một chiều ( DC Coefficient ) trong DCT đòi hỏi độ chính xác cao nhất bởi lẽ nó biểu thị giá trị độ chói trung bình của từng khối phần tử ảnh ( pixel block ). Hệ số một chiều cần được mã hoá khác so với hệ số khác ( hệ số xoay chiều – AC Coefficient ).
Lượng tử hoá còn thực hiện bằng cách chia các hệ số C (u,v) cho các hệ số tương ứng trong các bảng lượng tử. Hệ số ứng với tần số thấp được chia cho các giá trị nhỏ ( 10, 11, 12 ... ). Hệ số ứng với tần số cao được chia cho các giá trị lớn (100, 120, 121 ) và bỏ đi phần thập phân. Kết quả ta có một tập hợp các hệ số Cosin C(u,v) mới, trong đó phần lớn các hệ số tương ứng với thành phần tần số cao bằng “ 0 ”. Các giá trị C (u,v) sẽ được số hoá và mã hoá trong các công đoạn tiếp theo.
Cần lưu ý, lượng tử hoá có trong số ( Weighting Quantization ) như phương pháp trên sẽ gây tổn hao, mức độ tổn hao phụ thuộc vào các giá trị các hệ số trên bảng lượng tử.
Nếu các giá trị được lựa chọn thích hợp, tổn hao sẽ rất nhỏ và trên thực tế sẽ không nhận thấy.
Hình 34: Lượng tử hoá có trọng số sử dụng trong kỹ thuật nén.
ã Nén không tổn hao:
Tiếp phép lượng tử hoá, nén không tổn hao còn được thực hiện bằng phương pháp mã hoá hoá với độ dài từ mã thay đổi (Veriable Length Coding – VLC ) và mã hoá theo chiều dài ( Run Length Coding ( RLC ).
Thứ tự truyền các hệ số cũng làm tối ưu hiệu quả của quá trình mã hoá. Xử lý 64 hệ số của khối 8 ´ 8 phần tử ảnh bằng cách quét Zig – Zag làm tăng tối đa các giá trị “ 0 ” và do vậy làm tăng hiệu quả nén.
Mã hoá với một từ mã thay đổi VLC sử dụng ít bít để mã hoá các giá trị hay xảy ra và nhiều bit để mã hoá các giá trị ít xảy ra. Dùng từ mã ngắn ( ít bit ) cho các giá trị hường xảy ra ( xác suất lớn ) và từ mã dài ( nhiều bit ) cho các giá trị ít xảy ra ( xác suất nhỏ ). Các phân bố bit này được minh hoạ ở bảng sau:
Symbol
Probabiliy
Code Word
Code length
A
0,5
0
1
B
0,25
10
2
C
0,125
110
3
D
0,0625
1110
4
E
0,03125
11110
5
F
0,3215
11111
5
Sự khác nhau về số lượng bit trung bình cần thiết để biểu thị mỗi phần tử ảnh với 2 loại mã: mã hoá với độ dài từ mã cố định và mã hoá với độ dài từ mã thay đổi được miêu tả trong ví dụ sau:
a. Mã hóa với độ dài từ mã cố định:
Phần tử
Xác suất
Từ mã
Chiều dài từ mã
a
0,75
00
2
b
0,125
10
2
c
0,0625
10
2
d
0,0625
11
2
Entropy có thể tính theo công thức:
H1(xi) = P(xi) ´ L(xi)
= 0.75 ´ 2 + 0.125 ´ 2 + 0.0625 ´ 2 + 0.0625 ´ 2 = 2 bit/ phần tử
b. Mã hoá với độ dài từ mã thay đổi:
Phần tử
Xác suất
Từ mã
Chiều dài từ mã
a
0,75
00
1
b
0,125
10
2
c
0,0625
100
3
d
0,0625
1111
3
H2 (xi ) = P(xi ) ´ L(xi)
= 0.75 ´ 1 + 0.125 ´ 2 + 0.0625 ´ 3 + 0.0625 ´ 3 = 1.75 bit/ phần tử
Như vậy trong ví dụ này mã hóa với độ dài từ mã thay đổi ( VLC ) tiết kiệm được số bit dùng để biểu thị cùng một dung lượng thông tin.
Dung lượng bit cần thiết để biểu thị và truyền tải thông tin mà không hề bị tổn hao. Mã theo chiều dài RLC là quá trình mà trong đó chỉ sử dụng một từ mã duy nhất để miêu tả một dãy các giá trị giống nhau.
Ví dụ: Từ mã “0” nếu ta có một block có chuỗi với 25 từ giá trị “0” , còn lại là 39 từ mã giá trị “1” ta có thể biểu thị bằng 3 byte:
Byte 1: ESC 11111 : Từ mã mở đầu cho block này
Byte 2: 11001 : Chỉ giá trị 25
Byte 3: 00000 : chỉ thị bit “0”
Như vậy 25 byte được nén xuống còn 1 byte: 11001.
Vậy VLC và RLC là quá trình nén không có tổn hao.
ã Nén liên ảnh ( Inter – Frame Compresion ):
Một tính chất nữa của tín hiệu Video nữa là chứa các thông tin dư thừa trong miền thời gian. Điều này có nghĩa là một chuỗi liên tục các ảnh, lượng thông tin chứa trong mỗi ảnh thay đổi rất ít từ ảnh này sang ảnh khác. Tính toán sự chuyển dịch vị trí của nội dung hình ảnh là một phần rất quan trọng trong kỹ thuật nén liên ảnh.
Trong kỹ thuật nén MPEG, quá trình xác định chuyển động được thực hiện bằng cách chia hình ảnh thành các Macroblock, mỗi Macroblock có 16 ´ 16 pixel ( tương đương 4 block, mỗi Block có 8 ´ 8 pixel ).
Để xác định chiều của chuyển động, người ta tìm kiếm vị trí của Macroblock của ảnh tiếp theo, kết quả tìm kiếm sẽ cho ta Vectơ chuyển động của Macroblock.
Hình 35: Xác định vectơ chuyển động
Nén liên ảnh ( Inter - Frame ) dựa trên ảnh chưa nén ( Uncompression Picture) nên về cơ bản không có tổn hao.
Trong hình vẽ: ảnh trước đó ( Previous Frame ) được lưu giữ trong bộ nhớ (Previous Frame Storage ) với đầy đủ độ phân giải, đầy đủ dữ liệu.
Trong khối xác định vectơ chuyển động ( Motion Estimation ), vectơ chuyển động được tính sao cho ảnh hiện tại được dự đoán một cách chính xác nhất.
Hình 36: Nén liên ảnh (Inter – Frame compression)
Tuy nhiên, các ảnh khác nhau ở nhiều khía cạnh, nếu chỉ sử dụng vectơ chuyển động, ảnh dự đoán sẽ không chính xác. ảnh dự đoán trên hình vẽ được tạo bởi ảnh trước đó và các thông tin về vectơ chuyển động.
Hiệu giữa ảnh hiện tại và ảnh dự đoán sẽ cho ảnh khác biệt ở đầu ra. Nếu không chuyển động và không có sự khác biệt giữa 2 ảnh ( ảnh tĩnh ), ảnh hiện tại sẽ được dự đoán một cách chính xác và tín hiệu tương ứng với ảnh khác biệt ở đầu ra sẽ bằng không.
Khi 2 ảnh không giống nhau, ảnh khác biệt ( hiệu giữa 2 ảnh ) cũng chỉ còn ít thông tin. Vì vậy công nghệ nén đã đạt hiệu quả mong muốn.
Trên hình vẽ là sơ đồ nguyên lý của mạch tạo ảnh dự đoán trước ( P- Predicted Picture ) và ảnh dự đoán 2 chiều ( ảnh B – Bidirectional Picture ).
Sự khác nhau cơ bản giữa 2 mạch ( mạch tạo ảnh P và mạch tạo ảnh B ) ở bộ nhớ ảnh so sánh. Để tạo ảnh P ta chỉ cần nhớ ảnh trước đó ( Predected Picture). Trong khi đó để tạo ảnh B ta phải nhớ cả 2 ảnh: ảnh trước đó và sau ảnh đang xét.
Sự kết hợp giữa nén trong ảnh ( Intra – Frame ) và nén liên ảnh ( Inter – Frame ) tạo cơ sở cho công nghệ nén Video MPEG ( Motion – Picture – Expert – Group ). MPEG được xây thành lập từ tháng 2 năm 1988 với nhiệm vụ xây dựng tiêu chuẩn tín hiệu Audio và Video số.
Tiêu chuẩn đầu tiên được nhóm MPEG đưa ra là MPEG – 1, mục tiêu của MPEG - 1 là mã hoá tín hiệu Audio và Video số với tốc độ bit khoảng 1.5 Mbps và lưu giữ trong đĩa CD với chất lượng tương VHS.
Tiêu chuẩn thứ 2 được gọi cái tên tương tự là MPEG – 2 ra đời vào năm 1990, không như MPEG – 1, chỉ nhằm lưu giữ ảnh động vào đĩa với dung lượng bit thấp. MPEG – 2 với công cụ mã hoá khác nhau đã được phát triển.
ã Cấu trúc dòng bit MPEG – 2 Video:
Dòng bit MPEG – 2 có dạng như hình vẽ:
Hình 37: Cấu trúc dòng bít MPEG Video
* Seg: Thông tin về chuỗi bit ( Sequence )
- Video Params: chiều cao, rộng, tỷ lệ khuôn hình các phần tử ảnh
- Bitstream Prams: Tốc độ bit và thông tin khác
- QTS: có hai loại:
+ Nén trong ảnh ( ảnh I – I Frame )
+ Nén liên ảnh ( ảnh P – P Prame )
* GOP Thông tin về nhóm ảnh ( Group Of Picture )
- Time Code: SMPTE: giờ, phút, giây, ảnh
- GOP Params: miêu tả cấu trúc GOP
* PICT: Thông tin về ảnh (Picture Information )
- Type: ảnh loại I, P hay B.
- Buffer Params: Thông tin về Buffer
- Encode Params: Thông tin về vectơ chuyển động.
* Slice: Thông tin về Slice ảnh.
- Vert pos: Slice bắt đầu từ dòng nào.
- Qscale: Thông tin về bảng lượng tử
* MB: Thông tin về MacroBlock
- Addr Incr: Số lượng MacroBlock được bỏ qua.
- Tyep: loại vectơ chuyển động dùng cho MacroBlock.
- Qscale: Bảng lượng tử dùng cho MacroBlock
- Coded Block Pattern ( CBP ): Chỉ rõ Block nào được mã hoá.
Hình 38: Cấu trúc phân lớp chuẩn MPEG.
Hình 39: Nén MPEG.
ảnh I, P, B
Trong kỹ thụât nén liên ảnh được sử dụng:
+ ảnh I ( Intra – Frame ): Chỉ sử dụng nén trong ảnh.
+ ảnh P: được dự đoán trên cơ sở ảnh I hoặc ảnh P trước đ
Các file đính kèm theo tài liệu này:
- 6261.doc