Chất lượng hình ảnh tốt : H.264 là chuẩn nén sử dụng công nghệ âm thanh, hình ảnh mới khả năng nén tôt hơn so với các chuẩn nén trước đó. Do đó, chuẩn nén cung cấp dịch vụ phân phát hình ảnh chất lượng cao qua mạng băng thông giới hạn.
Yêu cầu băng thông thấp : Chất lượng hình ảnh của H.264 gần giống với MPEG-2 nhưng H.264 cần ít băng thông để truyền tải tín hiệu với cùng chất lượng. Đặ điểm này rất phù hợp để sử dụng trong hệ thống IPTV.
Có khả năng kết hợp với các thiết bị xử lí video có sẵn như MPEG-2 và hạ tầng mạng dựa trên IP đã có sẵn .
Hỗ trợ truyên hình độ phân giải cao : Khi sử dụng tối ưu chuẩn nén thể làm có thể làm tăng khả năng truyền dữ liệu của mạng. Do đó các nhà cung cấp dịch vụ truyền thông có thể sử dụng chuẩn nén này để cung cấp chương trình video độ phân giải cao qua mạng sẵn có.
Hỗ trợ nhiều ứng dụng : Chuẩn nén H.264 được sử dụng trong nhiều ứng dụng, với nền khác nhau thì có những yêu cầu riêng. Ví dụ, ứng dụng truyền đa điểm trong IPTV yêu cầu phải hiện thị hình ảnh ở dạng chuẩn truyền hình, trong khi, đối với các ứng dụng giải trí di động, hình ảnh phải hiển thị được trên các thiết bị di động. Để phù hợp với mọi ứng dụng, chuẩn nén H.264 có rất nhiều profile và level.Đặc điểm của profile và level là tốc độ bit và kích thước ảnh.
Có thể truyền độc lập : Chuẩn nén H.264 có thể truyền qua nhiều giao thức như ATM, RTP,UDP, TCP và các dong MPEG-2.
Dễ dàng thích nghi với các mạng chất lượng kém nhờ cơ chế sửa lỗi .
84 trang |
Chia sẻ: lethao | Lượt xem: 3787 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đồ án Tìm hiểu công nghệ IPTV, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
g chỉ mang phần dữ liệu lấy từ cùng một gói PES.
Mỗi gói PES không thể phân chia dữ liệu của nó một cách chính xác vào một số nguyên gói TS. Thường gặp trường hợp không đủ số liệu để lấp đầy vào payload của gói TS cuối cùng. Để thỏa mãn 2 điều kiện trên, người ta độn thêm phần Adaptation Field với độ dài thích hợp. Có thể giảm thiểu độ dài phần Adaptation Field này bằng cách lựa chọn chiều dài gói PES hợp lý. Gói PES cũng thường được chọn đủ dài để đa số các gói TS được lấp đầy bởi số liệu có ích lấy từ các gói PES, hình 3.26.
Payload PES
Header của PES
Header của TS
Payload TS
Payload TS
Payload TS
Adaptation Field
Hình 3.25 Chia các gói PES thành các gói TS.
Mặc dù MPEG-2 được sử dụng trong truyền hình cáp và vệ tinh, nhưng MPEG-2 có nhưng hạn chế đối với các mạng có băng thông giới hạn. Do đó một công nghệ nén mới với nhiều tính năng đã được phát triển trong những năm gần đây với mục đích truyền video qua mạng băng thông giới hạn. MPEG-4 part 10 được sử dụng trong hạ tầng mạng IPTV.
2.3 Chuẩn MPEG - 4
Chuẩn MPEG-4 là một chuẩn động dễ thay đổi: với MPEG-4, các đối tượng khác nhau trong một khung hình có thể được mô tả, mã hoá và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES (Elementary Stream) khác nhau. Cũng nhờ xác định, tách và sử lý riêng các đối tượng (như nhạc nền, âm thanh xa gần, đồ vật, đối tượng ảnh video như con người hay động vật, nền khung hình…), nên người sử dụng có thể loại bỏ riêng từng đối tượng khỏi khuôn hình. Sự tổ hợp lại thành khung hình chỉ được thực hiện sau khi giải mã các đối tượng này.
Đặc điểm chính của MPEG-4 là mã hóa video và audio với tốc độ bit rất thấp. Thực tế tiêu chuẩn đưa ra với 3 dãy tốc độ bit :
Dưới 64 Kbps
64 đến 384 Kbps
384 Kbps đến 4Mbps
Đặc điểm quan trọng của chuẩn MPEG-4 là cho phép khôi phục lỗi tại phía đầu thu, vì vậy chuẩn nén đặc biệt thích hợp với môi trường dễ xảy ra lỗi như truyền dữ liệu qua các thiết bị cầm tay. MPEG-4 là chuẩn quốc tế đầu tiên dành cho mã hóa các đối tượng video. Với độ linh động và hiệu quả do mã hóa từng đối tượng video, MPEG-4 đạt ứng dụng cho các dịch vụ nội dung video có tính tương tác và các dịch vụ truyền thong video trực tiếp hay lưu trữ. Trong MPEG-4, khung cảnh của một đối tượng video được mã hóa riêng lẽ. Sự cách ly các đối tượng video như vậy mang đến độ mềm dẻo hơn cho việc thực hiện mã hóa thích nghi làm tăng hiệu quả nén tin hiệu. Mặc dù tập trung vào những ứng dụng tốc độ bit thấp nhưng MPEG-4 cũng bao gồm cả studio chất lượng cao và HDTV.
Hình 3.26 Cấu trúc bộ mã hóa và giải mã MPEG-4
Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm:
Bộ mã hoá hình dạng ngoài Shape Coder dùng để nén đoạn thông tin, giúp xác định khu vực và đường viền bao quanh đối tượng trong khung hình scene.
Bộ dự đoán và tổng hợp động để giảm thông tin dư thừa theo thời gian.
Bộ mã kết cấu mặt ngoài Texture coder dùng để xử lý dữ liệu bên trong và các dữ liệu còn lại sau khi đã bù chuyển động.
Hình 3.28 là một ví dụ về mã hóa và tổng hợp khung hình video sử dụng trong MPEG-4. Nhiều đối tượng, người, xe, nhà cửa, được tách ra khỏi video đầu vào. Mỗi đối tượng video sau đó được mã hóa bởi bộ mã hóa đối tượng video VO (video object) và sau đó được truyền đi trên mạng. Tại đầu thu, những đối tượng này được giải mã riêng rẽ nhờ bộ giải mã VO và gửi đến bộ tổ hợp (compositor). Người sử dụng có thể tương tác với thiết bị để cấu trúc lại khung hình gốc (a), hay để xử lý các đối tượng tạo ra một khung hình khác (b). Ngoài ra, người sử dụng có thể tải các đối tượng khác từ các thư viện cơ sở dữ liệu (có sẵn trên thiết bị hay từ xa thông qua mạng LAN, WAN hay Internet) để chèn thêm vào hay thay thế các đối tượng có trong khuôn hình gốc (c).
Hình 3.27 Mã hóa và tổng hợp khung hình trong MPEG-4
Để có thể thực hiện việc tổ hợp khung hình, MPEG-4 sử dụng một ngôn ngữ mô tả khung hình riêng, được gọi là định dạng nhị phân cho các khung hình BiFS (Binary Format for Scenes). BiFS không chỉ mô tả ở đâu và khi nào các đối tượng xuất hiện trong khung hình, nó cũng mô tả cách thức hoạt động của đối tượng (làm cho một đối tượng xoay tròn hay chồng mờ hai đối tượng lên nhau) và cả điều kiện hoạt động đối tượng và tạo cho MPEG-4 có khả năng tương tác. Trong MPEG-4, tất cả các đối tượng có thể được mã hoá với sơ đồ mã hoá tối ưu riêng của nó – video được mã hoá theo kiểu video, text được mã hoá theo kiểu text, các đồ hoạ được mã hoá theo kiểu đồ hoạ - thay vì việc xử lý tất cả các phần tử ảnh pixels như là mã hoá video ảnh động. Do các quá trình mã hoá đã được tối ưu hoá cho từng loại dữ liệu thích hợp, nên chuẩn MPEG-4 sẽ cho phép mã hoá với hiệu quả cao tín hiệu ảnh video, audio và cả các nội dung tổng hợp như các bộ mặt và cơ thể hoạt hình.
2.4 Chuẩn nén H.264/AVC
2.4.1 Giới thiệu chung
Kể từ khi mới xuất hiện vào đầu những năm 90, chuẩn nén video MPEG-2 đã hoàn toàn thống lĩnh thế giới truyền thông. Cũng trong thập kỷ này, chuẩn nén MPEG-2 đã được cải tiến về nhiều mặt. Giờ đây nó có tốc độ bit thấp hơn và việc ứng dụng nó được mở rộng hơn nhờ có các kỹ thuật như đoán chuyển động, tiền xử lý, xử lý đối ngẫu và phân bổ tốc độ bit tùy theo tình huống thông qua ghép kênh thống kê.
Tuy nhiên, chuẩn nén MPEG-2 cũng không thể được phát triển một cách vô hạn định. Thực tế hiện nay cho thấy chuẩn nén này đã đạt đến hết giới hạn ứng dụng của mình trong lĩnh vực truyền truyền hình từ sản xuất tiền kỳ đến hậu kỳ và lưu trữ Video số. Bên cạnh đó, nhu cầu nén Video lại đang ngày một tăng cao kèm theo sự phát triển mạnh mẽ của mạng IP mà tiêu biểu là mạng Internet. Khối lượng nội dung mà các công ty truyền thông cũng như các nhà cung cấp dịch vụ thông tin có thể mang lại ngày càng lớn, ngoài ra họ còn có thể cung cấp nhiều dịch vụ theo yêu cầu thông qua hệ thống cáp, vệ tinh và các hạ tầng viễn thông đặt biệt là mạng Internet.
Các tiêu chuẩn mã hoá Video ra đời và phát triển với mục tiêu cung cấp các phương tiện cần thiết để tạo ra sự thống nhất giữa các hệ thống được thiết kế bởi những nhà sản xuất khác nhau đối với mọi loại ứng dụng Video; Nhờ vậy thị trường Video có điều kiện tăng trưởng mạnh. Chính vì lý do này nên những người sử dụng bộ giải mã cần có một chuẩn nén mới để đi tiếp chặng đường mà MPEG-2 đã bỏ dở.
Hiệp hội viễn thông quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế/ Uỷ ban kỹ thuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoá Video. Theo ITU-T, các tiêu chuẩn mã hoá Video được coi là các khuyến nghị gọi tắt là chuẩn H.26x (H.261, H.262, H.263 và H.264). Với tiêu chuẩn ISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 và MPEG-4).
Những khuyến nghị của ITU được thiết kế dành cho các ứng dụng truyền thông Video thời gian thực như Video Conferencing hay điện thoại truyền hình. Mặt khác, những tiêu chuẩn MPEG được thiết kế hướng tới mục tiêu lưu trữ Video chẳng hạn như trên đĩa quang DVD, quảng bá Video số trên mạng cáp, đường truyền số DSL, truyền hình vệ tinh hay những ứng dụng truyền dòng Video trên mạng Internet hoặc thông qua mạng không dây (wireless).
Với đối tượng để truyền dẫn Video là mạng Internet thì ứng cử viên hàng đầu là chuẩn nén MPEG-4 AVC, còn được gọi là H.264, MPEG-4 part 10, H.26L hoặc JVT.
2.4.2 Tính kế thừa của chuẩn nén H.264
Mục tiêu chính của chuẩn nén H.264 đang phát triển nhằm cung cấp Video có chất lượng tốt hơn nhiều so với những chuẩn nén Video trước đây. Điều này có thể đạt được nhờ sự kế thừa các lợi điểm của các chuẩn nén Video trước đây. Không chỉ thế, chuẩn nén H.264 còn kế thừa phần lớn lợi điểm của các tiêu chuẩn trước đó là MPEG-4 bao gồm 4 đặc điểm chính như sau:
Phân chia mỗi hình ảnh thành các Block (bao gồm nhiều điểm ảnh), do vậy quá trình xử lý từng ảnh có thể được tiếp cận tới mức Block.
Khai thác triệt để sự dư thừa về mặt không gian tồn tại giữa các hình ảnh liên tiếp bởi một vài mã của những Block gốc thông qua dự đoán về không gian, phép biến đổi, quá trình lượng tử và mã hoá Entropy (hay mã có độ dài thay đổi VLC).
Khai thác sự phụ thuộc tạm thời của các Block của các hình ảnh liên tiếp bởi vậy chỉ cần mã hoá những chi tiết thay đổi giữa các ảnh liên tiếp. Việc này được thực hiện thông qua dự đoán và bù chuyển động. Với bất kỳ Block nào cũng có thể được thực hiện từ một hoặc vài ảnh mã hoá trước đó hay ảnh được mã hoá sau đó để quyết định véc tơ chuyển động, các véc tơ này được sử dụng trong bộ mã hoá và giải mã để dự đoán các loại Block.
Khai thác tất cả sự dư thừa về không gian còn lại trong ảnh bằng việc mã các block dư thừa. Ví dụ như sự khác biệt giữa block gốc và Block dự đoán sẽ được mã hoá thông qua quá trình biến đổi, lượng tử hoá và mã hoá Entropy.
2.4.3 Mã hóa H.264
Hình 3.28 Sơ đồ mã hoá Video của H264/MPEG Part 10
Lớp mã hoá video của H264/MPEG Part 10 là sự kết hợp của mã hoá không gian, mã hoá thời gian và mã chuyển vị. Ảnh được tách thành các khối, ảnh đầu tiên của dãy hoặc điểm truy cập ngẫu nhiên thì được mã hoá “Intra”- mã hoá trong ảnh, có nghĩa là không dùng thông tin của các ảnh khác mà chỉ dùng thông tin chứa trong ảnh đó. Mỗi mẫu của một khối trong một Frame Intra được dự đoán nhờ dùng các mẫu không gian bên cạnh của các khối đã mã hoá trước đó. Đối với tất cả các ảnh còn lại của dãy hoặc giữa các điểm truy cập ngẫu nhiên, mã hoá “Inter” được sử dụng, dùng dự đoán bù chuyển động từ các ảnh được mã hoá trước đó.Quá trình mã hoá cho dự đoán liên ảnh (bù chuyển động) gồm việc lựa chọn dữ liệu chuyển động, các ảnh tham chiếu và sự dịch chuyển không gian được ứng dụng cho tất cả việc lấy mẫu của khối.
Bộ mã hoá có thể lựa chọn giữa mã hoá Intra và Inter cho miền hình dạng khối của mỗi ảnh. Mã hoá Intra có thể chỉ ra điểm truy cập của chuỗi được mã hoá, tại đó việc giải mã có thể bắt đầu và tiếp tục một cách chính xác. Mã hoá Intra sử dụng các mode dự đoán không gian riêng rẽ để làm giảm độ dư thừa không gian trong tín hiệu gốc của mỗi ảnh đơn. Mã hoá Inter (dự đoán một chiều hay nhiều chiều) thì việc sử dụng dự đoán liên ảnh hiệu quả hơn cho mỗi block của giá trị lấy mẫu từ một vài ảnh được giải mã trước đó.
Mã hoá Inter sử dụng các Vector chuyển động cho các block cơ sở dự đoán liên ảnh (Inter prediction) để làm giảm sự dư thừa thời gian giữa các ảnh (picture) khác nhau. Việc dự đoán được thu được từ tín hiệu đã lọc tách khối của các ảnh được thiết lập lại trước đó.
Bộ lọc tách khối làm giảm sự nhiễu khối tại các đường biên của block. Các vector chuyển động và các mode dự đoán trong ảnh (intra prediction) có thể (theo lý thuyết) làm biến đổi kích thước block trong ảnh. Sự dự đoán thặng dư được nén tốt hơn bằng việc sử dụng một phép biến đổi để loại bỏ sự tương quan theo không gian trong một block trước khi được lượng tử hoá.
Cuối cùng, Vector chuyển động hay các mode dự đoán liên ảnh được liên kết với thông tin của hệ số biến đổi lượng tử hóa và được mã hoá sử dụng mã Entropy như mã hoá chiều dài biến đổi thích ứng theo tình huống CAVLC (context-adaptive variable length code) hay mã hoá theo số học nhị phân thích ứng theo tình huống CABAC (context-adaptive binary arithmetic coding).
2.4.4 Nén video
a/ Nén theo miền thời gian
Những dư thừa về mặt thời gian là những hình ảnh giống nhau lặp đi lặp lại từ khung này sang khung khác, ví dụ như khung nền không chuyển động của một chương trình đối thoại trên truyền hình. Vì vậy, để giảm bớt độ dư thừa này ta phải tiến hành nén theo miền thời gian.
Khi bộ mã hoá đang hoạt động ở chế độ “giữa khối”, khối này sẽ phải qua công đoạn hiệu chỉnh chuyển động. Quá trình này sẽ phát hiện ra bất kỳ chuyển động nào diễn ra giữa khối đó và một khối tương ứng ở một hoặc hơn một ảnh tham chiếu đã được lưu trữ từ trước, sau đó tạo ra khối “chênh lệch” hoặc “lỗi”. thao tác này làm giảm bớt dữ liệu trong mỗi Block một cách hiệu quả do chỉ phải biểu diễn chuyển động của nó mà thôi. Tiếp đến là công đoạn biến đổi Cosine rời rạc DCT để bắt đầu nén theo miền không gian. Khi bộ mã hoá hoạt động ở chế độ “trong khối”, khối này sẽ bỏ qua công đoạn hiệu chỉnh chuyển động và tới thẳng công đoạn DCT.
b/ Nén theo miền không gian
Dư thừa về mặt không gian là các khối có chứa các điểm ảnh tương tự nhau hoặc giống hệt nhau. Trong nhiều trường hợp các điểm ảnh thường không thay đổi nhiều. Như vậy có nghĩa là tần số thay đổi giá trị điểm ảnh trong khối này là rất thấp. Những khối như thế được gọi là khối có tần số không gian thấp. Bộ lập mã lợi dụng đặc điểm này bằng cách chuyển đổi các giá trị điểm ảnh của khối thành các thông tin tần số trong công đoạn biến đổi Cosine rời rạc.
* Biến đổi Cosine rời rạc (DCT)
Biến đổi Cosine là một hàm mà làm biến đổi dữ liệu hỉnh ảnh được thể hiện trong hệ toạ độ X-Y sang miền tần số. Công đoạn DCT biến đổi các giá trị điểm ảnh của khối thành một mạng lưới gồm các hệ số ngang dọc đặt trong không gian tần số. Khi khối ban đầu có tần số không gian thấp, DCT sẽ tập hợp năng lượng tần số vào góc tần số thấp của mạng lưới. Nhờ vậy, những hệ số tần số thấp ở góc đó sẽ có giá trị cao hơn. Một số lượng lớn các hệ số khác còn lại trên mạng lưới đều là các hệ số có tần số cao, năng lượng thấp và có giá trị thấp. Tại đây, hệ số DC và một vài hệ số tần số thấp sẽ hàm chứa phần lớn thông tin được mô tả trong khối ban đầu. Có nghĩa là bộ lập giải mã có thể loại bỏ phần lớn hệ số tần số cao còn lại mà không làm giảm chất lượng hình ảnh của khối. Bộ lập mã chuẩn bị các hệ số cho công đoạn này bằng cách quét chéo mạng lưới theo đường zig-zag, bắt đầu từ hệ số DC và qua vị trí của hệ số ngang dọc tăng dần. Do vậy nó tạo ra được một chuỗi hệ số được sắp xếp theo tần số.
* Lượng tử hoá
Quá trình lượng tử hoá là quá trình biến đổi có mất thông tin, làm giảm bớt số lượng bít cần thiết để biểu diễn các hệ số. Dựa trên một hệ số tỷ lệ xích (có thể điều chỉnh bởi bộ mã hoá), bộ lượng tử hoá sẽ cân đối tất cả các giá trị hệ số. Do phần lớn các hệ số đi ra từ DCT đều mang năng lượng cao nhưng giá trị thấp nên bộ lượng tử hoá bắt đầu bằng một số giá trị cao ở đầu chuỗi, theo sau là một hàng dài các hệ số đã được lượng tử hoá về 0. Bộ lập mã Entropy có thể theo dõi số lượng các giá trị 0 liên tiếp trong một chuỗi mà không cần mã hoá chúng, nhờ vật giảm bớt được khối lượng dữ liệu trong mỗi chuỗi. Để lượng tử hóa các hệ số biến đổi, H264/MPEG Part 10 dùng phương pháp lượng tử hóa vô hướng. Các bộ lượng tử hoá được lựa chọn cho mỗi Macro-Block là dựa vào các tham số lượng tử hoá QP (Quantization Parameter). Các bộ lượng tử hoá được sắp xếp sao cho có sự tăng khoảng 12.5% trong kích thước bước lượng tử hoá khi QP tăng một đơn vị. Nhìn chung các hệ số biến đổi được lượng tử hoá của khối được quét zig-zag và được truyền đi nhờ dùng phương pháp mã hoá Entropy.
* Mã hoá Entropy
Mã hoá Entropy trong các tiêu chuẩn trước đó như MPEG -1,2,4, H.261, và H.263 thì cơ bản là trên các bảng cố định mã hoá biến đổi theo chiều dài (VLC). Các tiêu chuẩn đó xác định các bộ mã hoá từ là cơ bản trên sự phân bố xác suất của các video chung thay cho mã Huffman chính xác đến các chuỗi video. Tuy nhiên H.264 sử dụng các VLC để mà khớp với một biểu tượng được mã hoá cơ bản trên các đặc trưng của ngữ cảnh. Tất cả các phần tử cú pháp, ngoại trừ các dữ liệu dư thừa, được mã hoá bằng mã Exp-Golomb. Để mà đọc được các dữ liệu dư thừa (các hệ số biến đổi đã lượng tử hoá) thì ta sử dụng phương pháp quét Zig-Zag (xen kẽ nhau) hay quét lần lượt (không xen kẽ hay phân trường).
2.4.5 Bộ lọc tách khối
Một đặc trưng riêng của mã hoá dựa trên cơ sở khối là có thể nhìn thấy các cấu trúc khối. Các mép của khối được cấu trúc lại với độ chính xác kém hơn các phần tử ảnh (pixel) bên trong và nhìn chung dạng khối (blocking) được xem là một trong những nhiễu “artifact” dễ nhìn thấy nhất với các phương pháp nén hiện tại. Do nguyên nhân này mà H.264/MPEG-4 Part 10 sử dụng bộ lọc tách khối (Deblocking Filter) để làm giảm hiện tượng tách khối, ngăn chặn việc truyền của tạp âm mã hoá được tích luỹ. Tại bộ lọc này, cường độ lọc được điều khiển bởi giá trị của nhiều phần tử cấu trúc.
Các chuẩn nén trước đó đã không sử dụng bộ lọc tách khối bởi vì việc bổ sung rất phức tạp, mặt khác việc chia các nhiễu khối có thể được làm giảm bằng việc sử dụng MC chính xác một nửa phần tử ảnh. Một nửa phần tử ảnh thu được bằng cách lọc tuyến tính (bilinear filtering)của các phần tử ảnh nguyên vẹn bên cạnh đã phát huy vai trò làm “nhẵn” của mã hoá tạp âm trong miền phần tử ảnh nguyên vẹn.
H.264 sử dụng bộ lọc tách khối để việc thực hiện việc mã hoá cao hơn mặc dù việc thực hiện rất phức tạp. Việc lọc được áp dụng cho các mép của các Block 4 x 4 trong một Macro-Block. Quá trình điều khiển bộ lọc tách khối thành phần chói được thực hiện trên 4 cạnh của mẫu 16 x 16 (16-sample) và quá trình xử lý bộ lọc tách khối cho mỗi thành phần màu được thực hiện trên 2 cạnh của mẫu 8 x 8.
2.4.6 Giải mã video
Hình 3.29 Sơ đồ giải mã Video H264/MPEG -4 Part 10
2.4.7 Ưu điểm của H.264/AVC
Chất lượng hình ảnh tốt : H.264 là chuẩn nén sử dụng công nghệ âm thanh, hình ảnh mới khả năng nén tôt hơn so với các chuẩn nén trước đó. Do đó, chuẩn nén cung cấp dịch vụ phân phát hình ảnh chất lượng cao qua mạng băng thông giới hạn.
Yêu cầu băng thông thấp : Chất lượng hình ảnh của H.264 gần giống với MPEG-2 nhưng H.264 cần ít băng thông để truyền tải tín hiệu với cùng chất lượng. Đặ điểm này rất phù hợp để sử dụng trong hệ thống IPTV.
Có khả năng kết hợp với các thiết bị xử lí video có sẵn như MPEG-2 và hạ tầng mạng dựa trên IP đã có sẵn .
Hỗ trợ truyên hình độ phân giải cao : Khi sử dụng tối ưu chuẩn nén thể làm có thể làm tăng khả năng truyền dữ liệu của mạng. Do đó các nhà cung cấp dịch vụ truyền thông có thể sử dụng chuẩn nén này để cung cấp chương trình video độ phân giải cao qua mạng sẵn có.
Hỗ trợ nhiều ứng dụng : Chuẩn nén H.264 được sử dụng trong nhiều ứng dụng, với nền khác nhau thì có những yêu cầu riêng. Ví dụ, ứng dụng truyền đa điểm trong IPTV yêu cầu phải hiện thị hình ảnh ở dạng chuẩn truyền hình, trong khi, đối với các ứng dụng giải trí di động, hình ảnh phải hiển thị được trên các thiết bị di động. Để phù hợp với mọi ứng dụng, chuẩn nén H.264 có rất nhiều profile và level.Đặc điểm của profile và level là tốc độ bit và kích thước ảnh.
Có thể truyền độc lập : Chuẩn nén H.264 có thể truyền qua nhiều giao thức như ATM, RTP,UDP, TCP và các dong MPEG-2.
Dễ dàng thích nghi với các mạng chất lượng kém nhờ cơ chế sửa lỗi .
2.4.8 Các ứng dụng của H.264/AVC
Chuẩn nén này được thiết kế cho các ứng dụng sau:
Truyền hình quảng bá qua qua vệ tinh, cáp, mặt đất…
Truyền hình tương tác, video theo yếu cầu (VoD).
Lưu trữ đĩa quang, băng từ, DVD.
Tích hợp dịch vụ qua ISDN, LAN, DSL, mạng không dây, mạng di động, modem.
Nhắn tin đa phương tiện MMS qua ISDN, DSL, LAN mạng di động.
Còn nhiều ứng dụng khác được phát triển trên mạng hiện tại như video phone,… và mạng tương lai.
Kết luận
Từ những đặc điểm và ưu điểm của MPEG-4 AVC đánh dấu một bước ngoặt trong lĩnh vực nén video, áp dụng các kỹ thuật tiên tiến nhằm mục đích sử dụng băng thông hiệu quả hơn và đem lại chất lượng ảnh cao hơn. Với các kỹ thuật này, MPEG-4 AVC có thể giảm tốc độ bit xuống hơn 50% so với chuẩn MPEG-2. Do đó, MPEG-4 Part 10 được lựa chọn để ứng dụng trong IPTV.
2.5 Các yếu tố ảnh hưởng đến chất lượng video
2.5.1 Ảnh hưởng bởi hệ thống mã hóa/giải mã
Dữ liệu Video trong các ứng dụng đa phương tiện hiện nay thường được mã hóa và nén bằng MPEG2, MPEG4 Part 10/H.264, Microsoft WMV9/VC1 và một số chuẩn nén khác. Các bộ mã hóa video thường hỗ trợ một khoảng khá rộng tốc độ nén, điều này cho phép những lựa chọn khác nhau giữa chất lượng và băng thông. Phần lớn các phương pháp nén video đều dựa vào việc mã khác nhau giữa các frame (inter-frame). Điều này có nghĩa là, thay vì phải gửi đi tất cả các frame, thì chỉ gửi đi sự sai khác của một frame với frame trước đó. Phương pháp mã hóa này làm việc tốt với những video có những thay đổi hình ảnh ít, tuy nhiên sẽ là ảnh hưởng đáng kể đến chất lượng hình ảnh và băng thông nếu có sự thay đổi lớn giữa các frame hình ảnh. Đa số các chuẩn mã hóa vừa cho phép mã hóa với tốc độ bít cố định (chất lượng hình ảnh thay đổi) hay tốc bít thay đổi (chất lượng hình ảnh ít thay đổi).
Các phương pháp mã hóa video nói chung thường kết hợp cả kiểu mã hóa intra-frame và inter-frame. Trong kiểu mã hóa intra-frame, một frame ảnh được chia thành các khối, mỗi khối này được biến đổi thành tập các hệ số thông qua biến đổi Cosin rời rạc. Một nhóm các khối được kết hợp lại thành một thực thể duy nhất (slice), và đôi khi được đóng gói vào một gói. Nếu có lỗi trên đường truyền xảy ra thì có thể cả một nhóm các khối sẽ bị mất, tạo nên “sọc” trong các ảnh dải mã. Điều này xảy ra bởi vì các hệ số của biển đổi Cosin rời rạc trong mỗi khối được tính toán dựa trên khối đầu tiên trong slice, nếu lỗi làm mất thông tin của khối đầu tiên thì tất cả các khối còn lại trong slice là không xác định. Một vài lỗi có thể làm hỏng cấu trúc của frame, do đó không có khả năng tái tạo lại frame. Với kiểu mã hóa inter-frame (motion based coding), các vector chuyển động được xác định và mã hóa cho mỗi khối. Trong các hệ thống mã hóa kiểu inter-frame, việc mất một frame có thể làm cho các frame theo sau nó trở nên không sử dụng được cho đến khi I-frame tiếp theo được nhận, kết quả là có thể thu được hình ảnh video trắng hay hình ảnh bị đông cứng, chất lượng video bị suy giảm đáng kể. Trong hầu hết các trường hợp các tiêu chuẩn mã hóa video đều cung cấp khả năng linh động ở cả bộ mã hóa và giải mã cho việc cân bằng giữa chất lượng và tốc độ. Việc hiểu biết rõ ràng về ảnh hưởng của các bộ mã hóa và giải mã video là yếu tố quan trọng góp phần vào việc đánh giá chính xác các ảnh hưởng của mạng đến chất lượng truyền video trên mạng.
2.5.2 Giới hạn về băng thông
Sự giới hạn về băng thông thường xảy ra tại lớp truy nhập (thường là các kết nối DSL hay Cable). Nếu băng thông dành sẵn không đủ để truyền một stream video thì sẽ xảy ra mất gói tại các bộ đệm của bộ định tuyến, dẫn đến việc suy giảm chất lượng video. Một vấn đề khá tinh tế cũng xảy ra khi mã hóa video với tốc độ bít thay đổi. Trong trường hợp này, sự thay đổi hình ảnh hay sự thay đổi các frame là đáng kể sẽ làm tăng yêu cầu về băng thông trong một khoảng thời gian ngắn, điều này có thể gây lên hiện tượng mất gói và do đó làm suy giảm chất lượng hình ảnh.
2.5.3 Mất gói tin
Sự mất gói tin trên mạng có thể gây ra bởi nhiều nguyên nhân: sự nghẽn mạng, mất liên kết, không đủ băng thông hay lỗi trên đường truyền, v.v… Sự mất gói thường xảy ra bùng phát, mức độ tắc nghẽn mạng cao gây lên độ mất gói cao. Sự suy giảm chất lượng video gây ra bởi hiện tượng mất gói tùy thuộc vào giao thức được sử dụng để truyền tải video:
Khi giao thức UDP được dùng để truyền tải dữ liệu video, khi xảy ra hiện tượng mất gói thì một vài phần của video stream có thể bị mất.
Khi giao thức TCP được dùng để truyền tải dữ liệu video, khi một gói bị mất thì sẽ có yêu cầu truyền lại gói đã bị mất, điều này làm sự thiếu hụt bộ đệm tại set-top-box, gây lên hiện tượng dừng hình.
Khi truyền video bằng giao thức UDP, hiện tượng mất gói có thể làm hỏng một phần hay thậm chí hoàn toàn các frame.
2.5.4 Nghẽn tại máy chủ
Không hẳn mọi yếu tố ảnh hưởng đến chất lượng video đều gây ra bởi mạng, nếu máy chủ cung cấp dịch vụ VoD phải phục vụ tối đa số người dùng theo khả năng của nó, điều này sẽ gây ra sự tắc nghẽn tại máy chủ cung cấp dịch vụ. Sự tắc nghẽn này gây ra hiện tượng dừng hình quá lâu tại phía đầu cuối. Để giảm tải cho máy chủ dịch vụ có thể dùng các giao thức phù hợp như UDP Multicast. Nhưng giao thức này chỉ phù hợp khi có một số lượng lớn người dùng xem cùng một nội dung tại cùng một thời điểm.
2.5.5 Jitter và Timing drift
Jitter là khái niệm dung để mô tả sự khác nhau của khoảng thời gian đi từ nguồn đến đích của các gói tin. Jitter càng lớn khi xảy ra nghẽn mạng hay tắc nghẽn tại máy chủ dịch vụ. Jitter có thể gây ra tràn bộ đệm tại set-top-box, gây lên hiện tượng dừng hình tại đầu cuối. Hiện tượng Timing drift xảy ra khi đồng hồ tại đầu gửi và đầu nhận có sự sai khác nhau về tốc độ, gây ra sự tràn vùng đệm tại đầu nhận. Để hạn chế sự ảnh hưởng của hiện tượng này, yêu cầu phía đầu nhận phải hiệu chỉnh lại tốc độ của đồng hồ cho phù hợp để tránh hiện tượng tràn bộ đệm.
Chương IV : Kiến trúc IPTV
I. Tổng quan về mô hình truyền thông IPTV
Mô hình truyền thông trong IPTV có 7 lớp (và một lớp tùy chọn) được xếp chồng lên nhau. Các dữ liệu video ở phía thiết bị gửi được truyền từ lớp cao xuống lớp thấp trong mô hình IPTV, và được truyền đi trong mạng băng rộng bằng các giao thức của lớp vật lí. Ở thiết bị nhận, dữ liệu nhận được chuyển từ lớp thấp nhất đến lớp trên cùng trong mô hình IPTV.
Hình 4.1 Mô hình truyền thông IPTV
Do đó, nếu 1 bộ mã hóa gửi chương trình video đến 1 thiết bị IPTV của khách hàng, thì phải chuyển qua các lớp trong mô hình IPTV ở cả phía thiết bị nhận và thiết bị gửi. Mỗi lớp trong mô hình IPTV độc lập với nhau và có chức năng riêng. Khi chức năng này được thực hiện, dữ liệu video được chuyển đến lớp tiếp theo trong mô hình IPTV. Mỗi lớp sẽ thêm vào hoặc bỏ đi phần thông tin điều khiển của các gói video trong q
Các file đính kèm theo tài liệu này:
- Cong_nghe_IPTV.doc
- Hinh_1__to_9.doc