Đề tài Tổng quan về iptv

Xét trên khía cạnh công nghệ, xu hướng công nghệ hiện nay là sự hội tụ của nhiều công nghệ để đưa ra những loại hình dịch vụ tổng hợp (như kết hợp các dịch vụ thoại, số liệu và băng rộng) cho khách hàng, đồng thời tận dụng được những cơ sở hạ tầng sẵn có để giảm thiểu chi phí đầu tư nâng cấp. Dịch vụ IPTV chính là một sản phẩm của sự hội tụ đó khi mà chỉ với một thiết bị đầu cuối khách hàng có thể sử dụng khoảng 6-7 loại hình dịch vụ con (truyền hình quảng bá, truyền hình theo yêu cầu, điện thoại thông thường, điện thoại IP, điện thoại truyền hình, truy cập Internet, v.v.). Hơn nữa việc áp dụng công nghệ để triển khai những dịch vụ với các chi phí nhỏ, tối ưu hoá hạ tầng viễn thông sẵn có sẽ tăng sức cạnh tranh khi mà Việt Nam đã gia nhập WTO.

Đồng thời có thể khẳng định với hạ tầng mạng truy nhập hữu tuyến và vô tuyến băng rộng trên cơ sở mạng NGN hiện đại mà các nhà khai thác cung cấp dịch vụ của Việt Nam đã và đang hướng tới xây dựng thì việc triển khai dịch vụ IPTV là hợp lý và khả năng bảo đảm đáp ứng yêu cầu triển khai dịch vụ này là hoàn toàn khả thi.

41 trang | Chia sẻ: lethao | Lượt xem: 2458 | Lượt tải: 1

Bạn đang xem trước 20 trang tài liệu Đề tài Tổng quan về iptv, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

rí của Y và các thành phần Cb và Cr. Lưu ý rằng cứ 4 giá trị Y lại có 2 giá trị kết hợp một của Cb và một của Cr (Vị trí của giá trị Cb và Cr là tương đương). -Slide: Dãy các Macroblock, thứ tự của các Macroblock bên trong Slide được xác định từ trái qua phải, trên xuống dưới. Slide rất quan trọng trong việc định lỗi. Nếu dòng dữ liệu (Bitstream) có chứa lỗi, bộ giải mã có thể bỏ qua và tiếp tục ở Slide kế tiếp. Nhiều Slide trên dòng dữ liệu cho phép che dấu lỗi tốt hơn và được dùng để cải thiện chất lượng hình ảnh. -Macroblock: 16 pixel trong 16 hàng của thành phần Y tương ứng với 8 pixel trong 8 hàng của thành phần Cb và Cr. Trong hình cho thấy không gian của thành phần Y và Cb, Cr. Một Macroblock chứa 4 Y Block với 1 Cb Block và 1 Cr Block như trong hình với các con số ứng với thứ tự của Block trong dòng dữ liệu. -Block: là tập hợp 8 pixel trong 8 hàng các giá trị của thành phần Y hoặc Cb, Cr. Chuẩn Mpeg cũng định nghĩa cấu trúc phân cấp dữ liệu được chấp nhận, giải mã và xuất ra Audio số. Dữ liệu Mpeg Audio cũng như Mpeg Video gồm hàng loạt các gói (Packet). Mỗi gói chứa Audio Packet Header và dãy các Audio Frame. Mỗi Audio Packet Header chứa các thông tin sau: +Packet Start Code: xác định gói là Audio Parket. +Packet Length: xác định lượng thông tin trong Audio Packet. Hình 2.4. Audio Packet trong MPEG. Mỗi Audio Frame chứa các thông tin: +Audio Frame Header: chứa đồng bộ, ID, độ nén thông tin (Bit rate), thông tin về tần số lấy mẫu. +Error Checking Code: chứa thông tin cho việc kiểm tra lỗi. +Audio Data: chứa thông tin. +Ancillary Data (dữ liệu phụ thuộc): chứa dữ liệu do người dùng xác định. Nén Mpeg là sự kết hợp hài hoà của bốn kỹ thuật cơ bản: Tiền xử lý (Preprocessing), đoán trước sự chuyển động của các khung hình (Picture) ở bộ mã hoá (Temporal Prediction), bù chuyển động ở bộ giải mã (Motion Compensation) và mã lượng tử hoá (Quatization Coding). Các bộ lọc tiền xử lý sẽ lọc ra những thông tin không cần thiết từ tín hiệu Video và những thông tin khó mã hoá nhưng không quan trọng cho sự cảm thụ của mắt người. Kỹ thuật đoán chuyển động dựa trên nguyên tắc là các khung hình trong một cảnh Video (Video Sequence) dường như có liên quan mật thiết với nhau theo thời gian: Mỗi khung hình tại một thời điểm nhất định sẽ có nhiều khả năng giống với các khung hình đứng ngay phía trước và ngay phía sau nó. Các bộ mã hoá sẽ tiến hành quét lần lượt từng phần nhỏ trong mỗi khung hình gọi là Macroblock, sau đó nó sẽ phát hiện Macroblock nào không thay đổi từ khung hình này tới khung hình khác. Bộ mã hoá sẽ tiên đoán trước sự xuất hiện của các Macroblock khi biết vị trí và hướng chuyển động của nó. Do đó chỉ những sự thay đổi giữa các Macroblock trong khung hình hiện tại và các Macroblock được tiên đoán mới được truyền tới bên phía thu. Phía bên thu tức bộ giải mã đã lưu trữ sẵn những thông tin mà không thay đổi từ khung hình này tới khung hình khác trong bộ nhớ đệm của nó và chúng được dùng để điền thêm một cách đều đặn vào các vị trí trống trong ảnh được khôi phục. Nén tín hiệu Video được thực hiện nhờ việc loại bỏ cả sự dư thừa về không gian (Spatial Coding) và thời gian (Temporal Coding). Trong Mpeg, việc loại bỏ dư thừa về thời gian (nén liên khung hình) được thực hiện trước hết nhờ sử dụng các tính chất giống nhau giữa các khung hình liên tiếp (Inter-Picture). Chúng ta có thể sử dụng tính chất này để tạo ra các khung hình mới nhờ vào những thông tin từ những khung hình đã gửi trước nó. Do vậy ở phía bộ mã hoá, chỉ cần gửi những khung hình có thay đổi so với những khung hình trước trước, sau đó dùng phương pháp nén về không gian (Spatial Coding) để loại bỏ sự dư thừa về không gian trong chính khung hình sai khác này. Nén về không gian dựa trên nguyên tắc là phát hiện sự giống nhau của các điểm ảnh (pixel) lân cận nhau (Intra-Picture). Mã hóa MPEG-II: MPEG-2 là một tiêu chuẩn mã hóa nén(thường được gọi tắt là chuẩn nén) trong bộ tiêu chuẩn MPEG dùng để mã hóa luồng dữ liệu hình có kết hợp với các thông tin về âm thanh. Đây là một phương thức mã hóa dữ liệu có tổn hao cho phép lưu trữ và truyền phim ảnh trên nền hệ thống và băng thông hiện thời. Mpeg-2 được mở rộng dựa trên chuẩn Mpeg để hỗ trợ việc nén dữ liệu để truyền Video số chất lượng cao. Để hiểu được tại sao nén Video là rất quan trọng, ta cần tìm hiểu băng thông (Bandwidth) cần thiết để truyền các khung hình Video số không nén. PAL (Phase Alternate Line) là chuẩn để truyền tín hiệu TV tuần tự (Analog) được sử dụng ở khá nhiều nước trên thế giới. Khung hình TV dùng PAL không nén đòi hỏi băng thông rất lớn tới 216 Mbps, lớn hơn rất nhiều khả năng của truyền sóng radio. Một số nước dùng hệ thống Analog TV là NTSC. Hệ thống này cung cấp các thông tin về màu sắc kém trung thực hơn với tỉ lệ truyền các khung khác nhau. Tín hiệu NTSC không nén đòi hỏi dung lượng đường truyền thấp hơn không đáng kể ở mức 168 Mbps. TV độ phân giải cao HDTV (High Definition TV) yêu cầu băng thông tối thiểu là 1 Gbps. Mpeg-2 cung cấp cách nén các tín hiệu Video số thành các mức có thể quản lý được. Khả năng nén Video của Mpeg-2 liệt kê theo bảng sau: Hình 2.5. Bảng so sánh đòi hỏi băng thông của các chuẩn MPEG. Do chuẩn Mpeg-2 cung cấp khả năng nén rất cao bằng cách dùng các thuật toán tiêu chuẩn, nó trở thành chuẩn cho TV số với các đặc tính: +Nén Video tương thích với Mpeg-1. +Chế độ Full-screen kết hợp với cải tiến chất lượng Video (cho TV và màn hình PC). +Cải tiến mã hoá Audio (chất lượng cao, mono, stereo...). +Truyền phối hợp nhiều thành phần. +Các dịch vụ khác. Các hệ thống sử dụng Mpeg-2 đang rất phát triển như: TV số, VoD, Digital Versatile Disc (DVD)... Thuật toán nén Video Mpeg-2 đạt được khả năng nén cao nhờ lợi dụng sự dư thừa in thông tin Video. Mpeg-2 loại bỏ cả dư thừa về không gian và dư thừa về thời gian trong các cảnh Video. Dư thừa thời gian xuất hiện khi các khung Video liên tiếp hiển thị hình ảnh của những hình ảnh giống nhau. Nó chứa các hình ảnh gần như không đổi hoặc thay đối rất nhỏ giữa các khung hình liên tiếp. Dư thừa không gian xảy ra khi một phần của ảnh được tái tạo lại (với thay đổi không đáng kể) trong một khung Video. Dữ liệu từ các Macroblock cần được mã hoá sẽ được đưa đến cả bộ trừ (Subtractor) và bộ đoán chuyển động (Motion Estimator). Bộ đoán chuyển động sẽ so sánh các Macroblock mới được đưa vào này với các Macroblock đã được đưa vào trước đó và được lưu lại dùng để tham khảo. Kết quả là bộ đoán chuyển động sẽ tìm ra các Macroblock trong khung hình tham khảo gần giống nhất với Macroblock mới này. Bộ đoán chuyển động sau đó sẽ tính toán Vector chuyển động (Motion Vector), Vector này sẽ đặc trưng cho sự dịch chuyển theo cả hai chiều dọc và ngang của Macroblcok mới cần mã hoá so với khung hình tham khảo. Lưu ý rằng Vector chuyển động có độ phân giải bằng một nửa do thực hiện quét xen kẽ. Hình 2.6. Dự đoán chuyển động. Bộ đoán chuyển động cũng đồng thời gửi các Macroblock tham khảo được gọi là các Macroblock tiên đoán (Predicted Macroblock) tới bộ trừ để trừ với Macroblock mới cần mã hoá. Từ đó ta sẽ được các sai số tiên đoán (Error Prediction) hoặc tín hiệu dư, chúng sẽ đặc trưng cho sự sai khác giữa Macroblock cần tiên đoán và Macroblock thực tế cần mã hoá. Tín hiệu dư hay sai số tiên đoán này sẽ được biến đổi DCT, các hệ số nhận được sau biến đổi DCT sẽ được lượng tử hoá để làm giảm số lượng các bits cần truyền. Các hệ số này sẽ được đưa tới bộ mã hoá Huffman, tại đây số bits đặc trưng cho các hệ số tiếp tục được làm giảm đi một cách đáng kể. Dữ liệu từ đầu ra của mã hoá Huffman sẽ được kết hợp với Vector chuyển động và các thông tin khác (thông tin về I, P, B-picture) để gửi tới bộ giải mã. Đối với trường hợp P-picture, các hệ số DCT cũng được đưa đến bộ giải mã nội bộ (nằm ngay trong bộ mã hoá). Tín hiệu dư hay sai số tiên đoán được biến đổi ngược lại dùng phép biến đổi IDCT và được cộng thêm vào khung hình đứng trước để tạo nên khung hình tham khảo (tiên đoán). Vì dữ liệu khung hình trong bộ mã hoá được giải mã luôn nhờ vào bộ giải mã nội bộ ngay chính bên trong bộ mã hoá, do đó có thể thực hiện thay đổi thứ tự các khung hình và dùng các phương pháp tiên đoán ở trên. Quá trình khôi phục lại khung hình tại bộ giải mã là hoàn toàn ngược lại. Từ luồng dữ liệu nhận được ở đầu vào, Vector chuyển động được tách ra và đưa vào bộ bù chuyển động (Motion Compensator), các hệ số DCT được đưa vào bộ biến đổi ngược IDCT để biến tín hiệu từ miền tần số thành tín hiệu ở miền không gian. Đối với P-picture và B-picture, Vector chuyển động sẽ được kết hợp với các Macroblock tiên đoán để tạo thành các khung hình tham khảo. Không cần thiết phải luôn nén mọi khung hình Video cùng một mức độ, một phần của Clip có thể có độ dư thừa không gian thấp (ví dụ các hình ảnh phức tạp) trong khi đó các phần khác của Clip lại có độ dư thừa thời gian thấp (ví dụ các cảnh chuyển động nhanh). Vì thế dữ liệu Video đương nhiên sẽ ở các tỉ lệ nén (Bit rate) thay đổi trong khi việc truyền dữ liệu thường yêu cầu tốc độ cố định. Chìa khoá để điều khiển tốc độ truyền là trật tự dữ liệu đã nén trong bộ đệm (Buffer).Việc nén có thể được tiến hành với việc loại bỏ một vài thông tin đã được lựa chọn. Ảnh hưởng nhỏ nhất đối với chất lượng toàn bộ khung hình có thể đạt được bằng cách bỏ bớt các thông tin chi tiết. Điều này đảm bảo giới hạn tỉ lệ nén dữ liệu trong khi chất lượng của khung hình suy giảm tối thiểu. Hình 2.7. Cơ chế nén MPEG II. Mpeg-2 bao gồm cơ chế nén trong một phạm vi rộng. Một bộ mã hoá với cơ chế nén phải phù hợp với một hoặc đoạn cảnh riêng biệt. Nói chung bộ mã hoá rất phức tạp, nó phải lựa chọn được cơ chế nén thích hợp nhất bởi vậy tăng chất lượng khung hình đối với tỉ lệ nén dữ liệu truyền. Bộ giải mã Mpeg-2 cũng có nhiều kiểu, khả năng đa dạng và các lựa chọn khi kết nối. Số lượng các Level và Profile được định nghĩa cho việc nén Video Mpeg-2. Hệ thống Mpeg-2 được phát triển trên một tập nào đó các Level và Profile: +Profile: chất lượng của Video. +Level: độ phân giải của Video. Hệ thống cơ bản với tên MP@ML (Man Profile Man Level) nén dữ liệu Video từ 1-15 Mbps. Các Level khác nhau như: High Level, High Level 1440, Low Level và các Profile như: Simple, SNR, Spatial, 4:2:2 & High. Các bộ giải mã điển hình: + 720 x 576 x 25 fps (PAL CCIR 601). + 352 x 576 x 25 fps (PAL Half-D1). + 720 x 480 x 30 fps (NTSC CCIR 601). + 352 x 480 x 30 fps (NTSC Half-D1). Hầu hết các bộ giải mã đều hỗ trợ Mpeg-1: + 352 x 288 x 25 fps (PAL SIF). + 352 x 240 x 30 fps (NTSC SIF). Chuẩn Mpeg-2 định nghĩa một sự phối hợp mã hoá Audio. Audio số có thể được mã hoá trong các dạng mã hoá khác nhau ở các tỉ lệ nén khác nhau.Mpeg-2 cũng cung cấp các hỗ trợ cho việc truyền dữ liệu. Mpeg-2 phân biệt hai kiểu dữ liệu: + Service Information: thông tin về Video, Audio và Data truyền bởi Mpeg-2. + Private Data: thông tin người sử dụng hoặc thiết bị thu. Chuẩn mã hóa MPEG-IV: MPEG-4 là 1 tiêu chuẩn nén âm thanh/ hình ảnh được thiết lập bởi tổ chức Moving Picture Experts Group gọi tắt là MPEG. Chuẩn này gồm nhiều tiêu chuẩn nhỏ, gọi là các phần của MPEG-4. Các phần đáng chú ý là: +Part 2: codec cho dữ liệu trực quan(hình ảnh, ảnh động,…) Có tên thường gọi là MPEG-4 ASP. Điển hình như DivX, Xvid... +Part 3: codec âm thanh AAC. Điển hình: Nero AAC, CT AAC(winamp xài cái này), Real AAC,.. +Part 10: 1 codec hình khác. Tên thường dùng là MPEG-4 AVC. Cài đặt: Nero Avc, MainConcept, Elecard, x264(miễn phí) +Part 12: container để chứa hình/tiếng, .mp4. Nếu 1 file mpeg-4 chuẩn ISO thì container phải là mp4, âm thanh là AAC, hình thì mpeg-4 ASP hoặc là mpeg-4 AVC. Hiện nay, có rất nhiều phần mềm có thể chuyển đổi các định dạng khác sang mp4. Thực sự, các phần mềm này thường xuất ra file AVI, video thì xài DivX, âm thanh thì thường là mp3. AVI không phải là container chính thức của chuẩn MPEG-4. AVI : - Không hỗ trợ VFR (variable frame rate, tốc độ hình thay đổi), - Không thể chứa âm thanh AAC( nhất nhì thời nay). - Nó cũng không hỗ trợ MP3 VBR. Có 1 số phần mềm đã hack và có thể nhét được: VirtualDubMod, Mencoder. Nhưng đáng tiếc là không có nhiều phần mềm nghe nhạc hỗ trợ dạng AVI như vậy. Vậy sao thị trường vẫn dùng AVI nhiều? Vì nó thâm niên. Mp4 mới ra đời nên chưa được phổ biến mà AVI được phát triển và hỗ trợ bởi Microsoft. Các bản AAC: +Nero AAC: miễn phí, hỗ trợ ABR, VBR,... âm thanh 5.1 +CT AAC: coding technology AAC, hỗ trợ 5.1 nhưng không có VBR. Được dùng trong winamp, miễn phí. +Real AAC: cũng miễn phí đã hỗ trợ VBR và 5.1 Các bản MPEG4- AVC: +x264: miễn phí. +Vorbis: cũng miễn phí. GUI để encode âm thanh: +Belight: GUI của Besweet. +BeHappy: mở file bằng DirectShow. GUI để encode video: +Xvid, x264: Megui. Tiêu chuẩn mã hóa MPEG-4 part 10 (H.264): H.264 là chuẩn nén mở được công bố chính thức vào năm 2003, hiện là chuẩn hỗ trợ công nghệ nén tiên tiến và hiệu quả nhất hiện nay. Và nó đang dần được đưa vào thành chuẩn nén tiêu chuẩn của ngành công nghệ an ninh giám sát bằng hình ảnh. H.264 (còn được gọi là chuẩn MPEG-4 Part 10/AVC for Advanced Video Coding hay MPEG-4 AVC) nó kế thừa những ưu điểm nổi trội của những chuẩn nén trước đây. Đồng thời sử dụng những thuật toán nén và phương thức truyền hình ảnh mới phức tạp, phương pháp nén và truyền hình ảnh mà chuẩn H.264 sử dụng đã làm giảm đáng kể dữ liệu và băng thông truyền đi của video. Với cách nén và truyền thông tin bằng chuẩn H.264 làm giảm đến 50% băng thông và kích thước file dữ liệu lưu trữ so với cách nén thông thường hiện nay (chuẩn nén thông thường hiện nay đang được sử dụng rộng rãi là MPEG-4 Part 2) và giảm tới hơn 80% băng thông và kích thước file dữ liệu lưu trữ so với nén bằng chuẩn Motion JPEG. Điều đó cho chúng ta thấy với cùng một hệ thống nếu chúng ta sử dụng chuẩn nén mới chúng ta có thời gian lưu trữ gấp đôi và băng thông mạng giảm đi một nửa, lợi ích mà chúng ta thấy ngay đó là chi phí cho lưu trữ dữ liệu video giảm một nửa so với dùng hệ thống có chuẩn nén thông thường. Ngoài ra việc truyền hình ảnh chiếm băng thông giảm một nửa, vì vậy chi phí dành cho thuê băng thông mạng cũng giảm đáng kể. Hoặc chúng ta có thể tăng chất lượng hình ảnh giám sát lên gấp đôi nhưng vẫn đảm bảo được băng thông và thời gian lưu trữ như trước đây. Đây là một lợi thế rất lớn, bởi với một hệ thống an ninh lớn, giải quyết vấn đề băng thông mạng và thời gian lưu trữ là rất phức tạp. Với chuẩn nén H.264 nó đã giải quyết được rất nhiều những khó khăn như vậy. Với việc giảm được băng thông của chuẩn nén H.264 đã thúc đẩy cho dòng camera độ nét cao (hay còn gọi Camera Megapixel) có cơ hội phát triển mạnh mẽ. Với những hệ thống giám sát quan trọng cần hình ảnh rõ nét thì lựa chọn các camera độ nét cao và đầu ghi hỗ trợ chuẩn nén H.264 là hoàn toàn hợp lý. Chuẩn nén H.264 được kỳ vọng là cơn gió mới, tạo thêm sinh khí để thúc đẩy sự phát triển của ngành an ninh giám sát phát triển mạnh mẽ hơn. Giới thiệu chung: Kể từ khi mới xuất hiện vào đầu những năm 90, chuẩn nén video MPEG-2 đã hoàn toàn thống lĩnh thế giới truyền thông. Cũng trong thập kỷ này, chuẩn nén MPEG-2 đã được cải tiến về nhiều mặt. Giờ đây nó có tốc độ bit thấp hơn và việc ứng dụng nó được mở rộng hơn nhờ có các kỹ thuật như đoán chuyển động, tiền xử lý, xử lý đối ngẫu và phân bổ tốc độ bit tùy theo tình huống thông qua ghép kênh thống kê. Tuy nhiên, chuẩn nén MPEG-2 cũng không thể được phát triển một cách vô hạn định. Thực tế hiện nay cho thấy chuẩn nén này đã đạt đến hết giới hạn ứng dụng của mình trong lĩnh vực truyền truyền hình từ sản xuất tiền kỳ đến hậu kỳ và lưu trữ Video số. Bên cạnh đó, nhu cầu nén Video lại đang ngày một tăng cao kèm theo sự phát triển mạnh mẽ của mạng IP mà tiêu biểu là mạng Internet. Khối lượng nội dung mà các công ty truyền thông cũng như các nhà cung cấp dịch vụ thông tin có thể mang lại ngày càng lớn, ngoài ra họ còn có thể cung cấp nhiều dịch vụ theo yêu cầu thông qua hệ thống cáp, vệ tinh và các hạ tầng viễn thông đặt biệt là mạng Internet. Các tiêu chuẩn mã hoá Video ra đời và phát triển với mục tiêu cung cấp các phương tiện cần thiết để tạo ra sự thống nhất giữa các hệ thống được thiết kế bởi những nhà sản xuất khác nhau đối với mọi loại ứng dụng Video; Nhờ vậy thị trường Video có điều kiện tăng trưởng mạnh. Chính vì lý do này nên những người sử dụng bộ giải mã cần có một chuẩn nén mới để đi tiếp chặng đường mà MPEG-2 đã bỏ dở. Hiệp hội viễn thông quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế/ Uỷ ban kỹ thuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoá Video. Theo ITU-T, các tiêu chuẩn mã hoá Video được coi là các khuyến nghị gọi tắt là chuẩn H.26x (H.261, H.262, H.263 và H.264). Với tiêu chuẩn ISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 và MPEG-4). Những khuyến nghị của ITU được thiết kế dành cho các ứng dụng truyền thông Video thời gian thực như Video Conferencing hay điện thoại truyền hình. Mặt khác, những tiêu chuẩn MPEG được thiết kế hướng tới mục tiêu lưu trữ Video chẳng hạn như trên đĩa quang DVD, quảng bá Video số trên mạng cáp, đường truyền số DSL, truyền hình vệ tinh hay những ứng dụng truyền dòng Video trên mạng Internet hoặc thông qua mạng không dây (wireless). Với đối tượng để truyền dẫn Video là mạng Internet thì ứng cử viên hàng đầu là chuẩn nén MPEG-4 AVC, còn được gọi là H.264, MPEG-4 part 10, H.26L hoặc JVT. Tính kế thừa của H.264: Mục tiêu chính của chuẩn nén H.264 đang phát triển nhằm cung cấp Video có chất lượng tốt hơn nhiều so với những chuẩn nén Video trước đây. Điều này có thể đạt được nhờ sự kế thừa các lợi điểm của các chuẩn nén Video trước đây. Không chỉ thế, chuẩn nén H.264 còn kế thừa phần lớn lợi điểm của các tiêu chuẩn trước đó là H.263 và MPEG-4 bao gồm 4 đặc điểm chính như sau: • Phân chia mỗi hình ảnh thành các Block (bao gồm nhiều điểm ảnh), do vậy quá trình xử lý từng ảnh có thể được tiếp cận tới mức Block. • Khai thác triệt để sự dư thừa về mặt không gian tồn tại giữa các hình ảnh liên tiếp bởi một vài mã của những Block gốc thông qua dự đoán về không gian, phép biến đổi, quá trình lượng tử và mã hoá Entropy (hay mã có độ dài thay đổi VLC). • Khai thác sự phụ thuộc tạm thời của các Block của các hình ảnh liên tiếp bởi vậy chỉ cần mã hoá những chi tiết thay đổi giữa các ảnh liên tiếp. Việc này được thực hiện thông qua dự đoán và bù chuyển động. Với bất kỳ Block nào cũng có thể được thực hiện từ một hoặc vài ảnh mã hoá trước đó hay ảnh được mã hoá sau đó để quyết định véc tơ chuyển động, các véc tơ này được sử dụng trong bộ mã hoá và giải mã để dự đoán các loại Block. • Khai thác tất cả sự dư thừa về không gian còn lại trong ảnh bằng việc mã các block dư thừa. Ví dụ như sự khác biệt giữa block gốc và Block dự đoán sẽ được mã hoá thông qua quá trình biến đổi, lượng tử hoá và mã hoá Entropy. Cơ chế nén hình ảnh của H.264: Với chuẩn nén H264, mỗi hình ảnh được phân chia thành nhiều Block, mỗi block tương ứng với một số lượng nhất định các MacroBlock. Ví dụ một hình ảnh có độ phân giải QCIF (tương đương với số lượng điểm ảnh 176x144) sẽ được chia thành 99 MacroBlock với kích cỡ 16x16. Một sự phân đoạn các MacroBlock tương tự được sử dụng các kích cỡ ảnh khác. Thành phần chói của ảnh được lấy mẫu tương ứng với độ phân giải của ảnh đó, trong khi đó thành phần màu CR và CB được lấy mẫu với tần số thấp hơn theo 2 chiều ngang và dọc. Thêm vào đó mỗi hình ảnh có thể được phân thành số nguyên lần các lát mỏng (slice), việc này rất có giá trị cho việc tái đồng bộ trong trường hợp lỗi dữ liệu. Mỗi hình ảnh thu được được xem như một ảnh I. Ảnh I là ảnh được mã hoá bởi việc áp dụng trực tiếp các phép biến đổi lên các MacroBlock khác nhau trong ảnh. Các ảnh I được mã hoá sẽ có kích cỡ lớn bởi nó được xây dựng từ một khối lượng lớn thông tin của bản thân ảnh hiện tại mà không sử dụng bất cứ thông tin nào từ miền thời gian trong quá trình xử lý mã hoá để tăng hiệu quả xử lý mã hoá bên trong trong H.264. +Giảm bớt độ dư thừa: Cũng giống như các bộ lập giải mã khác, H.264 nén video bằng cách giảm bớt độ dư thừa cả về không gian và thời gian trong hình ảnh. Những dư thừa về mặt thời gian là những hình ảnh giống nhau lặp đi lặp lại từ khung (frame) này sang khung khác, ví dụ như phần phông nền không chuyển động của một chương trình đối thoại trên truyền hình. Dư thừa về không gian là những chi tiết giống nhau xuất hiện trong cùng một khung, ví dụ như nhiều điểm ảnh giống nhau tạo thành một bầu trời xanh. Hình 1 biểu diễn một cách sơ lược các bước mà bộ lập giải mã MPEG-4 phải tiến hành để nén không gian và thời gian. +Chọn chế độ, phân chia và chế ngự: Bộ lập giải mã bắt đầu bằng việc quyết định loại khung cần nén tại một thời điểm nhất định và chọn chế độ mã hoá phù hợp. Chế độ "trong khối" tạo ra ảnh "I", trong khi chế độ "giữa khối" tạo ra khung "P" hoặc "B". Sau đó, bộ mã hoá sẽ chia ảnh thành hàng trăm hàng và cột các điểm ảnh của ảnh video số chưa nén thành các khối nhỏ hơn, mỗi khối có chứa một vài hàng và cột điểm ảnh. +Nén theo miền thời gian: Khi bộ mã hoá đang hoạt động ở chế độ "giữa khối" (inter), khối này sẽ phải qua công đoạn hiệu chỉnh chuyển động. Quá trình này sẽ phát hiện ra bất kỳ chuyển động nào diễn ra giữa khối đó và một khối tương ứng ở một hoặc hơn một ảnh tham chiếu đã được lưu trữ từ trước, sau đó tạo ra một khối "chênh lệch" hoặc "lỗi". Thao tác này sẽ giảm bớt dữ liệu trong mỗi block một cách hiệu quả do chỉ phải trình bày chuyển động của nó mà thôi. Tiếp đến là công đoạn biến đổi côsin rời rạc (DCT) để bắt đầu nén theo miền không gian. Khi bộ mã hoá hoạt động ở chế độ "trong khối" (intra), khối này sẽ bỏ qua công đoạn hiệu chỉnh chuyển động và tới thẳng công đoạn DCT. Hình 2.8.Sơ đồ khối mã hoá MPEG, đường đứt nét đặc trưng cho phần bổ sung của MPEG-4 AVC trong việc nén theo miền không gian. +Nén theo miền không gian: Các khối thường có chứa các điểm ảnh tương tự hoặc thậm chí giống hệt nhau. Trong nhiều trường hợp, các điểm ảnh thường không thay đổi mấy (nếu có). Như vậy có nghĩa là tần số thay đổi giá trị điểm ảnh trong khối này là rất thấp. Những khối như thế được gọi là khối có tần số không gian thấp. Bộ lập mã lợi dụng đặc điểm này bằng cách chuyển đổi các giá trị điểm ảnh của khối thành các thông tin tần số trong công đoạn biến đổi cosin rời rạc. * Biến đổi cosin rời rạc: Công đoạn DCT biến đổi các giá trị điểm ảnh của khối thành một ma trận gồm các hệ số tần số ngang, dọc đặt trong không gian tần số. Khi khối ban đầu có tần số không gian thấp, DCT sẽ tập hợp phần lớn năng lượng tần số vào góc tần số thấp của mạng. Nhờ vậy, những hệ số tần số thấp ở góc đó sẽ có giá trị cao hơn. Một số lượng lớn các hệ số khác còn lại trên ma trận đều là các hệ số có tần số cao, năng lượng thấp và có giá trị thấp. Hệ số DC và một vài hệ số tần số thấp sẽ hàm chứa phần lớn thông tin được mô tả trong khối ban đầu. Điều này có nghĩa là bộ lập mã có thể loại bỏ phần lớn hệ số tần số cao còn lại mà không làm giảm đáng kể chất lượng hình ảnh của khối. Bộ lập mã chuẩn bị các hệ số cho công đoạn này bằng cách quét chéo mạng lưới theo đường zig-zag, bắt đầu từ hệ số DC và qua vị trí của các hệ số ngang dọc tăng dần. Do vậy nó tạo ra được một chuỗi hệ số được sắp xếp theo tần số. * Lượng tử hoá và mã hoá entropy: Tại đây thao tác nén không gian mới thực sự diễn ra. Dựa trên một hệ số tỷ lệ (có thể điều chỉnh bởi bộ mã hoá), bộ lượng tử hoá sẽ cân đối tất cả các giá trị hệ số. Do phần lớn hệ số đi ra từ DCT đều mang năng lượng cao nhưng giá trị thấp nên bộ lượng tử hoá sẽ làm tròn chúng thành 0. Kết quả là một chuỗi các giá trị hệ số đã được lượng tử hoá bắt đầu bằng một số giá trị cao ở đầu chuỗi, theo sau là một hàng dài các hệ số đã được lượng tử hoá về 0. Bộ lập mã entropy có thể theo dõi số lượng các giá trị 0 liên tiếp trong một chuỗi mà không cần mã hoá chúng, nhờ vậy giảm bớt được khối lượng dữ liệu trong mỗi chuỗi. Các ưu điểm nổi bật của chuẩn nén H.264: + Ưu điểm của nén không gian: Chuẩn nén MPEG-4 AVC có hai cải tiến mới trong lĩnh vực nén không gian. Trước hết, bộ lập mã này có thể tiến hành nén không gian tại các macroblock 16x16 điểm ảnh thay vì các block 8x8 như trước đây. Điều này giúp tăng cường đáng kể khả năng nén không gian đối với các hình ảnh có chứa nhiều khoảng lớn các điểm ảnh giống nhau. Thứ hai là thao tác nén được tiến hành trong miền không gian trước khi công đoạn DCT diễn ra. Chuẩn nén MPEG-4 AVC so sánh macroblock hiện thời với các macroblock kế bên trong cùng một khung, tính toán độ chênh lệch, và sau đó sẽ chỉ gửi đoạn chênh lệch tới DCT. Hoặc là nó có thể chia nhỏ macroblock 16x16 điểm ảnh thành các khối 4x4 nhỏ hơn và so sánh từng khối này với các khối kế bên trong cùng một macroblock. Điều này giúp cải thiện khả năng nén ảnh chi tiết. + Ưu điểm của nén thời gian: Điểm cải tiến lớn nhất ở MPEG-4 AVC là chế độ mã hoá giữa. Những phương pháp tiên tiến ở chế độ này khiến cho nén thời gian đạt đến một cấp độ cao hơn nhiều, cùng với chất lượng chuyển động tốt hơn so với các chuẩn MPEG trước đây. + Kích cỡ khối: Ở chế độ giữa khối, MPEG-2 chỉ hỗ trợ các macroblock 16x16 điểm ảnh, không đủ độ phân giải để mã ho

Các file đính kèm theo tài liệu này:

Tổng Quan Về IPTV.doc