Video dù thuộc dạng RGB hay YUV đều có dạng số. Trong trường hợp này, các
mẫu rời rạc của tín hiệu video tương tự được sốhóa tạo ra chuỗi các từmã biểu diễn các
điểm ảnh. Các từmã này được phân thành ba trường biểu diễn cho từng tín hiệu một của
RGB hay YUV. Phạm vi của các chiều dài là 16 bit hoặc 24 bit. Với 24 bit thì trong đó R
= G = B = 8 bit; còn với 16 bit thì Y = 8 bit và U = V = 4 bit.
Video sốcó nhiều ưu điểm so với Video tương tự, cụthểnhưsau:
• Lưu trữvideo trên các thiết bịsốhoặc trong bộnhớ, sẵn sàng để được xửlý (loại
bỏnhiễu, cắt và dán, ) và tích hợp vào nhiều các ứng dụng đa phương tiện khác nhau.
• Truy cập trực tiếp, và làm cho biên tập video trởnên đơn giản.
• Lặp đi lặp lại việc xửlý hình mà không làm giảm chất lượng hình ảnh.
• Dễdàng mật mã hóa.
41 trang |
Chia sẻ: maiphuongdc | Lượt xem: 3034 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Giáo trình Xử lý âm thanh và hình ảnh - Kỹ thuật xử lý ảnh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
8-bit mầu (3.14).
Hình 3.14: Hình ảnh 8-bit màu
3.1.5.5. Các định dạng file ảnh phổ biến
Định dạng GIF (Graphics Interchange Format): được đưa ra bởi Công ty Unisys và
Compuserve, ban đầu để truyền các hình ảnh đồ họa trên đường dây điện thoại thông qua
Modem. Các tiêu chuẩn GIF sử dụng thuật toán nén Lempel-Ziv-Welch và được giới hạn
cho 256 màu (8 bit). Trong thực tế, GIF có hai chuẩn: GIF87a (Phiên bản kỹ thuật ban
đầu) và GIF89a – Phiên bản mở rộng hỗ trợ cho hoạt hình đơn giản.
Định dạng JPEG: Các tiêu chuẩn hiện hành quan trọng nhất cho nén hình ảnh là JPEG,
tiêu chuẩn này được tạo ra bởi một nhóm làm việc của Tổ chức tiêu chuẩn quốc tế (ISO)
đã được chính thức gọi là Joint Photographic Experts Group và do đó các file ảnh được
tạo ra theo chuẩn nén JPEG có tên định dạng jpeg. JPEG cho phép người dùng thiết lập
một mức độ mong muốn về chất lượng, hoặc tỉ lệ nén.
Định dạng PNG (Portable Network Graphics): Xuất phát từ sự phổ biến của Internet
nhằm hỗ trợ nhiều hơn cho các định dạng hình ảnh hệ thống độc lập. Tiêu chuẩn PNG có
thể thay thế các tiêu chuẩn GIF và hỗ trợ lên đến 48 bit thông tin màu sắc.
Định dạng TIFF (Tagged Image File Format): là một tập tin định dạng phổ biến hình
ảnh. Phát triển bởi Công ty Aldus vào những năm 1980, sau đó nó đã được hỗ trợ bởi
Microsoft. TIFF có thể lưu trữ nhiều loại khác nhau của hình ảnh: 1-bit, màu xám, 8-bit,
24-bit RGB.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
56
Định dạng EXIF (Exchange Image File): là một định dạng hình ảnh cho máy ảnh kỹ
thuật số. Ban đầu phát triển vào năm 1995, phiên bản hiện tại của nó (2.2) đã được đưa
ra vào năm 2002 bởi các hãng điện tử Nhật Bản và Informa - Hiệp hội Công nghiệp Công
nghệ (JEITA). Nén các tập tin EXIF sử dụng chuẩn nén JPEG.
Định dạng Windows WMF (Windows Metafile): là định dạng file gốc cho môi trường hệ
điều hành Microsoft Windows. Tệp tin WMF thực sự bao gồm một tập hợp các hàm giao
diện thiết bị đồ họa (GDI), cũng có nguồn gốc ở các môi trường Windows. Khi chơi
(play) một tập tin WMF (thông thường bằng cách sử dụng hàm Windows PlayMetaFile())
các đồ họa mô tả được trả lại.
Định dạng Windows BMP (Bitmap): là tiêu chuẩn hệ thống định dạng tập tin đồ họa lớn
cho Microsoft Windows, được sử dụng trong Microsoft Paint và chương trình khác. Nó
có thể lưu trữ ảnh 24-bit bitmap khá hiệu quả. Tuy nhiên lưu ý BMP có có rất nhiều chế
độ khác nhau, bao gồm cả không nén hình ảnh 24-bit.
3.1.6. Mầu sắc trong ảnh và video
Ánh sáng là một dạng sóng điện từ và màu sắc của nó được đặc trưng bởi các
bước sóng. Ánh sáng Laser chỉ có một bước sóng đơn - ví dụ, Laser Ruby tạo ra một
chùm tia sáng màu đỏ tươi. Ngược lại, phần lớn các nguồn ánh sáng có nhiều bước sóng.
Con người không thể phát hiện tất cả các ánh sáng – mà chỉ có các anh sáng có bước
sóng thuộc vùng nhìn thấy được. Bước sóng ngắn tạo ra một cảm giác màu xanh, và
bước sóng dài tạo ra một cảm giác màu đỏ.
Ánh sáng nhìn thấy được là một dạng sóng điện từ có bước sóng trong khoảng
400-700 nm. Hình 3.15 minh họa cho thấy mối quan hệ về công suất tương đối của từng
bước sóng có trong thành phần của ánh sáng ban ngày. Đường cong này được gọi là phân
bố năng lượng quang phổ (SPD), hoặc quang phổ của ánh sáng E (λ ) tại mỗi bước sóng
λ.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
57
Hình 3.15: Phân bố năng lượng quang phổ của ánh sáng ban ngày.
3.1.6.1. Các mô hình màu trong ảnh
Các lý thuyết về mầu sắc chỉ ra rằng bất kỳ một màu nào đều có thể được tổng hợp
từ ba màu chính, cơ bản có cường độ tương thích đó là ba màu: Đỏ (Red); Xanh lá cây
(Green) và Xanh lơ (Blue). Thông tin về ba mầu cơ bản được minh họa ở hình 3.16 dưới
đây. Ngược lại bất kỳ màu sắc nào cũng đều có thể phân chia thành ba mầu cơ bản R, G
và B.
Hình 3.16: Các mầu cơ bản
Mô hình cộng màu RGB
Mô hình cộng mầu RGB được mô tả ở hình vẽ 3.17. Theo đó chúng ta có một số
nguyên tắc cộng màu như sau:
Magenta = Red + Blue
Cyan = Blue + Green
Yellow = Green + Red
White = Red + Blue + Green
Mầu
Đỏ (R)
Xanh lơ (B)
Xanh lá cây (G)
615
470
532
Bước sóng, 10-9 m
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
58
Hình 3.17: Mô hình cộng màu RGB
Mô hình màu loại trừ CMY
Mô hình loại trừ màu CMY (C: Cyan-Màu lục lam; M: Magenta-Màu đỏ tươi; Y:
Yellow-Màu vàng) được mô tả ở hình vẽ 3.18. Theo đó chúng ta có một số nguyên tắc
trừ màu như sau:
Magenta = White - Green
Cyan = White - Red
Yellow = White - Blue
Black = Red + Blue + Green
Hình 3.17: Mô hình trừ màu CMY
Chuyển đổi từ RGB thành CMY
Một số hệ tọa độ mầu quan trọng có thể được chuyển đổi sang nhau thông qua một
số phép biến đổi đơn giản. Ví dụ như chuyển đổi từ RGB thành CMY, người ta sử dụng
quan hệ:
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
59
(3.1)
Ngược lại khi chuyển từ CMY thành RGB, người ta sử dụng quan hệ:
(3.2)1)
3.1.6.2. Các mô hình màu trong Video
Các ảnh, trước khi được truyền đi, phải được quét với 3 thiết bị quang, mà mỗi
một trong số chúng đều có một bộ lọc màu khác nhau đặt ở phía trước của thiết bị. Ba
kênh (R, G, B) được hiệu chỉnh sao cho nếu một vùng trắng đều được quét, thì cả 3 đầu
ra phải có điện áp cân bằng nhau.
Bởi vì mắt người có độ nhạy khác nhau đối với các màu có cùng cường độ, nên độ
chói phải được bổ sung thêm các trọng số. Độ chói của tín hiệu Y được xác định bởi:
Y= 0.299R+0.587G+0.114B (3.3)
Thông tin về bão hoà màu cũng đã được xác định cùng với độ chói; để tránh việc
truyền nhiều lần về bão hòa màu, nó sẽ bị loại trừ ra khỏi các thành phần của màu. Các
thành phần hiệu màu cần một băng tần truyền thấp hơn so với thông tin độ chói, bởi vì
mắt người không thể phân tích được nhiều chi tiết màu như chi tiết độ chói.
Do một sắc màu được xác định nếu hai trong số ba màu cơ bản được biết, cho nên
người ta chỉ cần truyền đi thông tin của 2 tín hiệu hiệu màu. Màu cơ bản thứ 3 sẽ được
tính toán lại tại phía thu. Từ đây, người ta đưa ra một số mô hình màu khác nhau trong
truyền dẫn tín hiệu video.
Mô hình màu YUV
Ban đầu, mô hình YUV được sử dụng cho tín hiệu video tương tự hệ PAL. Một
phiên bản của YUV hiện nay cũng được sử dụng trong tiêu chuẩn CCIR 601 cho video
kỹ thuật số.
Đầu tiên, nó mã hóa tín hiệu độ chói Y theo biểu thức (4.3) và tiếp theo đó các tín
hiệu hiệu mầu U, V được xác định theo biểu thức 4.4 dưới đây.
(3.4)
Từ các biểu thức (4.3) và (4.4) ta có:
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
60
(3.5)
Trong các tín hiệu PAL tương tự, băng thông 1,3 MHz được giành cho các tín
hiệu hiệu mầu U và V, trong khi đó băng tần 5,5 MHz được dành riêng cho các tín hiệu
độ chói Y. Với tín hiệu video số, 8 bit được giành cho Y và 4 bit cho các tín hiệu U, V.
Mô hình màu YIQ
YIQ được dùng trong truyền hình màu hệ NTSC. Mặc dù U và V được định nghĩa
khá đơn giản, nhưng nó không nắm bắt được hệ thống phân cấp bậc thấp nhất về độ nhạy
hiển thị của con người. NTSC đã sử dụng I và Q thay thế. YIQ được xem như là một
phiên bản của YUV, với cùng một Y nhưng với U và V được quay đi góc 33 °.
(3.6)
Điều này dẫn đến các ma trận biến đổi sau đây:
(3.7)
NTSC cấp phát băng thông 4,2 MHz cho tín hiệu độ chói Y; 1,5 MHz cho tín hiệu
hiệu màu I và 0,6 MHz cho tín hiệu Q. Tuy nhiên, hiện nay cả I và Q đều được cấp phát
băng thông 1,0 MHz.
Mô hình màu YCbCr
Chuẩn quốc tế chính thức cho các tín hiệu video số thành phần là Khuyến nghị
ITU-R BT.601-4 (được gọi là "Rec. 601"). Tiêu chuẩn này dùng một không gian màu
YCbCr. Biến đổi YCbCr được sử dụng trong nén ảnh JPEG và nén video MPEG và có
liên quan đến biến đổi YUV. Cụ thể như sau:
(3.8)
Khi đó, chúng ta có:
(3.9)
3.1.7. Cơ bản về Video
Tín hiệu Video nói chung được sử dụng trong rất nhiều lĩnh vực: truyền hình,
truyền hình quảng bá, truyền hình vệ tinh, truyền hình di động… Với công nghệ phát
triển ngày nay thì tín hiệu Video được sử dụng rộng rãi đặc biệt là Video số.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
61
3.1.7.1. Các loại tín hiệu Video
Các tín hiệu Video có thể được tổ chức theo ba cách khác nhau: Video thành phần
(Component Video); Video tổ hợp (Composite Video) và S-Video.
Video thành phần: Các hệ thống Video đầu cuối cao cấp như các phòng thu hình
(studios) sử dụng ba tín hiệu Video riêng rẽ cho các ảnh màu đỏ, xanh lá cây và xanh lơ.
Các tín hiệu này được biết đến như là các tín hiệu Video thành phần. Ở những hệ thống
phòng thu này người ta sử dụng ba dây (connector) kết nối Camera hoặc các thiết bị khác
đến TV hay màn hình.
Video thành phần cho tái tạo màu sắc tốt nhất vì không có xuyên nhiễu giữa ba
kênh tín hiệu khác nhau, tuy nhiên nó đòi hỏi nhiều băng thông hơn và đồng bộ tốt hơn
cho cả ba tín hiệu thành phần.
Video tổ hợp: Các tín hiệu mầu và độ chói được trộn vào trong một sóng mang đơn. Tín
hiệu mầu là tổ hợp của hai thành phần hiệu mầu I và Q (hoặc U và V). Tín hiệu Viedo tổ
hợp được sử dụng trong truyền hình mầu quảng bá, thích ứng với truyền hình đen – trắng.
Trong hệ truyền hình NTSC, I và Q được kết hợp thành một tín hiệu mầu, và một
sóng mang sẽ đặt tín hiệu mầu vào cuối tần số cao hơn của kênh chia sẻ với tín hiệu độ
chói. Sau đó, các thành phần độ chói và màu được tách ra tại đầu cuối máy thu và hai
thành phần màu sắc được khôi phục tiếp theo đó.
Khi đấu nối với TV hoặc VCR, Video tổ hợp chỉ sử dụng 1 dây (Hình 3.18) và các
tín hiệu mầu video được trộn với nhau, không gửi riêng biệt. Các tín hiệu đồng bộ và
tiếng cũng được đưa vào chung với tín hiệu này. Vì tín hiệu mầu và độ chói được đưa vào
cùng một tín hiệu, nên nhiễu giữa chúng là không thể tránh khỏi.
Hình 3.18: Cáp Video tổ hợp
S-Video: Xem như là sự thỏa hiệp giữa Video thành phần và Video tổ hợp S-Video
(Separated Video hoặc Supper Video) sử dụng 2 dây, một cho độ chói và một cho tín
hiệu mầu. Kết quả là, có ít xuyên nhiễu giữa các thông tin về màu sắc và mức độ xám.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
62
Hình 3.18: Cáp S-Video
3.1.7.2. Video tương tự
Phần lớn các TV hiện nay vẫn gửi và nhận tín hiệu Video tương tự. Một tín hiệu
tương tự f(t) lấy mẫu một ảnh biến đổi theo thời gian. Một quá trình quét tuần tự (lũy
tiến) từng dòng một từ trên xuống dưới theo hết một ảnh (một khung) trong một khoảng
thời gian nào đó được gọi là chu kỳ (tốc độ) quét - ∆ t s/ảnh . Màn hình máy tính có độ
phân giải cao thường có chu kỳ (tốc độ) quét ∆ t = 1/72 sec.
Trong TV cũng như trong nhiều chuẩn đa phương tiện khác, quét xen kẽ được sử
dụng mà ở đó các dòng lẻ được quét đầu tiên và sau đó đến các dòng chẵn. Kết quả là các
mành "chẵn" và "lẻ" tạo nên một khung hình.
Trong thực tế, các dòng lẻ được quét bắt đầu ở trên cùng bên trái mành, các dòng
chẵn được bắt đầu quét ở giữa mành. Hình 3.19 minh họa biểu đồ quét. Trước tiên đường
liền nét (lẻ) được quét từ P đến Q, sau đó R đến S, và kết thúc tại T - sau đó các mành
chẵn bắt đầu từ U và kết thúc ở V. Sự nhảy từ Q đến R trong hình 3.19 được gọi là quét
ngược ngang. Sự nhảy từ T đến U hoặc V tới P được gọi là quét ngược đứng.
Hình 3.19: Quét mành xen kẽ
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
63
Cần phải lưu ý rằng nếu yêu cầu video có độ phân giải (cả không gian và thời
gian) cao, ví dụ như truyền hình độ nét cao HDTV thì cần phải sử dụng chế độ quét liên
tục. Mặc dụ các video được quét theo kiểu xen rẽ cũng đã là một lựa chọn tốt cho tín hiệu
truyền hình, song nó không thích hợp cho việc hiển thị trên màn hình máy tính với đặc
điểm là khoảng cách giữa màn hình và người dùng là nhỏ. Nếu như các hình ảnh trên TV
được sử dụng cho máy tính sẽ gây cảm giác khó chịu bởi độ rung giữa các dòng, cuộn
dòng… Để tránh các hiện tượng này, các máy tính sử dụng các màn hình có chế độ hiển
thị liên tục với tốc độ lớn hơn 50/60 khung/s, thông thường là 72 khung/s.
Hình 3.20 minh họa một tín hiệu điện tử cho một dòng quét video tổ hợp theo
chuẩn NTSC. Tín hiệu “mức trắng-White” có giá trị đỉnh 0,714 V; tín hiệu “mức đen-
Black” là 0,055 V; tín hiệu “xóa-Blank” là 0 V. Khoảng thời gian cho các xung xóa trong
tín hiệu cũng được sử dụng cho việc đồng bộ với giá trị tín hiệu đồng bộ (Sync) xấp xỉ -
0,286V.
Hình 3.20: Tín hiệu điện cho một dòng quét NTSC
Chuẩn NTSC (National Television System Committee)
Chuẩn TV NTSC (Uỷ ban Tiêu chuẩn Truyền hình quốc gia) được sử dụng phổ biến ở
Bắc Mỹ và Nhật Bản từ năm 1953. NTSC áp dụng tỷ lệ ảnh 4:3; 525 dòng quét/60Hz cho
một khung (Quét xen kẽ, 262.5 dòng / mành) và tốc độ khung là 30 khung hình/sec; mô
hình màu là YIQ. NTSC cấp phát băng thông 4,2 MHz cho độ chói Y; 1.6 MHz cho I và
0,6 MHz cho Q do mắt người ít nhạy cảm hơn đối với các chi tiết về mầu sắc so với độ
chói. Ưu điểm chính của hệ thống chuẩn này này là: đơn giản, thiết bị mã hóa và giải mã
không phức tạp, giá thành thấp khi xây dựng hệ thống thiết bị. Tuy nhiên dễ bị sai màu
khi hệ thống truyền tín hiệu không lý tưởng và có nhiễu.
Chuẩn PAL (Phase Alteration Line)
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
64
Chuẩn PAL được phát triển từ năm 1962 ở Đức. PAL dùng tỷ lệ ảnh 4:3; 625 dòng
quét/50Hz (Quét xen kẽ,312.5 dòng/mành), 25 khung hình/giây; mô hình màu YUV với
băng thông cho Y là 5.5 MHz và U, V là 1,8MHz. Chuẩn hệ PAL có méo pha nhỏ hơn
hẳn so với hệ NTSC, không có hiện tượng xuyên lẫn màu, thuận tiện cho việc ghi băng
hình hơn hệ NTSC, nhưng máy thu hình hệ PAL phức tạp hơn, tính kết hợp với hệ truyền
hình đen trắng kém hơn hệ NTSC
Chuẩn SECAM (Sequentiel Couleurs a Memoire – Sequential Color with Memory)
SECAM được triển từ năm 1956 ở Pháp. SECAM cũng sử dụng 625 dòng quét/50Hz cho
mỗi khung hình, 25 khung hình / giây, với tỉ lệ 4:3 và quét mành xen kẽ. SECAM cũng
sử dụng mô hình màu YUV với băng thông 6MHz cho Y và 2MHz cho U và V. Chuẩn
hệ SECAM có tính chống nhiễu tương đối cao; kém nhạy với méo pha, méo biên độ.
3.1.7.3. Video số
Video dù thuộc dạng RGB hay YUV đều có dạng số. Trong trường hợp này, các
mẫu rời rạc của tín hiệu video tương tự được số hóa tạo ra chuỗi các từ mã biểu diễn các
điểm ảnh. Các từ mã này được phân thành ba trường biểu diễn cho từng tín hiệu một của
RGB hay YUV. Phạm vi của các chiều dài là 16 bit hoặc 24 bit. Với 24 bit thì trong đó R
= G = B = 8 bit; còn với 16 bit thì Y = 8 bit và U = V = 4 bit.
Video số có nhiều ưu điểm so với Video tương tự, cụ thể như sau:
• Lưu trữ video trên các thiết bị số hoặc trong bộ nhớ, sẵn sàng để được xử lý (loại
bỏ nhiễu, cắt và dán, …) và tích hợp vào nhiều các ứng dụng đa phương tiện khác
nhau.
• Truy cập trực tiếp, và làm cho biên tập video trở nên đơn giản.
• Lặp đi lặp lại việc xử lý hình mà không làm giảm chất lượng hình ảnh.
• Dễ dàng mật mã hóa.
Các chuẩn CCIR cho Video số
CCIR là Uỷ ban tư vấn quốc tế về Radio và một trong các tiêu chuẩn quan trọng
nhất cho Video số là CCIR-601 cho tín hiệu Video số thành phần. Chuẩn này đã trở thành
chuẩn ITU-R-601, một tiêu chuẩn quốc tế cho các ứng dụng video chuyên nghiệp.
Chuẩn NTSC có 525 dòng quét; mỗi một dòng có 858 điểm ảnh (với 720 điểm ảnh
nhìn thấy và số còn lại không nhìn thấy trong chu kỳ xóa). Do NTSC dùng mô hình lấy
mẫu 4:2:2, mỗi điểm ảnh tương ứng với hai bytes (8 bit cho Y và 8 bit thay đổi giữa Cb
và Cr) nên tốc độ bit dữ liệu Video số xấp xỉ 216 Mbps
(525×858×30×2bytes×8bits/byte≈216Mbps).
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
65
Bảng 3.2 dưới đây mô tả các tham số đặc trưng của Video số theo các chuẩn khác
nhau. Lưu ý các chuẩn đều áp dụng tỷ lệ ảnh 4:3.
Bảng 3.2: Thông số video số
3.2. Cơ sở kỹ thuật xử lý ảnh
3.2.1. Cơ sở của cảm nhận thị giác
Việc xử lý hình ảnh trong các ứng dụng có mục chính là để giúp đỡ con người
quan sát thông tin trong một hình ảnh. Vì vậy, điều quan trọng là phải hiểu được hệ thống
thị giác của con người. Hệ thống thị giác của con người tập trung chủ yếu vào mắt (cảm
biến hình ảnh hay camera), thần kinh thị giác (đường dẫn hình ảnh), và não (các khối
thông tin xử lý về ảnh…). Cấu tạo của mắt người được minh họa ở hình 3.21 dưới đây.
Hình 3.21: Cấu tạo của mắt người
Mắt người có cấu trúc gần dạng hình cầu với đường kính trung bình khoảng
20mm. Mắt người gồm có các thành phần chủ yếu sau:
Giác mạc: Là phần trước lồi trong suốt của lớp xơ phía ngoài con ngươi mà bao bọc
mống mắt và đồng tử.
Màng cứng: Bọc ở phía ngoài có sợi trắng cứng bao trùm tất cả con ngươi trừ giác mạc.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
66
Mô mạc: Choàng lấy mạch máu nâu tối của mắt giữa màng cứng và võng mạc bao gồm
các màng máu cung cấp dinh dưỡng cho mắt.
Mống mắt: Mống mắt mở rộng hoặc thu gọn nhằm điều khiển lượng ánh sáng chiều vào
mắt.
Thấu kính: Được tạo ra từ những lớp đồng tâm của những tế bào có sợi, chứa 60-70%
lượng nước.
Võng mạc: Mảnh dẻ, nhiều lớp, màng nhạy cảm và được nối bởi thần kinh thị giác tới
não. Là nơi nhạy cảm với ánh sáng và mầu sắc.
Mắt hoạt động như một camera, với thấu kính tập trung hình ảnh vào võng mạc. Võng
mạc có chứa các tế bào hình que (rods) và ba loại tế bào hình nón (cones) theo như hình
dáng của chúng. Các tế bào hình que (có khoảng 75-150 triệu) được phân bố xung quanh
hoàng điểm (điểm vàng), rất nhậy cảm về ánh sáng nhưng không cảm thụ màu sắc. Các
tế bào hình nón (có khoảng 6,5 triệu) được tập trung tại hoàng điểm, kém nhậy cảm với
ánh sáng, nhưng cảm thụ và phân biệt được màu sắc tương ứng với ba loại tế bào hình
nón nhậy cảm với 3 mầu khác nhau: Đỏ, Xanh lá cây và Xanh lơ.
Mắt người nhạy cảm nhất với ánh sáng ở vùng giữa của phổ nhìn thấy được. Giống
như thuộc tính phân bố năng lượng quang phổ (SPD) của một nguồn ánh sáng, như trong
hình 3.15, chúng ta thấy độ nhạy tương đối là hàm của bước sóng. Hình 3.22 minh họa
hàm độ nhạy của mắt người V(λ ) (đường đứt nét) và là tổng của các đường cong đáp
ứng phổ của các mầu đỏ, xanh lá cây, và xanh lam. Theo đó, mắt người không nhạy cảm
đồng đều với các màu sắc có bước sóng khác nhau và nhạy cảm nhất vùng xanh lá cây-
vàng (λ ≈ 555nm).
Gọi qR(λ),qG(λ) và qB(λ) là các hàm độ nhạy phổ của các màu cơ bản R, G, và B,
khi đó chúng ta có hàm vector q(λ), với các thành phần:
(3.10))
Các phản ứng trong từng kênh màu trong mắt người tỷ lệ với số lượng tế bào thần
kinh liên quan. Đối với các kênh màu đỏ, bất kỳ ánh sáng nào rơi xuống bất cứ nơi nào ở
phần khác không của hàm độ nhạy của tế bào hình nón - nhạy cảm với màu đỏ trong hình
3.22 sẽ tạo ra một số phản ứng.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
67
Hình 3.22: Đáp ứng phổ (độ nhạy) của mắt người
Đáp ứng tổng hợp của kênh màu đỏ là tổng tất cả ánh sáng rơi vào võng mạc nơi
có các tế bào hình nón nhạy cảm với màu đỏ đang cảm nhận. Nếu chúng ta xem các hàm
độ nhạy là liên tục, thì các màu sắc cơ bản có thể được xác định bởi biểu thức (3.11).
(3.11)
Vì tín hiệu hình ảnh được truyền đi có ba thành phần mầu cơ bản nên các mầu sắc
hình thành một không gian vector ba chiều.
Biểu thức (3.11) ở trên thực tế chỉ áp dụng khi chúng ta xem một đối tượng tự phát
sáng (nghĩa là một nguồn ánh sáng). Trong phần lớn các trường hợp, chúng ta nhìn thấy
hình ảnh của một vật thể là do ánh sáng phản xạ từ bề mặt của vật thể đó đến mắt chúng
ta. Các bề mặt phản xạ các lượng ánh sáng khác nhau ở các bước sóng khác nhau, bề mặt
sẫm thì phản xạ năng lượng ít hơn các bề mặt sáng. Hàm phản xạ được ký hiệu là S(λ).
Tình huống hình thành hình ảnh được mô tả như sau. Ánh sáng từ nguồn sáng với
phân bố năng lượng quang phổ (SPD) - E(λ ) đến bề mặt của vật thể, có hàm phản xạ phổ
bề mặt S(λ) và sau đó được lọc bởi các hàm độ nhạy phổ tương ứng với các tế bào hình
nón q(λ) – Hình 3.23. Hàm C(λ) được gọi là tín hiệu màu sắc và tich của E(λ ) và S(λ).
Các biểu thức hình thành màu sắc tương tự như biểu thức (3.12) mà có tính đến các
mô hình hình thành hình ảnh là:
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
68
(3.12)1)
Hình 3.23: Mô hình hình thành hình ảnh
3.2.2. Quá trình thu tín hiệu hình ảnh
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua camera là
ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng có
loại camera đã số hoá (như loại CCD – Change Coupled Device) là loại photodiode tạo
cường độ sáng tại mỗi điểm ảnh.
Camera thường dùng là loại quét dòng; ảnh tạo ra có dạng hai chiều. Chất lượng
một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong
cảnh). Trên thực tế các thiết bị thu nhận ảnh có thể là: máy quay (Cameras) cộng với bộ
chuyển đổi tương tự số; máy quét (Scaners) chuyên dụng và các bộ cảm biến ảnh
(Sensors).
Thu nhận ảnh sử dụng bộ cảm biến đơn
Hình vẽ 3.24 dưới đây mô tả các thành phần của một bộ cảm biến đơn. Bộ cảm
biến phổ biến nhất của loại này là photodiode, được cấu thành từ các vật liệu silicon có
dạng sóng điện áp đầu ra tỷ lệ với ánh sáng đầu vào. Việc sử dụng bộ lọc ở mặt trước của
bộ cảm biến để nâng cao tính chọn lọc. Ví dụ một bộ lọc mầu xanh lá cây ở phía trước bộ
cảm biến ánh sáng sẽ thiên vị hơn cho ánh sáng trong băng mầu xanh lá cây của phổ mầu.
Kết quả là, đầu ra của bộ cảm biến sẽ cho ra ảnh có ánh sáng mầu xanh mạnh hơn các
thành phần mầu khác trong phổ ánh sáng nhìn thấy được.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
69
Hình 3.24: Bộ cảm biến ảnh đơn
Thu nhận ảnh sử dụng các dải cảm biến
Dải cảm biến bao gồm nhiều cảm biến được sắp xếp theo một hàng như mô tả ở
hình vẽ 3.25.
Hình 3.25: Dải cảm biến
Dải cảm biến thường được dùng để tạo ra các phần tử ảnh theo một hướng nào đó.
Chuyển động theo hướng vuông góc với dải cảm biến sẽ tạo ra ảnh theo một hướng khác
như được thấy ở hình 3.26 (a). Các dải cảm biến thường được dùng cho các ứng dụng xử
lý ảnh bằng máy bay mà ở đó hệ thống xử lý ảnh được gắn trên máy bay và bay ở đô cao
nhất định với vận tốc không đổi trên bề mặt của một vùng địa lý nào đó cần được chụp
ảnh.
Các dải cảm biến cũng có cấu hình vòng sử dụng trong y học và công nghiệp để
tạo ra các ảnh cắt lớp cho các vật thể 3 chiều – hình 3.26 (b).
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
70
Hình 3.26: Thu nhận ảnh sử dụng dải cảm biến tuyến tính (a) và dải cảm biến vòng (b)
Thu nhận ảnh sử dụng mảng cảm biến
Hình 3.27 mô tả các bộ cảm biến được sắp xếp lại để hình thành nên một mảng
cảm biến hai chiều. Các thiết bị cảm biến siêu âm, điện từ trường…thường được sắp xếp
theo dạng mảng như thế này. Kiểu sắp xếp theo mảng cũng hay gặp trong các camera số
(loại CCD).
Hình 3.27: Mảng cảm biến
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
71
Ưu điểm chính của mảng cảm biến là có thể thu nhận được ngay toàn bộ ảnh hoàn
chỉnh của vật thể thông qua việc tập trung nguồn năng lượng sáng trên bề mặt của mảng
cảm biến.
Cách thức mà một mảng cảm biến được sử dụng để thu nhận ảnh được mô tả chi
tiết trong hình 3.28. Ở đây, ánh sáng mà đối tượng phản xạ ra từ một nguồn sáng chiếu
vào nó được thu nhận bởi mảng cảm biến để hình thành nên ảnh của đối tượng và sau đó
ảnh được chuyển hóa thành ảnh số cho các xử lý tiếp theo.
Hình 3.28: Ví dụ minh họa về quá trình thu nhận ảnh số
3.2.3. Lấy mẫu và lượng tử hóa
Môi trường xung quanh chúng ta tồn tại ở một mức độ quan sát hợp lý trong một
thể liên tục về không gian/thời gian. Tương tự như vậy, các tín hiệu và hình ảnh có rất
nhiều trong môi trường (trước khi được cảm nhận) là những đối tượng tương tự tự nhiên.
Nói là tương tự nghĩa là: các tín hiệu tồn tại trong miền (không gian/thời gian) là liên tục
và cũng có thể nhận các giá trị liên tục. Tuy nhiên, khi nói về việc xử lý các tín hiệu
video và hình ảnh số, tức là khi các tín hiệu video hoặc hình ảnh số được cảm nhận,
chúng phải được chuyển sang dạng số mà máy vi tính có thể đọc được. Nói là kỹ thuật số
chúng tôi muốn chỉ hai điều: tín hiệu được xác định trên miền (không gian/thời gian) rời
rạc, và nó nhận các giá trị từ một tập các khả năng rời rạc. Trước khi việc xử lý số có thể
bắt đầu, quá trình chuyển đổi từ tương tự sang số (Biến đổi A/D) phải được thực hiện.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh
72
Biến đổi A/D bao gồm hai tiến trình riêng biệt: lấy mẫu và lượng tử hóa. Quá trình biến
đổi tín hiệu và ảnh từ tương tự sang số được minh họa ở hình 3.29 dưới đây.
Hình 3.29: Quá trình chuyển đổi tín hiệu và ảnh từ tương tự sang số
3.2.3.1. Lấy mẫu và lượng tử hóa tín hiệu ảnh
Tín hiệu hình ảnh nhận được từ cảm biến quang điện thường có dạng tương tự, ví
dụ tín hiệu điện áp có biên độ thay đổi liên tục theo độ chói của ảnh nguồn. Để có thể đưa
tín hiệu hình ảnh vào xử lý bằng máy tính cần thực hiện quá trình số hóa thông qua hai
giai đọa
Các file đính kèm theo tài liệu này:
- chuong3_phan1_200610_revised_8912.pdf
- chuong3_phan2_200610_revised_1438.pdf