Mục lục
lời nói đầu.3
chương 1. Tổng quan về nhận dạng ảnh mặt người .5
1.1 Bài toán nhận dạng ảnh mặt người .5
1.1.1 Bài toán và các yêu cầu nhận dạng.5
1.1.2 Giải quyết bài toán từ quan điểmcủa lý thuyết nhận dạng.8
1.2 giải quyết vấn đề trong bài toán nhận dạng ảnh mặt người .9
1.2.1 Thu nhận dữ liệu.10
1.2.2 Biểu diễn đối tượng.12
1.2.3 Lập luận kết quả.14
1.3 hệ thống kỹ thuật nhận dạng ảnh mặt người .14
1.3.1 Qui trình công nghệ xử lý thông tin .15
1.3.2 Các vấn đề trong triển khai thực tế .16
1.3.3 Các ứng dụng điển hình.17
chương 2. nhận dạng ảnh mặt người trong điều kiện ánh sáng thay đổi .19
2.1 Phân tích các yếu tố ảnh hưởng đến quá trình nhận dạng .19
2.1.1 ánh sáng.19
2.1.2 Các thay đổi hình học.19
2.1.3 Sai số do hệ thống.20
2.2 Các kỹ thuật giải quyết .20
2.2.1 Đưa các thông tin về điều kiện môi trường vào mô tả đối tượng.20
2.2.2 Cách giải quyết dựa trên kỹ thuật khoảng cách tiếp xúc.24
2.2.3 Kết hợp các cách biểu diễn đối tượng khác nhau.26
Chương 3. thuật toán nhận dạng trong điều kiện ánh sáng
thay đổi .32
3.1 Thuật toán so sánhkhuôn mẫu dựa theo khoảng cách tiếp xúc.32
3.2 Thuật toán so sánh điểm đặc trưng dựa theo khoảng cách tiếp xúc .35
3.3 Kết hợp hai thuật toán so sánhtrên .37
Kết luận .39
Tài liệu tham khảo.40
41 trang |
Chia sẻ: maiphuongdc | Lượt xem: 1808 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Luận văn Nhận dạng ảnh mặt người trong điều kiện ánh sáng thay đổi, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ặt, sử dụng khoảng cách hình học và góc giữa các đặc điểm chính của bề mặt nh− là: hai
mắt, mũi, mồm và nhằm mục đích phân loại các mặt trong đó các phần tử dựa trên mối
quan hệ vị trí và các kích cỡ của chúng. Với cách tiếp cận dựa trên khuôn mẫu sử dụng
thông tin xác đáng của điểm ảnh nh− là mức độ xám gốc hoặc xử lý các khía cạnh nổi bật
của dữ liệu. Khuôn mẫu có thể là toàn bộ ảnh hoặc là các vùng t−ơng ứng với các vị trí của
đặc điểm (vị trí của hai mắt hoặc mồm). Nói chung với cách tiếp cận này chỉ cho ta đ−ợc
một số đặc điểm của đối t−ợng, nó không đủ để có thể ứng dụng trong thực tế nh−ng đối
với sự hiệu chỉnh hình học hoặc bộ lọc thì có thể cải tiến đ−ợc các kết quả này.
Cách tiếp cận phân tích các thành phần chính: cách tiếp cận này có thể trích ra đ−ợc
thông tin quan trọng nhất đ−ợc trình bày bằng cách thống kê đối với một tập các ảnh nh−
là một tập các vector riêng. Các vector riêng có thể đ−ợc đánh giá nh− là tập các điểm đặc
tr−ng chung và định rõ đ−ợc các đặc điểm thay đổi của ảnh trong cơ sở dữ liệu. Mỗi ảnh
đ−ợc biểu diễn một cách chính xác qua một sự liên kết tuyến tính của những vector riêng
này. Để quyết định kích th−ớc của không gian mặt chúng ta dựa vào số các vector riêng.
Kỹ thuật này phân tích các đặc điểm của ảnh, thu thập các thông tin quan trọng và loại bỏ
đ−ợc các thông tin d− thừa không cần thiết cho hệ thống nhận dạng. Do đó nó có thể tìm
đ−ợc sự biểu diễn tối −u kích th−ớc của ảnh nh−ng kỹ thuật này có thể hữu ích đối với việc
xây dựng lại cấu trúc ảnh hơn là đối với việc nhận dạng. Hơn nữa, ph−ơng thức mặt riêng
(vector riêng) là không bất biến với sự thay đổi hình học của ảnh nh− là sự co giãn, dịch
chuyển hoặc phép quay trong dữ liệu gốc.
Cách tiếp cận tiêp theo là sử dụng bộ lọc: hệ thống cho ảnh đi qua bộ lọc và qua bộ
Bộ lọc
* *
* * *
* *
Hình 1.4 Mô phỏng bộ lọc để lấy đ−ợc các điểm đặc tr−ng
14
lọc đó các thông tin đặc tr−ng quan trọng sẽ đ−ợc thu lại và làm giảm không gian l−u trữ
ảnh. Kết quả là ta thu đ−ợc các thông tin quan trọng của ảnh. Có thể mô tả nh− hình 1.4
trên đây.
Hình trên cho thấy khi cho qua bộ lọc các thông tin d− thừa sẽ bị loại bỏ chỉ để lại
các thông tin quan trọng tạo nên ảnh mặt.
Nói tóm lại: các cách tiếp cận trên nhằm mục đích phân loại đ−ợc các điểm đặc
tr−ng và biểu diễn chúng sau đó thực hiện việc tối −u các thông tin đó sao cho kích th−ớc
không gian l−u trữ điểm đặc tr−ng là nhỏ nhất.
1.2.4 Lập luận kết quả
Hệ thống so sánh hai ảnh với nhau sao cho có hiệu quả nhất, sụ phù hợp của hai ảnh
đ−ợc tính bằng cách nh−: sử dụng cách tiếp khoảng cách tiếp xúc và sử dụng các ng−ỡng
để đánh giá.
Trong không gian mặt hệ thống so sánh khoảng cách từ một mặt cần tìm đến một
tập hợp các mặt, kết quả là ta thu đ−ợc tập các số đo. Nếu một trong tập các số đo thỏa
mãn yêu cầu về khoảng cách nhận dạng thì đó chính là mặt mà chúng ta cần tìm. Các
khoảng cách chuẩn đ−ợc sử dụng: khoảng cách Euclidean hoặc khoảng cách Mahalanobits
(đối với không gian vector riêng).
Bên cạnh việc sử dụng các khoảng cách để đánh giá sự phù hợp của hai ảnh, chúng
ta còn có thể sử dụng các ng−ỡng để đánh giá mức độ chính xác của một số cách tiếp cận
khác. Tỷ số nhận dạng sai của các cách tiếp cận khác nhau không thể v−ợt quá một ng−ỡng
nào đó. Nếu v−ợt quá thì kết luận hai mặt đó không phù hợp còn ng−ợc lai thì hai mặt là
phù hợp và ta tiến hành đánh giá nhận dạng chúng.
1.3 hệ thống kỹ thuật nhận dạng ảnh mặt ng−ời
Nhận dạng ảnh mặt đã đ−ợc nghiên cứu trong nhiều năm và đang đ−ợc ứng dụng
trong thực tế nh− là: các hệ thống bảo mật, sự xác định tội phạm và hỗ trợ các hệ thống
nhận dạng giọng nói. Nhận dạng mặt rất quan trọng đối với con ng−ời bởi vì bề mặt đóng
một vai trò lớn trong giao tiếp với cộng đồng, các biểu hiện của tình cảm, cảm xúc, suy
nghĩ và cảm nghĩ.
Hệ thống nhận dạng ảnh mặt tự động có thể đ−ợc chia thành các phần nh−: quy
trình công nghệ xử lý thông tin, các vấn đề triển khai trong thực tế và các ứng dụng điển
hình.
15
1.3.1 Qui trình công nghệ xử lý thông tin
Quy trình thiết kế một hệ thống nhận dạng ảnh mặt tự động là một quá trình xử lý
đa giai đoạn. Những giai đoạn này về cơ bản là các b−ớc giống nhau. Các giai đoạn có thể
đ−ợc mô tả nh− sau:
B−ớc 1: Giai đoạn cảm biến
Các nghiên cứu đ−ợc đ−a ra để xác định tác nhân đem lại các thuộc tính của đối
t−ợng (cỡ, hình dáng, màu sắc, kết cấu, …). Các giá trị và các mối quan hệ giữa các thuộc
tính của đối t−ợng đ−ợc sử dụng để biểu thị đặc điểm của một đối t−ợng trong cách thức
của một vector mẫu. Phạm vi giá trị của thuộc tính đ−ợc hiểu nh− là độ lớn của không
gian. Một vấn đề quan trọng là độ chính xác của sự xuất hiện khung cảnh thực đ−ợc thu
bởi vector mẫu nh− thế nào. Các vấn đề nhiễu trong ảnh phải d−ới mức độ cho phép và
không làm mất thông tin chủ yếu.
Các thông tin của đối t−ợng đ−ợc biểu diễn nh− thế nào trong vào giai đoạn cảm
biến này và kết quả thu đ−ợc của giai đoạn nàylà các kết quả đo thông tin của đối t−ợng,
kết quả đo này đ−ợc đ−a vào giai đoạn tiền xử lý để thực hiện việc loại bỏ nhiễu, nâng cao
khía cạnh chắc chắn của ảnh…
B−ớc 2: Giai đoạn tiền xử lý
Giai đoạn tiền xử lý đ−ợc thực hiện để loại bỏ nhiễu, nâng cao khía cạnh chắc chắn
của ảnh, và gây ra các thay đổi khác làm đơn giản hóa các b−ớc xử lý ở mức độ cao hơn.
Đối
t−ợng
Dấu hiệu
Cảm biến
Giai đoạn
cảm biến
Kết quả đo tín hiệu
Giai đoạn
tiền xử lý
Trình trích chọn thông tin
đặc tr−ng
Sự trích
chọn đăc
tr−ng
Không gian biểu diễn
Giai đoạn
phân loại
Nhóm mẫu
Xử lý thông
tin khung
cảnh
Hình 1.5 Quá trình nhận dạng mẫu
16
Để ngăn ngừa sự loại ra các cạnh của ảnh đã tồn tại hoặc đ−a ra các cạnh lỗi, thao tác tiêu
biểu đ−ợc sử dụng đó là: tách ng−ỡng và làm mịn. Tách ng−ỡng biến đổi một ảnh cấp độ
xám thành một ảnh nhị phân, trong đó mỗi một điểm có thể là đen hoặc trắng. Làm mịn
ảnh đ−ợc dùng để làm giảm nhiễu, để nâng cao sự lựa chọn các điểm đặc tr−ng của ảnh, và
để làm giảm các chi tiết ảnh không mong muốn. Do đó, ảnh đ−ợc phân chia thành các đối
t−ợng cô lập nhau. Kết quả là thu đ−ợc không gian điểm đặc tr−ng và nó giúp cho giai
đoạn trích chọn điểm đặc tr−ng đ−ợc thực hiện.
B−ớc 3: Trích chọn điểm đặc tr−ng
Sau khi có đ−ợc không gian điểm đặc tr−ng, hệ thống tiến hành trích chọn các điểm
đặc tr−ng của đối t−ợng trong không gian đó. Việc trích ra các đặc tr−ng của đối t−ợng
thông qua nhiều cách khác nhau nh−ng ý nghĩa chính của nó vần là phải sử dụng một bộ
lọc để loại bỏ các thông tin không cần thiết và giữ lại đ−ợc các thông tin quan trọng. Các
điểm đặc tr−ng của đối t−ợng đ−ợc lọc và kết quả đó giúp cho quá trình nhận dạng thuận
tiện. Quá trình lọc này có thể thống kê thành các thuộc tính nh−: màu sắc, kết cấu, c−ờng
độ, khoảng cách, chuyển động… Các điểm đặc tr−ng hình thành nên không gian biểu diễn
điểm đặc tr−ng. Kết quả của không gian biểu diễn giúp cho quá trình phân loại các điểm
đặc tr−ng đ−ợc tốt hơn.
B−ớc 4: Giai đoạn phân loại
Tiến hành phân loại không gian biểu diễn điểm đặc tr−ng để thu đ−ợc các thông tin
mẫu bằng cách sử dụng các giá trị điểm đặc tr−ng đã chọn. Kết quả là các đối t−ợng hoặc
các lớp mẫu biểu thị đặc điểm đ−ợc học bởi các miêu tả sự hình thành mẫu chung, các
chuẩn phân loại, hoặc các hàm quyết định.
B−ớc 5: Trình xử lý thông tin khung cảnh
Trình xử lý khung cảnh làm tăng độ chính xác của nhận dạng bởi việc cung cấp
thông tin thích hợp có liên quan đến môi tr−ờng xung quanh đối t−ợng (bằng cách làm phù
hợp các đặc điểm của đối t−ợng với các mô hình đã đ−ợc l−u trữ, hoặc bằng cách phân loại
dựa trên tiêu chuẩn phân loại).
1.3.2 Các vấn đề trong triển khai thực tế
Thành công của một ứng dụng nhận dạng mặt th−ờng phụ thuộc vào cách mà các
thông tin (dấu hiệu) đ−ợc mô tả. Sự thụ thuộc vào ứng dụng, sự biểu diễn thích hợp sẽ đ−ợc
thực hiện để tạo ra quá trình biểu diễn thông tin mà các thông tin là xác đáng nhất đ−ợc
nhấn mạnh cho ứng dụng. Hai ràng buộc đáng chú ý đó là:
- Kích th−ớc của trình phân loại mà đ−ợc liên kết với số liên thông trong mạng
Neural.
17
- Số tập các ví dụ đào tạo (cỡ của tập dữ liệu).
Các quyết định phải đ−ợc đ−a ra để làm giảm cỡ của vector mẫu mà đ−ợc mô tả
trong mạng Neural. Thông th−ờng kích th−ớc của các vector mẫu phụ thuộc vào miền của
quang phổ mà quá trình thu ảnh gặp phải. Kích th−ớc của các vector mẫu có thể đ−ợc giảm
bằng cách sử dụng một số mối quan hệ giữa các vùng quang phổ với nhau.
Sự thay đổi sóng là một kỹ thuật phổ biến khác đ−ợc sử dụng trong quá trình biểu
diễn ảnh, ở đó một dấu hiệu nhất thời đ−ợc biểu diễn trong giới hạn của hàm cơ sở:
∑∑=
j k
jkjk thCtX )()( (3)
trong đó X(t) là chuỗi thời gian gốc, Cjk là các hệ số sóng, hjk(t) là các nhân sóng, chỉ
số j là các vị trí biểu thị thời gian của nhân, và chỉ số k là sự chia của nhân. Sau đó sự thay
đổi các hệ số sóng Cjk đ−ợc sử dụng cho việc cung cấp dữ liệu tới mạng Neural.
1.3.3 Các ứng dụng điển hình
Quá trình nhận dạng ảnh mặt ng−ời tự động có thể đ−ợc chia thành hai nhiệm vụ
chính:
- Tìm một mặt hoặc các mặt trong một ảnh nền và
- Sự nhận dạng các đặc điểm của mặt
Nhiệm vụ thứ nhất: tìm một mặt trong một ảnh giống nh− là việc đăng ký mặt
hoặc việc xác định vị trí của mặt. Nhiệm vụ này phụ thuộc vào các nhân tố sau:
+ Điều khiển màu sắc và ảnh nền
+ Các ảnh màu hoặc đơn màu và các ảnh tĩnh hoặc các ảnh video.
Nếu ánh sáng ảnh nền đ−ợc điều khiển thì việc xác định các mặt là dễ dàng. Do đó,
sự phụ thuộc vào điều khiển thông qua các nhân tố sẽ dẫn đến việc xác định vị trí của mặt
có thể là một bài toán dễ hoặc một bài toán khó. Do ảnh h−ởng của các yếu tố và các loại
ảnh nên việc tìm mặt cũng trở nên khó khăn hơn. Sự biến đổi của ánh sáng cũng nh− sự
biến đổi của ảnh cơ sở đều ảnh h−ởng rất lớn đến quá trình tìm kiếm mặt.
Nhiệm vụ thứ hai: sự nhận dạng và sự xác minh mặt là hai kiểu của bài toán nhận
dạng mặt, cụ thể là bài toán nhận dạng và bài toán xác minh mặt. Trong bài toán xác minh
mặt ng−ời ta phải kiểm tra mặt đã cho là của ai và do đó việc kiểm tra này làm phù hợp đặc
tính của ảnh đối với một mô hình đơn. Trong bài toán nhận dạng mặt, đây là bài toán tìm
sự phù hợp nhất của một ảnh ch−a biết dựa vào một cơ sở dữ liệu các mẫu mặt hoặc là định
rõ nó không phù hợp với bất kỳ ảnh nào đó trong cơ sở dữ liệu. Điều quan trọng trong thực
tế đó là sự khác nhau của hai bài toán này về tốc độ: nói chung, nếu ta có N ng−ời trong
18
một cơ sở dữ liệu thì quá trình nhận dạng sẽ chậm hơn N lần so với quá trình xác minh. Tại
vì quá trình nhận dạng phải so sánh N lần còn quá trình xác minh chỉ phải so sánh một lần.
Các cơ sở dữ liệu đã và đang đ−ợc phát triển
Phòng thí nghiệm nghiên cứu Olivetti (Olivetti Research Laboratory – ORL) ở Anh
đã phát triển một cơ sở dữ liệu mặt mà có thể cung cấp nh− một điểm chuẩn tốt đối với sự
kiểm tra một hệ thống nhận dạng mặt.
Cơ sở dữ liệu ảnh mặt FERET đ−ợc phát triển tại Mỹ. Cơ sở dữ liệu này đ−ợc kiểm
tra bởi phòng thí nghiệm nghiên cứu quân đội Mỹ.
Hình d−ới đây mô tả một cơ sở dữ liệu ảnh, trong đó các ảnh biến đổi theo các điều
kiện của ánh sáng:
Hình 1.6. Biểu diễn các ảnh theo các điều kiện thay đổi của ánh sáng
19
ch−ơng 2. nhận dạng ảnh mặt ng−ời trong điều kiện ánh sáng
thay đổi
Ch−ơng hai này phân tích các yếu tố ảnh h−ởng đến quá trình nhận dạng và các
cách tiếp cận để giải quyết các yếu tố ảnh h−ởng đó.
1.4 Phân tích các yếu tố ảnh h−ởng đến quá trình nhận dạng
Bất cứ một quá trình nhận dạng nào cũng chịu ảnh h−ởng của nhiều yếu tố không
thuận lợi tới quá trình. Các yếu tố có thể làm giảm tính chính xác của hệ thống, làm giảm
tốc độ nhận dạng,… . Có thể kể đến các yếu tố d−ới đây:
- Môi tr−ờng,
- Biểu diễn khía cạnh hình học của bề mặt (sự quay ảnh, co giãn, thay đổi vị trí,…),
- Các sai số do hệ thống.
Các đặc tr−ng bất động của ảnh là những yếu tố cần thiết để khắc phục đ−ợc ảnh
h−ởng của những yếu tố này song tập những đặc tr−ng bất động không đủ để trình bày ảnh
mặt ng−ời, vì vậy việc nghiên cứu, phân tích ảnh h−ởng của các yếu tố đó là quan trọng.
Trong các mục d−ới đây, các yếu tố ảnh h−ởng đến hệ thống nhận dạng ảnh tự động
đ−ợc phân tích và một số giải pháp khắc phục đ−ợc giới thiệu.
2.1.1. ánh sáng
Các yếu tố của môi tr−ờng ảnh h−ởng tới quá trình nhận dạng mặt nh−: các yếu tố
về ánh sáng, các thiết bị thu nhận ảnh và khung cảnh mà ảnh đ−ợc thu nhận. ánh sáng làm
biến đổi mức độ xám của ảnh và c−ờng độ các điểm ảnh do đó nó làm cho ảnh hoàn toàn
biến đổi qua các vùng khác nhau và các yếu tố đó làm cho hệ thống nhận dạng rất khó có
thể nhận dạng ảnh một cách chính xác. Để khắc phục vấn đề đó đòi hỏi phải đ−a ra cho hệ
thống một số kỹ thuật để loại bỏ các hạn chế đó. ánh sáng làm thay đổi hoàn toàn các dấu
hiệu của ảnh, ngoài ra ánh sáng còn tạo nên các lớp bóng của chính đối t−ợng nhận dạng
hoặc tạo nên các sự che lấp của bản thân nó.
2.1.2. Các thay đổi hình học
Bên cạnh các yếu tố môi tr−ờng ảnh h−ởng tới quá trình nhận dạng, hệ thống còn
chịu ảnh h−ởng của các yếu tố hình học nh−: sự quay, sự dịch chuyển và sự co giãn… Các
yếu tố này ảnh h−ởng rất nhiều đến hệ thống nhận dạng tại vì ảnh h−ởng của nó làm thay
đổi cấu trúc của ảnh, thay đổi h−ớng chụp, góc chụp và thay đổi kích th−ớc của ảnh.
20
2.1.3. Sai số do hệ thống
Một hệ thống nhận dạng ảnh dựa vào các điểm đặc tr−ng thì không thể tránh khỏi
các sai số khi một hệ thống xác định vị trí đó gây ra. Nh−ng mức độ gây ra ở đây là nhiều
hay ít, nó phụ thuộc vào quá trình xác định vị trí đó mà thôi. Ví dụ hệ thống xác định vị trí
hai mắt của tác giả [Mariani], hệ thống nhận dạng này phụ thuộc rất nhiều vào vị trí chính
xác của mắt, nếu hệ thống trả lại kết quả sai thì hệ thống nhận dạng cũng nhận sai. Các sai
số nh− là sai số về sự quay, sự so giãn và sự dịch chuyển, các sai số về phép đo này cho hệ
thống những thông tin lệch lạc về vị trí của ảnh so với ảnh gốc, điều đó dẫn đến hệ thống
nhận dạng không chính xác và cho kết quả không nh− mong muốn. Do đó cần phải khắc
phục các điều kiện đó bằng cách sử dụng các kỹ thuật có liên quan đến tính chất hình học
và biểu diễn hình học của bề mặt.
1.5 Các kỹ thuật giải quyết
Phần này trình bày một số yếu tố môi tr−ờng ảnh h−ởng tới quá trình nhận dạng,
yếu tố này ảnh h−ởng rất nhiều đến sự đăng ký mặt và sự nhận dạng mặt. Với một mặt của
một ng−ời, tr−ớc khi thu ảnh để đăng ký, đã có các điều kiện môi tr−ờng ảnh h−ởng đến
ảnh khi đăng ký và lúc nhận dạng thì điều kiện môi tr−ờng cũng lại ảnh h−ởng đến ảnh cần
nhận dạng. Trong phạm vi của mục này bao gồm các phần sau: (1) Đ−a các thông tin về
điều kiện môi tr−ờng vào mô tả đối t−ợng, (2) Kỹ thuật dựa trên khoảng cách tiếp xúc, (3)
Sử dụng nhiều cách biểu diễn đối t−ợng khác nhau
2.1.1 Đ−a các thông tin về điều kiện môi tr−ờng vào mô tả đối
t−ợng
Trong môi tr−ờng có rất nhiều yếu tố ảnh h−ởng đến quá trình nhận dạng ảnh và
quá trình đăng ký ảnh. Các yếu tố môi tr−ờng nh−: yếu tố ánh sáng, góc chụp ảnh và các
thiếp bị thu ảnh khác nhau. Ta thấy để xác định đ−ợc tính phù hợp của hai ảnh khác nhau
không phải là dễ dàng tại vì hai ảnh tuy là của cùng một đối t−ợng nh−ng chúng lại đ−ợc
chụp ở các thời điểm khác nhau. Do đó các điều kiện này ảnh h−ởng rất nhiều đến chất
l−ợng cũng nh− ảnh h−ởng đến các yếu tố hình học và mức xám của ảnh. Ta có thể mô tả
cách mà so sánh hai ảnh của cùng một đối t−ợng nh− hình sau.
21
Hình 2.1 Mô tả cách so sánh hai ảnh với nhau do các tác động của môi tr−ờng
Tại vì hai ảnh lúc chụp khác nhau nên khi so sánh sụ phù hợp của hai ảnh đ−ợc thực
hiện bằng cách ảnh chụp ban đầu đ−ợc phát sinh thành tất cả các mẫu ảnh mà nó đáp ứng
đ−ợc các tác động của môi tr−ờng. Mỗi mẫu t−ơng ứng với một điều kiện của môi tr−ờng
khác nhau. Để so sánh ảnh cần nhận dạng với ảnh ban đầu ta không thể thực hiện so sánh
hai ảnh trực tiếp mà ta tiến hành so sánh ảnh đó với tất cả các mẫu mà ảnh ban đầu phát
sinh. Sự phù hợp của ảnh này với một mẫu ảnh nào đó cho ta biết đ−ợc sự phù hợp t−ơng
ứng với điều kiện môi tr−ờng. Kết quả của việc so sánh này cho ta nhận ra đ−ợc các yếu tố
nào của môi tr−ờng đã tác động đến ảnh.
Việc phát sinh các mẫu mặt t−ơng ứng với các điều kiện của ánh sáng đ−ợc thực
hiện trong quá trình đăng ký mặt mẫu và quá trình phát sinh các mặt nhân tạo nh− sau:
* Phát sinh các mẫu mặt t−ơng ứng với các điều kiện thay đổi của ánh sáng
Trong quá trình phát sinh các mẫu mặt, hiện nay có rất nhiều kỹ thuật để tạo ra các
mẫu mặt nh− là sử dụng các mặt nạ về sự thay đổi của hình học và sự thay đổi của quang
học. Với sự thay đổi về hình học cho ta đ−ợc các mẫu mặt chụp trực diện và nó đ−ợc phát
sinh từ một mặt nghiêng. Nh−ng các mặt nghiêng đó cũng cần giới hạn trong một góc thay
đổi nào đó. Nếu góc nghiêng v−ợt quá một ng−ỡng cho phép nào đó thì hệ thống không thể
thực hiện đ−ợc. Vấn đề quan tâm chủ yếu trong phần này là các thay đổi của quang học
ảnh h−ởng đến mặt trong quá trình phát sinh các mẫu mặt và giả sử các thay đổi của hình
học là không ảnh h−ởng nhiều đến quá trình phát sinh mặt và đăng ký mặt.
đối t−ợng
ban đầu
đối t−ợng cần
nhận dạng
Tập các mẫu t−ơng ứng với
điều kiện tác động
22
Sự thay đổi về quang học chỉnh xửa độ xám của một điểm ảnh sử dụng một hàm phi
tuyến, và có thể phụ thuộc vào vị trí của điểm ảnh. Các sự thay đổi tuyến tính không đ−ợc
mô hình hoá nh− là các quá trình chuẩn hoá lớp ảnh (cân bằng histogram) đã tồn tại để loại
bỏ những điểm không hiệu quả. Các mặt nạ ánh sáng mô tả d−ới đây đ−ợc sử dụng trong
quá trình phát sinh và đăng ký mẫu mặt. Những mặt nạ này xấp xỉ với các điều kiện ánh
sáng thực và tỏ ra rất có hiệu quả đối với các ứng dụng nhận dạng mặt. Quá trình này sử
dụng 3 kiểu mặt nạ khác nhau để mô tả các thay đổi của ánh sáng nh−ng nó có thể dễ dàng
mở rộng ra thành nhiều mặt nạ khác nhau:
Mặt nạ 1: Hàm logarit trên các mức xám
Mục đích của việc ứng dụng mặt nạ này để thu đ−ợc một ảnh sáng hơn từ một ảnh
gốc. Một bảng tra cứu đ−ợc tạo thành để thực hiện nhiệm vụ này. Toàn bộ bảng đ−ợc tính
toán nh− sau:
255
)255(
)log()255log(
)log()log(
255)(
min
min
min
min
kw
kv
k
kv
wL
−+=
⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−=
(4)
trong đó w là mức xám của ảnh và thay đổi trong [0,255], v là mức xám đ−ợc biến
đổi trong phạm vi [kmin,255] với kmin ≥ 0, và L(w) là mức xám thu đ−ợc trong phạm vi
[0,255] và kmin là một ng−ỡng tối thiểu nào đó giới hạn sự thay đổi của mức xám, cho phép
mức xám biến thổi không thấp hơn ng−ỡng kmin.
Kết quả của thuật toán này đ−ợc minh hoạ nh− hình sau:
Hình 2.2 Biểu diễn ảnh sáng hơn so với ảnh gốc
23
Mặt nạ 2: Hàm số mũ trên các mức xám
Mục đích của ứng dụng mặt nạ này trên các mức xám để thu đ−ợc một ảnh tối hơn
từ một ảnh gốc. Nhiệm vụ này đ−ợc thực hiện bằng cách tạo ra một bảng tra cứu và toàn bộ
bảng đ−ợc tính toán nh− sau:
⎟⎟
⎟⎟
⎠
⎞
⎜⎜
⎜⎜
⎝
⎛
−
−
=
1)exp(
1)
255
*
exp(
255)(
max
max
k
kw
wL (5)
trong đó w ∈ [0,255] là mức xám của ảnh, kmax > 0, và L(w) ∈ [0,255] là mức xám
sau khi thực hiện. kmax là giới hạn mà mức xám biến đổi cực đại.
Kết quả của thuật toán đ−ợc minh hoạ nh− hình sau:
Hình 2.3 Biểu diễn ảnh tối hơn so với ảnh gốc.
Mặt nạ 3: Sự phát sinh các mặt nạ bóng ngang và dọc
ý t−ởng cơ bản sau sự phát sinh các mặt nạ bóng ngang và dọc là giống nhau, do đó
chỉ cần mô tả cách tiếp cận để phát sinh hình bóng đứng theo trực hoành x. Nhiệm vụ này
chỉnh xửa giá trị mức xám của một điểm mà phụ thuộc vào không gian vị trí của điểm đó
trong ảnh. Quá trình này đ−ợc thực hiện theo từng dòng.
Giả sử đặt độ rộng của ảnh là x và λ là một hệ số thực trong đó 0 < λ < 1. Đặt
m=λ*X. Khi đó chúng ta có thể định nghĩa hàm f(x) với x ∈ [0,X] nh− sau:
(6)
⎪⎪⎩
⎪⎪⎨
⎧
−
−+
=
)(
)(1
)(
mX
mx
m
x
xf
Nếu x ∈ [0,m]
Nếu x ∈ ]m,X]
24
Nếu cho một điểm p=(x,y) có mức xám là v thì chúng ta có thể tính toán giá trị xám
của điểm t−ơng ứng w ở vị trí (x,y) là w=v*f(x). Bằng cách làm nh− vậy, chúng ta có thể
phát sinh một ảnh trong đó m điểm đầu tiên của nó là tối hơn và các điểm còn lại là sáng
hơn. Các mặt nạ bóng ngang đ−ợc phát sinh trong một cách t−ơng tự bằng cách xem xét
toạ độ điểm y, và chiều cao của ảnh là Y. Cuối cùng, kết quả thu đ−ợc là một ảnh đã đ−ợc
chuẩn hoá. Các ảnh d−ới đây minh hoạ quá trình bóng đứng với 5 giá trị của λ.
Hình 2.4 Các hình bóng đứng
Nh− vậy với quá trình thay đổi trắc quang, hệ thống thu đ−ợc các ảnh biến đổi theo
ánh sáng, theo các mức xám. Bên cạnh các kỹ thuật phát sinh các ảnh nhân tạo thông qua
sự thay đổi trắc quang, còn có kỹ thuật phát sinh ảnh thông qua sự thay đổi của hình học.
Cả hai kỹ thuật này đều cho đ−ợc các mặt nạ mà các mặt nạ này dùng để phát sinh ra các
mẫu mặt và nó là dữ liệu cho quá trình đăng ký mặt.
Nói tóm lại, các kỹ thuật trên cho chúng ta đ−ợc tập các mẫu mặt t−ơng ứng với các
điều kiện khác nhau của ánh sáng, nhằm giúp cho quá trình đăng ký một mặt mới. Sau khi
đăng ký hoàn thành, cơ sở dữ liệu l−u trữ các mẫu mặt này giúp cho việc nhận dạng về sau
của hệ thống.
2.1.2 Cách giải quyết dựa trên kỹ thuật khoảng cách tiếp xúc
Tr−ớc hết trong thực tế, ph−ơng pháp khoảng cách tiếp xúc đ−ợc sử dụng rất thành
công trong bài toán nhận dạng chữ viết tay. Trong đó hình thái của từng chữ cái là xác
định nh−ng do ng−ời viết khác nhau nên hình thái của một chữ cái cũng khác nhau.
Nh−ng đối với mắt th−ờng thì việc phân biệt sự khác nhau này là không đáng kể. Với cùng
một chữ cái, cho dù ng−ời nào đó có viết nh− thế nào thì mắt th−ờng vẫn nhận đ−ợc tại vì
hình thái của chữ cái là xác định.
Cũng t−ơng tự nh− vậy, trong việc nhận dạng ảnh mặt ng−ời nếu đối với mắt th−ờng
thì không có gì phải bàn đến nh−ng đối với hệ thống nhận dạng tự động thực sự thì thế nào.
Đây là một bài toán khó mà không phải hệ thống nào cũng có thể làm đ−ợc, tại vì các sự
thay đổi của môi tr−ờng và sai số do hệ thống nhận dạng. Để khắc phục một số ảnh h−ởng
25
của môi tr−ờng đến quá trình nhận dạng, theo tác giả [Mariani] cách giải quyết bài toán
này dựa vào khoảng cách tiếp xúc mà kỹ thuật này đã thực hiện rất thành công trong hệ
thống nhận dạng chữ viết tay. Kỹ thuật này đ−ợc sử dụng để khắc phục các sự thay đổi
hình học, các thay đổi diễn cảm của mặt, và để bền vững với các thay đổi của trắc quang
đ−ợc tạo bởi các điều kiện ánh sáng. Các công việc đ−ợc dùng đối với các sự thay đổi của
hình học trên ảnh gốc nh−: các phép quay, sự co giãn trong khuôn khổ của khoảng cách
tiếp xúc.
Giả sử cho một ảnh là i và đặt t(I,α) một sự biến đổi của ảnh mà nó phụ thuộc vào
vector tham số L-chiều α. Sự thay đổi này có thể là các thay đổi của hình học nh− sự hiệu
chỉnh vị trí của các điểm hoặc là các thay đổi của quang học nh− thay đổi c−ờng độ của
các điểm, hoặc là cả hai. Trên thực tế, một ảnh tổng hợp có thể thu đ−ợc từ ảnh gốc bằng
cách áp dụng một liên kết tuyến tính của các sự thay đổi cơ bản này. Đặt MI là tập tất cả
các ảnh tổng hợp thu đ−ợc từ ảnh gốc thì
{ } ⎭⎬
⎫
⎩⎨
⎧ ℜ∈=+=Μ ∑
=
L
l
L
LllI ITI
1
21 ,...,,:)(. ααααα (7)
MI đ−ợc định nghĩa nh− là không gian con chứa trong không gian đầy đủ
M={t(I,α): α ∈ ℜL}, và các vector {T1(I), T2(I),…, TL(I)} mở rộng không gian con tiếp
xúc. MI ⊂ M tại vì, M là không gian ảnh đầy đủ, nó chứa đựng tất cả các ảnh thoả mãn tất
cả các thay đổi của môi tr−ờng còn MI chỉ có các ảnh thoả mãn một số yếu tố nào đó của
môi tr−ờng, cụ thể các yếu tố đó là các thay đổi về hình học và các thay đổi về ánh sáng.
Các vector {T1(I), T2(I),…, TL(I)} biểu thị sự thay đổi của các điều kiện tác động đến ảnh
nhận dạng và T1(I) = t1(I,α), T2(I) = t2(I,α),…, TL(I) = tL(I,α)
Khoảng cách tiếp xúc một cạnh D(I,à) giữa một ảnh i và một ảnh tham chiếu à
đ−ợc định nghĩa nh− khoảng cách nhỏ nhất giữa à và không gian con tiếp xúc MI,
⎪⎭
⎪⎬
⎫
⎪⎩
⎪⎨
⎧ −+= ∑
=
2
1
)(min),(
L
l
ll ITIID àαà α (8)
Các vector tiếp xúc {T1(I), T2(I),…, TL(I)} có thể đ−ợc tính toán bằng cách sử dụng
hữu hạn sự khác nhau giữa ảnh gốc i và một thay đổi nhỏ của I. Chúng ta đã định nghĩa các
vector tiếp xúc nh− là các mặt nạ hình học và mặt nạ quang học song song với sự dịch
chuyển, sự quay và sự co giãn, đ−ợc biểu diễn trực tiếp trong phạm vi sai số vị trí mắt do
hệ thống xác định vị trí mặt sinh ra.
Trên đây cho ta thu đ−ợc khoảng cách từ một ảnh này tới một ảnh cần so sánh, hai
ảnh là phù hợp nếu khoảng cách giữa hai ảnh có giá trị nhỏ nhất.
26
2.1.3 Kết hợp các cách biểu diễn đối t−ợng khác nhau
Trong hệ thống nhận dạng có rất nhiều cách tiếp cận khác nhau để giải quyết bài
toán này, mỗi kỹ thuật có một tính năng đặc biệt riêng và phù hợp với các yêu cầu riêng
của hệ thống nhận dạng ảnh tự động. Tại vì trong thực tế khi tiến hành nhận dạng một ảnh
nào đó thì hệ thống phải thu đ−ợc ảnh cần nhận dạng, nh−ng ả
Các file đính kèm theo tài liệu này:
- K43_Vu_Dinh_Hoang_Thesis.pdf