MỤC LỤC
Lời cảm ơn . i
Danh mục các ký hiệu, các chữ viết tắt . ii
Danh mục các hình . iii
MỞ ĐẦU . 1
CHưƠNG 1. TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BIÊN . 3
1.1. Một số khái niệm cơ bản trong xử lý ảnh . 3
1.1.1. Xử lý ảnh. . 3
1.1.2 Quá trình thu nhận, biểu diễn và lưu giữ ảnh . 3
1.1.3 Histogram của ảnh . 7
1.1.4 Nhận dạng ảnh . 8
1.2 Biên ảnh và vai trò trong nhận dạng ảnh . 9
1.2.1 Khái niệm về biên ảnh và các phương pháp phát hiện biên cơ bản. 9
1.2.2 Vai trò của biên trong nhận dạng ảnh . 14
1.2.3 Biểu diễn biên dựa trên mô tả Fourier . 14
1.2.3.1 Phương pháp dựa trên mô tả Fourier. 16
1.2.3.2 Phương pháp góc quay . 19
CHưƠNG 2: MỘT SỐ PHưƠNG PHÁP PHÁT HIỆN BIÊN
VÀ PHÉP BIỂU DIỄN FORIER ELLIPTIC . 22
2.1 Một số phương pháp phát hiện biên . 22
2.1.1. Phương pháp phát hiện biện trực tiếp . 22
2.1.2 Phương pháp phát hiện biên gián tiếp . 31
2.1.3 Phương pháp phát hiện biên kết hợp. 32
2.1.4 Phát hiện biên dựa vào trung bình cục bộ . 38
2.1.5 Cải thiện và nâng cao chất lượng biên ảnh . 40
2.2 Phép biến đổi Fourier . 49
2.2.1 Định nghĩa . 49
2.2.1 Elliptic Fourier . 50
2.2.3 Biến đổi Fourier rời rạc . 55
2.2.4 Các thuộc tính khác của biến đổi Fourier . 61
CHưƠNG 3: CHưƠNG TRÌNH THỬ NGHIỆM . 62
3.1 Giới thiệu . 62
3.2 Số hóa biên đối tượng ảnh . 62
3.2 Chương trình thử nghiệm . 66
KẾT LUẬN . 70
TÀI LIỆU THAM KHẢO . 72
Tiếng Việt . 72
Tiếng Anh . 72
83 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2135 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Phát hiện biên, biểu diễn fourier elliptic và ứng dụng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hạy với thay đổi nhỏ và nhiễu, dẫn
tới hiệu năng truy tìm rất thấp. Nếu 64 độ dài bán kính sử dụng trực tiếp làm
chỉ mục, có thể sẽ rất khó co dãn và chuẩn hóa xoay. Có thể thực hiện chuẩn
hóa xoay bằng nhận ra bán kính ngắn nhất (hay dài nhất) và thực hiện chuẩn
hóa co dãn bằng cố định độ dài của bán kính ngắn nhất. Nhưng chuẩn hóa này
không ổn định vì với thay đổi nhỏ trên đường biên sẽ ảnh hưởng đến vị trí bán
kính nhỏ nhất và các vị trí của điểm mẫu, dẫn tới chỉ mục rất khác nhau và
khoảng cách rất lớn giữa các hình dạng do thay đổi nhỏ. Mục tiêu sử dụng FD
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
19
là chuyển đổi độ dài bán kính nhạy cảm vào miền tần số nơi dữ liệu bền vững
hơn đối với thay đổi nhỏ và nhiễu.
1.2.3.2 Phƣơng pháp góc quay
Arkin và các đồng nghiệp đề xuất một phương pháp hiệu quả để biểu
diễn các hình đa giác gọi là phương pháp góc quay. Tổng quát, phương pháp
biểu diễn một hình đa giác A đơn giản sẽ mô tả biên của A bằng cách liệt kê
dãy các đỉnh (vertex) trong đó mối đỉnh được mô tả bởi cặp tọa độ (x,y). Tuy
nhiên, Arkin đưa ra một cách biểu diễn khác cho biên của một hình đa giác.
Theo phương pháp của ông, biên có thể được mô tả bởi hàm quay
SA
. Hàm
SA
đo góc của tiếp tuyến của cung (arc-length) theo chiều ngược chiều
quay đồng hồ. Cung S được tính từ điểm tham chiếu bắt đầu O trên biên của
đa giác. Khi đó
OA
là góc tạo bởi tiếp tuyến tại O và trục tham chiếu nào
đó, chẳng hạn là trục x. Theo cách này, hàm quay
SA
sẽ đi dọc theo biên,
tăng khi quay sang bên trái và giảm khi quay sang bên phải.
Không mất tính tổng quát, Arkin giả thiết rằng mọi đa giác được thay
đổi kích thước hay chuẩn hóa sao cho chu vi của nó bằng 1. Khi đó
SA
là
một hàm với đối số nằm trong khoảng [0,1]. Hình mô tả việc biểu diễn góc
quay của một đa giác.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
20
Hình 1.6 Biểu diễn theo góc quay
Trong Hình 1.6a, O là điểm bắt đầu và góc quay tương ứng với nó là
v1. Mọi góc quay được biểu diễn trong Hình 1.6b có thể tính được bằng cách
di chuyển ngược chiều quay đồng hồ dọc theo biên của đa giác. Chú ý rằng
với đa giác lồi A, hàm quay của nó
SA
sẽ tăng đơn điệu từ v đến
2v
.
Cho trước hai đa giác A và B với các hàm quay tương ứng là
SA
và
SB
, sự khác biệt giữa chúng được định nghĩa là:
2
,( , ) min ( ( ( ) ( )) ) r A B
i
D A B i i
trong đó,
,minr
đại diện cho giá trị nhỏ nhất của mọi trường hợp dịch
chuyển và xoay của đa giác B.
Việc biểu diễn hình dạng này là bất biến với việc dịch chuyển, thay đổi
kích thước và việc xoay. Mặc dù cách biểu diễn này có nhiều ưu điểm, nó vẫn
nhạy cảm với các thay đổi nhỏ của hình ảnh. Điều này được mô tả trong Hình.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
21
Hình 1.7 Biểu diễn góc quay trong trường hợp có thay đổi nhỏ
Trong Hình 1.7 đa giác Q chỉ có một chút thay đổi nhỏ so với P. Tuy
nhiên, khi ta sử dụng các hàm quay của chúng để so sánh, sự khác biệt do
phần mờ trong đồ thị sẽ không đủ nhỏ để cho biết hai hình này là rất tương tự
nhau.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
22
CHƢƠNG 2: MỘT SỐ PHƢƠNG PHÁP PHÁT HIỆN BIÊN
VÀ PHÉP BIỂU DIỄN FOURIER ELLIPTIC
2.1 Một số phƣơng pháp phát hiện biên
2.1.1. Phƣơng pháp phát hiện biện trực tiếp
2.1.1.1 Kỹ thuật Gradient
Đây là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm. Theo
định nghĩa Gradient là một vector biểu thị tốc độ thay đổi giá trị của một đại
lượng. Vì ảnh là một mảng hai chiều nên ta tính vi sai giữa hai điểm ảnh cạnh
nhau theo hai hướng x và y.
dx
yxfydxxf
x
yxf
fx
),(),(),(
dy
yxfdyyxf
y
yxf
fy
),(),(),(
Với dx, dy là khoảng cách giữa các điểm theo hướng x và y (được tính
bằng số điểm ảnh) và fx, fy là các đạo hàm gián đoạn hay các Gradient theo
các hướng x và hướng y.
Đạo hàm theo hướng r và góc bất kỳ được tính theo công thức:
r
y
y
f
r
x
x
f
r
f
fxcos + fysin.
y
y
fx
x
ff
rfxsin + rfycos.
Thực tế, ảnh số là tín hiệu rời rạc nên không có đạo hàm thực mà người
ta chỉ mô phỏng và xấp xỉ đạo hàm bằng các kỹ thuật nhân chập (phép cuộn).
Trong kỹ thuật Gradient người ta chia nhỏ thành hai kỹ thuật (do sử
dụng các toán tử nhân chập khác nhau) là kỹ thuật Gradient và kỹ thuật la
bàn. Kỹ thuật Gradient dùng toán tử Gradient lấy đạo hàm theo một hướng,
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
23
còn kỹ thuật la bàn dùng toán tử la bàn lấy đạo hàm theo 8 hướng của tất cả
các điểm ảnh cạnh nó. Hình 2.1 minh họa mô hình 8 hướng. Có khá nhiều
toán tử đạo hàm đã được áp dụng. Các toán tử sử dụng kỹ thuật Gradient đáng
kể nhất là toán tử Robert, Sobel và Prewitt. Còn toán tử la bàn hay được sử
dụng là toán tử Krish.
Dưới đây là các mặt nạ tương ứng với các kỹ thuật nêu trên:
1 2
0
7 6 5
4
3
E
NE
N
NW
W
SW
S
SE
Hình 2.1: Mô hình 8 hướng
Ngang (hướng x) Dọc (hướng y)
-1 0 1
Hx = -2 0 2
-1 0 1
-1 -2 -1
Hy = 0 0 0
1 2 1
(b) Mặt nạ Sobel
Ngang (hướng x) Dọc (hướng y)
-1 0 1
Hx = -1 0 1
-1 0 1
-1 -1 -1
Hy = 0 0 0
1 1 1
(c) Mặt nạ Prewitt
0 1
H1 =
-1 0
-1 0
H2 =
0 -1
(a) Mặt nạ Robert
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
24
Tiếp theo là một số kết quả minh họa của sử dụng các mặt nạ Robert,
Sobel.
Hình 2.2 Ảnh trước khi dò biên
(d) Các mặt nạ toán tử Krish theo các hướng 00, 450, 900,
135
0
, 180
0
, 225
0
, 270
0
, 315
0
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
25
Hình 2.3 Ảnh sau khi dò biên
Các kỹ thuật đánh giá Gradient ở trên làm việc khá tốt khi mà độ sáng
thay đổi rõ nét. Nhưng khi mức xám thay đổi chậm miền chuyển tiếp trải rộng
thì phương pháp Laplace (sử dụng đạo hàm bậc hai) tỏ ra hiệu quả hơn.
2.1.1.2. Kỹ thuật Laplace
Toán tử Laplace được định nghĩa như sau:
Trong đó f(x,y) là hàm cường độ của ảnh.
Để hiểu hoạt động của phương pháp Laplace trong việc trích ra đường
biên chúng ta có thể xem các sơ đồ dưới đây.
y
yxf
x
yxf
yxf
2
2
2
2
2 ),(),(),(
f(x)
a
fx
x
b
2
2
fx
x
c
Hình 2.4. (a) ảnh gốc (b) Đạo hàm bậc nhất (c) Đạo hàm bậc hai
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
26
Như vậy, đạo hàm bậc hai có thể dùng để phát hiện đường biên ảnh.
Thông thường các điểm không (cross-zero) của đạo hàm bậc hai là nơi có
đường biên, tuy nhiên phải chú ý là đạo hàm của một hàm hai biến tại bất kỳ
điểm nào cũng phụ thuộc vào hướng lấy đạo hàm.
Toán tử Laplace dùng nhiều kiểu mặt nạ khác nhau để xấp xỉ cho đạo
hàm bậc hai. Có ba kiểu mặt nạ hay dùng
Các kết quả nhiên cứu cho thấy trong phương pháp đạo hàm bậc hai,
toán tử Laplace rất nhậy cảm với nhiễu và tạo thành biên kép. Để khắc phục
nhược điểm này người ta mở rộng toán tử Laplace và dùng xấp xỉ Laplace-
Gauss để phát hiện các điểm không:
h(m,n)=c[1-(m
2
+n
2
)/ σ 2]exp(-(m2+n2)/2 σ 2)
Với σ là tham số điều khiển độ rộng, và c là chuẩn tổng các phần tử có
kích thước mặt nạ là đơn vị. Cắt điểm không của ảnh cho trước chập với
h(m,n) sẽ cung cấp cho ta vị trí biên của ảnh. Các điểm biên của ảnh được xác
định bởi các điểm cắt điểm không (cross-zero) và các điểm không là duy nhất.
Do vậy kỹ thuật này cho đường biên mảnh. Tuy nhiên như đã nói ở trên, kỹ
thuật Laplace rất nhạy cảm với nhiễu do đạo hàm bậc hai thường không ổn
định.
0 -1 0
H1 = -1 4 -1
0 -1 0
-1 -1 -1
H2 = -1 8 -1
-1 -1 -1
1 -2 1
H3 = -2 5 -2
1 -2 1
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
27
a) b)
c)
Hình 2.5 a) Ảnh gốc; b) Ảnh biên dùng Laplace H1; c) Ảnh biên dùng
Laplace H2;
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
28
Ngoài hai kỹ thuật dò biên kể trên, trong các phương pháp phát hiện biên
trực tiếp người ta còn sử dụng một số kỹ thuật khác nữa đó là: phương pháp
dò biên theo quy hoạch động, phương pháp tiếp cận bởi mô hình mặt, phương
pháp tiếp cận tối ưu hóa.
Phương pháp dò biên theo quy hoạch động là phương pháp tìm cực trị
của các quá trình nhiều bước dựa vào nguyên lý tối ưu của Bellman.
Thuật toán xác định một đường bao tối ưu của ảnh trên cơ sở đánh giá
khoảng cách, gradient biên độ và gradient hướng của các đỉnh.
Phương pháp tiếp cận bởi mô hình mặt dựa vào việc thực hiện xấp xỉ
đa thức trên ảnh gốc hay ảnh đã thực hiện phép lọc Laplace. Cách tiếp
cận tối ưu nhằm xác định một hàm (một bộ lọc), làm giảm phương sai
σ
2
hoặc giảm một số điểm cực trị cục bộ.
Phương pháp tiếp cận tối ưu hóa định vị đúng vị trí bằng cách cực tiểu
hóa phương sai σ 2 của vị trí các điểm cắt không (cross-zero) hoặc hạn
chế số điểm cực trị cục bộ để chỉ tạo ra một đường bao.
Nhìn chung các phương pháp phát hiện biên như đã trình bày ở trên đều
có ít nhiều sử dụng đến các kỹ thuật đạo hàm. Ý tưởng chung của các kỹ thuật
tìm biên sử dụng đạo hàm đó là sử dụng các bộ lọc thông cao để làm nổi biên.
Bởi vì các điểm biên là các chi tiết có tần số không gian cao nên khi ảnh được
lọc thông cao, các phần tử có tần số không gian cao sẽ sáng hơn còn các phần
tử có tần số không gian thấp sẽ tối đi. Kỹ thuật lọc thông cao được thực hiện
nhờ thao tác nhân chập.
Việc sử dụng các mặt nạ nhân chập có một nhược điểm chung đó là bản
thân phép lọc không tự động loại bỏ hoặc hạn chế được nhiễu. Bởi vì đặc tính
của nhiễu, nếu xem xét một cách tương đương trong không gian tần số, nhiễu
ứng với các thành phần tần số cao trong ảnh. Các phép lọc thông cao tuy làm
nổi các điểm biên nhưng đồng thời cũng làm nổi các nhiễu. Hơn thế nữa để
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
29
phân tích, nhận dạng ảnh người ta thường muốn xử lý trên các ảnh biên chỉ có
hai màu (màu biên và màu nền) để cho đơn giản. Các ảnh qua lọc lấy biên
không cho ra ảnh biên (hai màu) mà cần phải thông qua một vài phép xử lý
trung gian nữa (chẳng hạn phân ngưỡng) thì mới thu được ảnh biên thực sự.
Bản thân quá trình xử lý này cũng có thể lại làm mất đi các chi tiết của ảnh
biên sau phép lọc.
Ngoài ra, các kỹ thuật tìm biên sử dụng đạo hàm còn có một hạn chế
nữa là không cho phép điều chỉnh độ chi tiết của ảnh biên thu được. Trong
các ảnh chụp thế giới thực, sẽ có rất nhiều các đối tượng trong ảnh có độ chi
tiết (mờ, rõ) khác nhau. Khi nhận dạng, không hẳn là chúng ta sẽ quan tâm
đến tất cả các đối tượng mà chủ yếu là chỉ quan tâm đến các đối tượng chính
trong ảnh. Các đối tượng này thường có độ chi tiết và độ rõ cao. Sử dụng các
mặt nạ nhân chập không cho phép chúng ta điều chỉnh độ chi tiết của các ảnh
biên thu được một cách dễ dàng, rõ ràng buộc tổng các hệ số của bộ lọc phải
bằng 1; nhằm ngăn cản sự tăng quá giới hạn của các giá trị mức xám (các giá
trị điểm ảnh phải giữ được giá trị của nó một cách gần đúng không thay đổi
quá nhiều so với giá trị thực). Phần dưới đây, tôi xin giới thiệu tổng quan kỹ
thuật phát hiện biên thuộc loại phát hiện biên trực tiếp nhưng không dựa và
đạo hàm mà dựa vào phép toán hình thái [29] đang được nhiều nhà khoa học
quan tâm.
2.1.1.3. Tìm biên bằng phép toán hình thái
Ở phần này, em chỉ xin được giới thiệu tổng quan phép toán hình thái để làm
định hướng cho quá trình nghiên cứu sau này. Phép toán hình thái thực hiện
trên cơ sở ảnh ban đầu đã được làm trơn bằng phép lọc trung vị. Giả sử P là
một điểm của ảnh đã được làm trơn, tính hai độ lệch của điểm đó với các giá
trị lớn nhất và nhỏ nhất của cửa sổ xung quanh P, (cửa sổ 33). Giá trị nhỏ
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
30
hơn trong hai giá trị đó sẽ được chọn làm giá trị điểm ảnh đầu ra. Quá trình
này sẽ được mô tả mhư sau:
Giả sử ảnh gốc I(m,n) được làm trơn bằng bộ lọc trung bình tạo ra ảnh
O1(m,n):
W(m,n) là cửa sổ của (m,n) nhận điểm này làm trung tâm (phép xếp
chồng tại trung tâm) được chọn thích hợp. Nw là số điểm của cửa sổ này. Một
điểm ảnh đầu ra O2(m,n) được tính từ ảnh O1(m,n) thông qua phép so sánh và
lựa chọn bởi:
Trong đó F(m,n) là cửa sổ lân cận của điểm (m,n) cũng được
chọn thích hợp
Như vậy, các điểm biên được làm nổi lên, nhờ phép so sánh, chọn ra độ
sai khác nhỏ nhất giữa nó và giá trị độ sáng của các điểm ảnh thuộc lân cận.
Sai khác này càng lớn thì điểm biên càng được làm nổi.
),(,
1 ),(
1
),(
nmWlkw
lnkmI
N
nm
),(
11
)(
112 ),()(max,)(min),(mi),(
nmFqmnFq
nmOqOqOnmOnm
XTB = ((XB)B)
Xấp xỉ trên của X (chứa X)
XDB = ((XB)B)
Xấp xỉ dưới của X (thuộc X)
X B = XTB\XDB
Xấp xỉ biên của X theo mẫu B
Hình 2.6. Minh hoạ biểu diễn biên nhờ các phép toán hình thái
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
31
2.1.2. Phƣơng pháp phát hiện biên gián tiếp
2.1.2.1. Phân vùng ảnh dựa theo ngưỡng biên độ
Ảnh khi được miêu tả thông qua hàm f(x,y) có thể được quan niệm như
một môi trường vật lý. Trong đó, các hiện tượng như phản xạ, truyền sáng,
màu sắc hoặc đáp ứng đa phổ đều có thể mô tả được. Các hàm f(x,y) có thể
đặc trưng cho biên độ của các tính chất vật lý của ảnh, còn các biến (x,y)
ngoài ý nghĩa vị trí có thể được sử dụng như là điện áp, nhiệt độ,
hoặc vận tốc.
Chúng ta có thể dùng ngưỡng biên độ để phân vùng ảnh khi mà biên độ
là đủ lớn để đặc trưng cho ảnh. Kỹ thuật phân ngưỡng theo biên độ được tiến
hành theo các bước như sau:
Xem xét lược đồ xám của ảnh để xác định các đỉnh và các khe. Nếu ảnh
có dạng rắn lượn (nhiều đỉnh và khe), các khe có thể sử dụng để
chọn ngưỡng.
Chọn ngưỡng t sao cho một phần xác định trước của toàn bộ số mẫu là
thấp hơn t.
Điều chỉnh ngưỡng dựa trên xem xét lược đồ xám của các điểm lân cận.
Chọn ngưỡng như xem xét lược đồ xám của những điểm thỏa mãn tiêu
chuẩn chọn. Thí dụ, với ảnh có độ tương phản thấp, lược đồ của những
điểm có biên độ Laplace g(m,n) lớn hơn giá trị t định trước (sao cho từ
5% đến 10% số điểm ảnh với Gradient lớn nhất sẽ coi như biên) sẽ cho
phép xác định các đặc tính của ảnh lưỡng cực tốt hơn ảnh gốc.
Khi có một mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào
tiêu chuẩn nhằm cực tiểu xác suất của sai số hoặc một số tính chất khác theo
luật của Bayes.
2.1.2.2. Phân vùng dựa theo miền đồng nhất
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
32
Kỹ thuật phân vùng ảnh thành các vùng đồng nhất dựa vào các tính
chất quan trọng nào đó của miền. Việc lựa chọn các tính chất của miền sẽ xác
định các tính chất phân vùng. Các tiêu chuẩn hay được dùng là sự thuần nhất
về mức xám, màu sắc đối với ảnh màu, kết cấu sợi và chuyển động.
Có 3 cách tiếp cận chủ yếu trong phân vùng ảnh theo miền đồng nhất
và độc lập với tiêu chuẩn chọn lựa tính đồng nhất đó là:
Phương pháp phân tách - cây tứ phân (split-quad stress)
Phương pháp hợp (merge)
Phương pháp tách hợp (split-merge)
Mức độ hiệu quả của các phương pháp là tùy thuộc vào việc chọn tiêu
chuẩn đánh giá độ thuần nhất. Nhìn chung các kỹ thuật phân vùng ảnh cho
phép chúng ta phát hiện biên một cách chính xác hơn các kỹ thuật đạo hàm do
ít chịu ảnh hưởng của nhiễu, nhưng hầu hết các kỹ thuật phân vùng này đều
có cài đặt khá phức tạp và thường làm mất nhiều chi tiết của các đối tượng
trong ảnh nên thường không được sử dụng để tìm biên.
2.1.3. Phƣơng pháp phát hiện biên kết hợp
Để phát hiện biên của đối tượng trong frame ảnh. Phương pháp này
được áp dụng để tìm biên cho ảnh 256 cấp xám đã thử nghiệm và được đánh
giá khá hiệu quả. Việc xử lý và thao tác trên các ảnh xám có một ưu điểm là
dễ xử lý hơn các ảnh màu mà vẫn giữ được nhiều đặc tính của ảnh. Khi muốn
nhận dạng biên cho các ảnh màu, chúng ta có thể dễ dàng chuyển đổi về
khuôn dạng ảnh 256 cấp xám bằng hàm ConvertRGB được cài đặt trong
chương trình Demo. Việc không xử lý ở ảnh đen trắng, bởi các frames ảnh
được quay hoặc thu trực tiếp từ Camera là ảnh màu 16 bits hoặc 24 bits. Do
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
33
đó, khi chuyển sang ảnh đen trắng sẽ làm mất rất nhiều thông tin. Hình 2.7,
2.8 và hình 2.9 dưới đây sẽ minh họa điều này.
Hình 2.7 Ảnh gốc
Hình 2.8 Ảnh đen trắng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
34
Hình 2.11. biên của ảnh đen trắng
PCX
Hình 2.9 Ảnh đen trắng dùng hàm ConvertRGB
Để xây dựng thuật toán tìm biên cho ảnh đa cấp xám, trước hết chúng
ta nhắc lại một thuật toán tìm biên cho ảnh trắng đen rất đơn giản và hiệu quả.
Ý tưởng của thuật toán này là dựa vào định nghĩa: trong ảnh trắng đen, một
điểm có thể gọi là biên nếu nó là điểm đen và có ít nhất một điểm trắng lân
cận. Ảnh sẽ được quét từ trái sang phải, từ trên xuống dưới, khi gặp điểm đen
đầu tiên sẽ thực hiện quay theo 8 láng giềng để tìm điểm biên tiếp theo, cứ thế
cho đến khi quay được về điểm biên được xác định đầu tiên thì dừng. Kết quả
chúng ta sẽ được biên của ảnh. Hình dưới đây minh họa kết quả dò biên ảnh
đen trắng PCX
Hình 2.10 Ảnh đen trắng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
35
Hình 2.11 Biên ảnh đen trắng
Thủ tục phát hiện biên của ảnh đen trắng PCX có thể được viết ngắn
gọn như sau:
LPSTR Detect_Edge_BW_Image(LPSTR pOrgImg, LPSTR pEdgImg)
{ int i,j,k
struct Point { int x,y; };
Point Orient[8] = {(0,1), (-1,1), (-1,0), (-1,-1), (0,-1), (1,-1),(1,0),(1,1) };
for (i=0; i<biHeight; i++)
for (j=0; j<biWidth; j++)
if ( GetPoint(pOrgImg,i,j)==BLACK )
for (k=0; k<8; k++)
if (GetPoint(pOrgImg,i+Orient[k].x,j+Orient[k].y)==WHITE)
{ SetPoint(pEdgImg,i,j,BLACK);
break;
}
return pEdgImg;
}
Trong đó:
biWidth, biHeight lần lượt là chiều rộng và chiều cao của ảnh (tính theo
đơn vị pixel) .
GetPoint() và SetPoint() là các hàm đọc, ghi điểm ảnh.
pOrgImg, pEdgImg là các con trỏ lần lượt trỏ tới các vùng dữ liệu của
ảnh gốc và ảnh biên.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
36
Như vậy, việc tìm biên cho các ảnh trắng đen theo cách dựa vào định
nghĩa là khá dễ dàng (dựa vào 2 mức 0, 1). Chúng ta sẽ dựa theo ý tưởng đó
để tìm biên cho các ảnh đa cấp xám. Tuy nhiên có một khó khăn mắc phải là
ảnh đa cấp xám có 256 màu. Sự biến thiên về giá trị độ xám của điểm ảnh
theo các hướng khác nhau cũng là khác nhau. Do đó nếu đánh giá một điểm là
điểm biên hay không nếu chỉ dựa vào việc đánh giá độ chênh lệch mức xám
của điểm đó với từng điểm láng giềng lân cận sẽ cho kết quả chưa tốt và ảnh
biên thu được vẫn còn khá nhiều nhiễu.
Để cho kết quả chính xác hơn (để hạn chế nhiễu) thay vì so sánh giá trị
xám của điểm ảnh đang xét với từng điểm ảnh lân cận chúng ta sẽ so sánh với
mức xám trung bình của vùng cửa sổ NxN bao quanh điểm đó cộng với một
giá trị 1 cho trước.
PTB+ ä1< P
Hình 2.12 Ảnh gốc Hình 2.13 Ảnh biên với cách đánh giá
độ chênh lệch mức xám của điểm ảnh
với từng điểm láng giềng kế
Hình 2.14 So sánh với mức xám trung bình của cửa sổ trong
trường hợp N=5
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
37
Hình 2.15 Xác định điểm biên thực sự
Cơ sở đúng đắn của thuật toán là dựa trên lý thuyết về tính dư thừa thông
tin không gian: các điểm ảnh lân cận có thể có cùng hoặc gần cùng một số đặc
tính. Thực nghiệm cho thấy sử dụng các cửa sổ vuông kích thước 5x5 để tìm
biên hạn chế được nhiều nhiễu là hơn các cửa sổ 3x3 nhưng các đường biên
thu được cũng sẽ dày hơn. Việc tăng kích thước của cửa sổ lên nữa không làm
tăng độ chính xác lên nhiều mà lại làm cho độ phức tạp tính toán tăng lên rất
nhanh. Chúng ta sẽ sử dụng các mặt nạ 5x5 để tìm biên nhưng để thu được
các đường biên mảnh cần vận dụng lại ý tưởng sử dụng định nghĩa. Tức là các
điểm ảnh được lọc ra sau khi so sánh với giá trị xám trung bình của cửa sổ
(tạm gọi là các điểm thuộc lân cận biên) lại được so sánh một lần nữa với các
điểm kế cận (thuộc 8 láng giềng của nó) cộng với một giá trị 2 xác định
trước. Và các điểm biên thu được lần này mới được coi là các điểm
biên thực sự.
Pi + 2 < P
Hình dưới đây minh họa kết quả của phương pháp tìm biên kết
hợp với N=5.
Hình 2.16. ảnh biên áp dụng phương pháp kết hợp với N=5
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
38
Dưới đây là thủ tục tìm biên của chương trình:
LPSTR DetectEdgeGrayImage(LPSTR pOrgImg,LPSTR pEdgImg,int 1,int
2)
{
int i,j,k,ii,jj,P0;
struct Point { int x,y; };
Point Orient[8] = {(0,1), (-1,1), (-1,0), (-1,-1), (0,-1), (1,-1),(1,0),(1,1) };
for (i=2; i<biHeight-2; i++)
for (j=2; j<biWidth-2; j++)
{
// tinh gia tri xam trung binh cua cac diem anh thuoc cua so 5x5
for (ii=i-2;ii<=i+2;ii++)
for (jj=j-2;jj<=j+2;jj++)
TG+=GetPoint(pOrgImg,ii,jj);
TG=int(TG/25);
P0=GetPoint(pOrgImg,i,j);
if (P0+1<TG)
for (k=0;k<8;k++)
// so sanh voi cac diem thuoc 8 lang gieng
if (P0+2<GetPoint(pOrgImg,i+Orient[k].x,j+Orient[k].y))
{
SetPoint(pEdgImg,i,j,BLACK); break;
}
}
return pEdgImg;
}
2.1.4 Phát hiện biên dựa vào trung bình cục bộ
Phần này đề cập đến kỹ thuật mới dựa vào trung bình cục bộ trên cơ sở
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
39
đánh giá độ chênh lệch về giá trị mức xám của điểm ảnh so với các điểm lân
cận do đó kết hợp được ưu điểm của cả 2 khuynh hướng phát hiện biên trực
tiếp và gián tiếp.
Ý tưởng chính của thuật toán được đề xuất là xác định tất cả các điểm
nằm trên biên không theo hướng tìm kiếm và sử dụng các ma trận lọc mà sẽ
thông qua việc so sánh độ chênh lệch về mức xám của nó so với mức xám
chung của các điểm ảnh lân cận (mức xám nền). Trước hết tính giá trị xám
trung bình của các điểm ảnh nằm trong phạm vi của ma trận 3×3 hoặc 5×5
có tâm là điểm ảnh đang xét. Nếu như độ chênh lệch mức xám giữa điểm
đang xét với giá trị xám trung bình thỏa mãn lớn hơn một mức tối thiểu δ1
nào đó (PTB+ δ1< P) thì chúng ta sẽ coi nó là điểm biên và ghi nhận lại, còn
các điểm không thỏa mãn điều kiện trên sẽ được coi là điểm nền.
N=5
Hình 2.17 Ma trận điểm ảnh trước và sau lọc
Ảnh biên thu được với δ1= 25 Ảnh biên thu được với δ1= 250
Hình 2.18 Các ảnh biên kết quả thu được theo thuật toán đề xuất
*Nhận xét:
Thuật toán dò biên sử dụng trong chương trình tuy đã hạn chế được
nhiều nhiễu so với việc sử dụng các bộ lọc và làm nổi rõ các đường biên
nhưng vẫn không loại bỏ được hầu hết các nhiễu. Khi áp dụng thuật toán
δ1
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
40
trên chúng ta vẫn có thể làm giảm bớt nhiễu đi nhiều hơn nữa bằng cách
tăng giá trị của hệ số delta lên. Nhưng khi đó các đường biên thu được cũng
bị đứt đoạn và mờ đi nhiều.
2.1.5. Cải thiện và nâng cao chất lƣợng biên ảnh
2.1.5.1. Các kỹ thuật tiền xử lý
Trong giai đoạn tiền xử lý, vấn đề mà chúng ta phải quan tâm đến
nhiều nhất đó là vấn đề nhiễu. Nhiễu là nguyên nhân chủ yếu gây nên những
khó khăn cho phân tích ảnh. Nguyên nhân gây ra nhiễu có thể là do nhiễu
điện tử của máy thu hoặc chất lượng kém của bộ số hóa. Chúng ta hãy xem
xét thể hiện của nhiễu trên ảnh thế nào. Giả sử ảnh là một miền có mức xám
đồng nhất. Như vậy, các phần tử của ma trận biểu diễn ảnh sau quá trình số
hóa phải có cùng giá trị. Nhưng thực tế quan sát kỹ, ta thấy: gần giá trị trung
bình của mức xám có những phần tử trội lên khá nhiều. Đó chính là hiện
tượng nhiễu. Như vậy, nhiễu trong ảnh số được xem là sự dịch chuyển nhanh
của tín hiệu thu nhận (tín hiệu ảnh) trên một khoảng cách ngắn. Xem xét một
cách tương đương trong không gian tần số, nhiễu ứng với các thành phần tần
số cao trong ảnh.
Phần dưới đây, em sẽ trình bày các kỹ thuật khử nhiễu. Trước hết
chúng ta tìm hiểu một số kỹ thuật lọc nhiễu đang được sử dụng phổ biến hiện
nay. Để khử nhiễu, thông thường người ta lấy “tổ hợp” các điểm lân cận
(trong không gian thực) hay lọc các thành phần tần số cao (trong không gian
tần số). Cơ sở lý thuyết của kỹ thuật lọc số cũng dựa trên tính dư thừa thông
tin không gian: các pixel lân cận có thể có cùng hoặc gần cùng một số đặc
tính. Hơn nữa nhiễu cũng có thể coi như sự đột biến của một số điểm ảnh so
với các điểm ảnh lân cận. Tùy theo cách tổ hợp điểm đang xét mà ta có kỹ
thuật lọc tuyến tính hay phi tuyến.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
41
2.1.5.1.1. Kỹ thuật lọc tuyến tính
Với kỹ thuật lọc tuyến tính, ảnh thu được sẽ là tổng trọng số hay là
trung bình trọng số các điểm lân cận với nhân cuộn hay mặt nạ. Nguyên tắc
lọc theo tổng trọng số được minh họa như hình dưới đây:
Tức là: P = P1K1 + P2K2 + P3K3 + P4K4 + P5K5 + P6K6 + P7K7 + P8K8
= X
8 lân cận của P5 nhân cuộn 3x3
Hình 2.19 Lấy tổ hợp các điểm ảnh lân cận.
Các mặt nạ thường dùng là :
Mặt nạ H1 là mặt nạ dùng để tính trung bình
Các file đính kèm theo tài liệu này:
- 2LV_09_CNTT_KHMT_PHAM NGOC QUY.pdf