MỤC LỤC
Trang
MỤC LỤC.2
LỜI CẢM ƠN.4
DANH SÁCH CÁC HÌNH ẢNH.5
MỞ ĐẦU.7
CHƯƠNG I: TỔNG QUAN VỀXỬLÝ ẢNH VÀ BIÊN.9
1.1. Tổng quan vềxửlý ảnh.9
1.1.1. Xửlý ảnh.9
1.1.2. Các bước cơbản trong xửlý ảnh.10
1.1.3. Một sốvấn đềcơbản trong xửlý ảnh.14
1.2. Toán tửkhông gian với xửlý ảnh.18
1.2.1. Làm trơn nhiễu bằng lọc tuyến tính.18
1.2.2. Làm trơn nhiễu bằng lọc phi tuyến.21
1.2.3. Lọc thông thấp, thông cao và lọc dải thông.22
1.3. Tổng quan vềbiên.23
1.3.1. Biên và các kiểu biên cơbản.23
1.3.2. Vai trò của biên trong nhận dạng.26
CHƯƠNG II: CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN CỔ ĐIỂN.28
2.1. Phân loại các kỹthuật phát hiện biên.28
2.1.1. Phương pháp phát hiện biên trực tiếp.28
2.1.2. Phương pháp phát hiện biên gián tiếp.28
2.1.3. Quy trình phát hiện biên.29
2.2. Kỹthuật phát hiện biên Gradient.29
2.2.1. Pixel difference.30
2.2.2. Separated Pixel Difference.31
2.2.3. Toán tửRobert (1965).32
2.2.4. Toán tửPrewitt.33
2.2.5. Toán tử(mặt nạ) Sobel.33
2.2.6. Toán tửFrie-Chen.34
2.2.7. Toán tửBoxcar.34
2.2.8. Toán tửTruncated Pyramid.35
2.3 Các toán tửla bàn.36
2.3.1. Toán tửla bàn Kirsh.37
2.3.2. Toán tửla bàn Prewitt.38
2.3.3. Robinson 3 - Level.39
2.3.4. Robinson 5 - Level.40
2.4. Kỹthuật phát hiện biên Laplace.41
CHƯƠNG III: CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN NÂNG CAO.45
3.1. Phương pháp Canny.45
3.1.1. Cơsởlý thuyết thuật toán.45
3.1.2. Hoạt động của thuật toán.47
3.2. Phương pháp Shen - Castan.52
3.2.1. Xây dựng bộlọc tối ưu.52
3.2.2. Hoạt động của thuật toán.54
3.3. Phát hiện biên dựa vào Wavelet.56
CHƯƠNG IV: MỘT SỐNHẬN XÉT VÀ ĐÁNH GIÁ CÁC PHƯƠNG PHÁP
PHÁT HIỆN BIÊN.62
4.1. Phương pháp phát hiện biên dựa vào kỹthuật Gradient.62
4.2. Phương pháp đạo hàm bậc nhất và phương pháp đạo hàm bậc hai.66
4.3. Đánh giá nhận xét vềphương pháp Canny.69
4.4. Các phương pháp phát hiện biên (phương pháp Gadient, phương pháp
Laplace, phương pháp Canny).71
4.5. Đánh giá nhận xét vềphương pháp Wavelet.73
KẾT LUẬN.75
TÀI LIỆU THAM KHẢO.76
77 trang |
Chia sẻ: maiphuongdc | Lượt xem: 4121 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu một số phương pháp phát hiện biên, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ảnh. Bộ lọc thông
cao dùng nhiều trong trích chọn biên và làm trơn ảnh, còn bộ lọc dải thông có hiệu
quả làm nổi cạnh. Về biên sẽ được trình bày kỹ trong các phần sau. Tuy nhiên, dễ
nhận thấy, biên là điểm có độ biến thiên nhanh về giá trị mức xám theo quan điểm
về tần số tín hiệu. Như vậy, các điểm biên ứng với các thành phần tần số cao. Từ đó,
có thể dùng bộ lọc thông cao để cải thiện nhiễu nghĩa là có thể lọc các thành phần
tần số thấp và giữ lại các thành phần tần số cao. Vì thế, lọc thông cao thường được
dùng làm trơn biên trước khi tiến thành các thao tác với biên ảnh. Dưới đây là một
số mặt nạ dùng trong lọc thông cao:
−
1- 1- 1-
1- 9 1-
1- 1- 1
)1(
0 1- 0
1- 5 1-
0 1- 0
)2(
1 2- 1
2- 5 2-
1 2- 1
)3(
Các nhân chập thông cao có đặc tính chung là tổng các hệ số của bộ lọc bằng
1. Nguyên nhân chính là ngăn cản sự tăng quá giới hạn của các giá trị mức xám (các
giá trị điểm ảnh vẫn giữ được giá trị của nó một cách gần đúng không thay đổi quá
nhiều với giá trị thực).
1.3. Tổng quan về biên
1.3.1. Biên và các kiểu biên cơ bản
Các đặc trưng của ảnh thường bao gồm các thành phần như: mật độ xám, phân
bố xác suất, phân bố không gian, biên ảnh. Biên là một vấn đề chủ yếu và đặc biệt
quan trọng trong phân tích ảnh vì các kĩ thuật phân đoạn ảnh chủ yếu dựa vào biên.
Hiện nay có nhiều định nghĩa về biên ảnh và mỗi định nghĩa được sử dụng
trong một số trường hợp nhất định. Song nhìn chung, ta có thể hiểu là:
Một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi đột ngột về mức xám.
Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen
có ít nhất một điểm trắng bên cạnh.
24
Tập hợp các điểm biên tạo thành biên, hay còn gọi là đường bao của ảnh
(boundary). Chẳng hạn, trong một ảnh nhị phân, một điểm có thể được gọi là biên
nếu đây là một điểm đen và có ít nhất một điểm trắng nằm trong lân cận điểm đó.
Mỗi một biên là một thuộc tính gắn liền với một điểm riêng biệt và được tính
toán từ những điểm lân cận nó. Đó là một biến Vector bao gồm hai thành phần:
- Độ lớn của Gadient.
- Hướng φ được quay đối với hướng Gradient ψ.
1.3.1.1 Biên lý tưởng
Việc phát hiện biên một cách lý tưởng là việc xác định được tất cả các đường
bao trong đối tượng. Biên là sự thay đổi đột ngột về mức xám nên sự thay đổi cấp
xám giữa các vùng trong ảnh càng lớn thì càng dễ dàng nhận ra biên.
Hình minh hoạ điểm ảnh có sự biến đổi mức xám u(x) một cách đột ngột:
Hình1.4: Đường biên lý tưởng
Một biên được coi đó là biên lý tưởng khi mà có sự thay đổi cấp xám lớn giữa
các vùng trong ảnh. Biên này thường chỉ xuất hiện khi có sự thay đổi cấp xám qua
một điểm ảnh.
1.3.1.2 Biên dốc
Biên dốc xuất hiện khi sự thay đổi cấp xám trải rộng qua nhiều điểm ảnh. Vị
trí của cạnh được xem như vị trí chính giữa của đường dốc nối giữa cấp xám thấp
và cấp xám cao. Tuy nhiên đây chỉ là đường dốc trong toán học, từ khi ảnh được kỹ
u
x
25
thuật số hoá thì đường dốc không còn là đường thẳng mà thành những đường lởm
chởm, không trơn.
Hình 1.5: Đường biên dốc
1.3.1.3 Biên không trơn
Trên thực tế, ảnh thường có biên không lý tưởng, các điểm ảnh trên ảnh
thường có sự thay đổi mức xám đột ngột và không đồng nhất, đặc biệt là ảnh nhiễu.
Trong trường hợp không nhiễu (biên lý tưởng), bất cứ một sự thay đổi cấp xám nào
cũng thông báo sự tồn tại của một biên. Trường hợp đó khó có khả năng xảy ra, ảnh
thường là không lý tưởng, có thể là do các nguyên nhân sau:
- Hình dạng không sắc nét.
- Nhiễu: do một loạt các yếu tố như: kiểu thiết bị nhập ảnh, cường độ ánh
sáng, nhiệt độ, hiệu ứng áp suất, chuyển động, bụi…, chưa chắc rằng hai điểm ảnh
có cùng giá trị cấp xám khi được nhập lại có cùng cấp xám đó trong ảnh. Kết quả
của nhiễu trên ảnh gây ra một sự biến thiên ngẫu nhiên giữa các điểm ảnh. Sự xuất
hiện ngẫu nhiên của các điểm ảnh có mức xám chênh lệch cao làm cho các đường
biên dốc trở lên không trơn chu mà trở thành các đường biên gồ ghề, mấp mô,
không nhẵn, đây chính là đường biên trên thực tế.
Ngày nay, những phương pháp phát hiện biên hiện đại thường kết hợp nhiễu
vào trong mô hình của bài toán và trong quá trình phát hiện biên cũng được tính
đến. Còn khái niệm về biên nêu ở trên được sử dụng để xây dựng các phương pháp
phát hiên biên trong quá khứ, những mô hình về cách này được coi là đơn giản và
sơ sài.
u
x
26
Hình1.6: Đường biên không trơn
1.3.2. Vai trò của biên trong nhận dạng
Đường biên là một loại đặc trưng cục bộ tiêu biểu trong phân tích nhận dạng
ảnh. Người ta sử dụng đường biên làm phân cách các vùng xám (màu) cách biệt.
Ngược lại, người ta cũng dùng các vùng ảnh để tìm đường phân cách.
Như đã đề cập tới ở phần tổng quan về một hệ thống nhận dạng và xử lý ảnh,
quá trình nhận dạng có hai giai đoạn cần thực hiện:
- Giai đoạn học: Các đặc điểm của đối tượng mẫu được lưu trữ (gọi là học
mẫu) và tập các phần tử mẫu được chia thành các lớp.
- Giai đoạn nhận dạng: Khi có đối tượng cần nhận dạng, các đặc điểm của đối
tượng sẽ được trích chọn và sử dụng hàm quyết định để xác định đối tượng cần
nhận dạng thuộc lớp nào.
Như vậy, việc nhận dạng sẽ chính xác nếu các đặc điểm được trích chọn chính
xác. Trong thực tế, các đặc điểm trích chọn phục vụ cho việc nhận dạng thường là
các bất biến [7,8,18,26,30,38,45], bởi vì vấn đề cơ bản trong bài toán nhận dạng ảnh
là xác định các đối tượng không phụ thuộc vào vị trí, kích thước và hướng quay.
* Có nhiều loại bất biến được trích chọn như:
- Bất biến thống kê: Các mô men, độ lệch chuẩn của tập ảnh hay các độ đo
thống kê khác không phụ thuộc các phép biến đổi tuyến tính.
- Bất biến hình học: Số đo kích thước của các đối tượng ảnh.
u
x
27
- Bất biến tô-pô: Biểu diễn các cấu trúc tô-pô của các ảnh như số điểm đỉnh, số
lỗ hổng v.v..
- Bất biến đại số: Chu tuyến, phân bố của các điểm ảnh, v.v.. dựa vào các việc
tổ hợp các hệ số của đa thức mô tả đối tượng ảnh.
Các bất biến dùng trong nhận dạng thường được trích chọn từ biên, xương của
đối tượng [3,5,8,18,33,38,39,45,46,48]. Do vậy, việc nhận dạng có hiệu quả hay
không phụ thuộc nhiều vào cách biểu diễn hình dạng và mô tả của vật thể.
28
CHƯƠNG II
CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN CỔ ĐIỂN
Biên là một phần đặc biệt quan trọng trong xử lý ảnh, hầu như trước khi sử
dụng các thuật toán phát hiện biên phải trải qua một bước tiền xử lý, đó là quá trình
loại bỏ nhiễu. Cơ sở của các phép toán phát hiện biên đó là quá trình biến đổi về giá
trị độ sáng của các điểm ảnh. Tại điểm biên sẽ có sự biến đổi đột ngột về mức xám.
Đây chính là cơ sở của kỹ thuật phát hiện biên. Xuất phát từ cơ sở này, có hai
phương pháp phát hiện biên tổng quát, đó là phương pháp phát hiện biên trực tiếp
và phương pháp phát hiện biên gián tiếp.
2.1. Phân loại các kỹ thuật phát hiện biên
2.1.1. Phương pháp phát hiện biên trực tiếp
Phương pháp phát hiện biên này nhằm làm nổi biên dựa vào sự biến thiên về
giá trị độ sáng của điểm ảnh. Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật
đạo hàm.
- Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient.
Phương pháp này bao gồm kỹ thuật Gradient và kỹ thuật la bàn.
- Nếu lấy đạo hàm bậc hai của ảnh ta có phương pháp Laplace.
2.1.2. Phương pháp phát hiện biên gián tiếp
Là quá trình phân vùng dựa vào phép xử lý kết cấu đối tượng, cụ thể là dựa
vào sự biến thiên nhỏ và đồng đều độ sáng của các điểm ảnh thuộc một đối tượng.
Nếu các vùng của ảnh được xác định thì đường phân ranh giữa các vùng đó chính là
biên ảnh cần tìm. Việc phát hiện biên và phân vùng đối tượng là hai bài toán đối
ngẫu. Từ phát hiện biên ta có thể tiến hành phân lớp đối tượng, như vậy là đã phân
29
vùng được ảnh. Và ngược lại, khi đã phân vùng được ảnh nghĩa là đã phân lập được
thành các đối tượng, từ đó có thể phát hiện được biên cần tìm.
Tuy nhiên, phương pháp tìm biên trực tiếp thường sử dụng có hiệu quả vì ít
chịu ảnh hưởng của nhiễu. Song nếu sự biến thiên độ sáng của ảnh là không cao thì
khó có thể phát hiện được biên, trong trường hợp này việc tìm biên theo phương
pháp trực tiếp tỏ ra không đạt được hiệu quả tốt. Phương pháp tìm biên gián tiếp
dựa trên các vùng, đòi hỏi áp dụng lý thuyết về xử lý kết cấu đối tượng phức tạp, vì
thế khó cài đặt, song đạt hiệu quả cao khi sự biến thiên về cường độ sáng là nhỏ.
Trong khuôn khổ bản luận văn này ta đề cập nghiên cứu chủ yếu phương pháp
phát hiện biên trực tiếp.
2.1.3. Quy trình phát hiện biên
Bước 1: Do ảnh ghi được thường có nhiễu, bước một là phải lọc nhiễu theo các
phương pháp đã tìm hiểu ở các phần trước.
Bước 2: Làm nổi biên sử dụng các toán tử phát hiện biên.
Bước 3: Định vị biên. Chú ý rằng kỹ thuật nổi biên gây tác dụng phụ là gây
nhiễu làm một số biên giả xuất hiện do vậy cần loại bỏ biên giả.
Bước 4: Liên kết và trích chọn biên.
2.2. Kỹ thuật phát hiện biên Gradient
Kỹ thuật Gradient là kỹ thuật dò biên cục bộ dựa vào cực đại của đạo hàm.
Đây là phép toán lấy đạo hàm bậc nhất trong không gian hai chiều.
Theo định nghĩa Gradient là một véctơ có các thành phần biểu thị tốc độ thay
đổi giá trị của điểm ảnh, ta có:
dy
)y,x(f)dxy,x(f)y(f
y
)y,x(f
dx
)y,x(f)y,dxx(f)x(f
x
)y,x(f
−+≈=∂
∂
−+≈=∂
∂
Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng x, y tương ứng
(thực tế chọn dx= dy=1). Đây là phương pháp dựa theo đạo hàm riêng bậc nhất theo
30
hướng x, y.
Theo định nghĩa về Gradient, nếu áp dụng nó vào xử lý ảnh, việc tính toán sẽ
rất phức tạp. Để đơn giản mà không mất tính chất của phương pháp Gradient, người
ta sử dụng kỹ thuật Gradient dùng cặp mặt nạ H1, H2 trực giao (theo 2 hướng vuông
góc).
Việc xấp xỉ đạo hàm bậc nhất theo các hướng x và y được thực hiện thông
qua 2 mặt nạ nhân chập tương ứng sẽ cho ta các kỹ thuật phát hiện biên khác nhau.
2.2.1. Pixel difference
Đây là bộ lọc cơ bản dựa theo kỹ thuật Gradient, bộ lọc này áp dụng phương
thức so sánh giữa điểm ảnh đang xét với một điểm lân cận nó (sự khác nhau giữa
các điểm ảnh). Vì thế mặt nạ được sử dụng ở đây là hai mặt nạ Hx và Hy biểu thị
theo hai hướng dọc (mặt nạ theo hướng x) và ngang (mặt nạ theo hướng y) như sau:
−=
0 0 0
1 1 0
0 0 0
Hx
=
0 0 0
0 1 0
0 1- 0
Hy
Như vậy kỹ thuật phát hiện biên theo phương pháp này được thực hiện như
sau: Sử dụng phép nhân cuộn di chuyển 2 mặt nạ trên ảnh cần tìm biên sao cho tâm
chính giữa của mặt nạ trùng với điểm ảnh đang xét.
Độ lớn Gradient tại điểm (i,j) được tính theo công thức:
[ ] 2y2x GG)j,i(fG +=
Để giảm thời gian tính toán và độ phức tạp ta có xấp xỉ:
G[f(i,j)] ≈ Gx + Gy
⇔ G[f(i,j)] = f(i,j) - f(i+1,j) + f(i,j) - f(i,j-1)
Ta có kết quả tìm biên theo kỹ thuật này như sau:
31
a) Ảnh gốc b) Ảnh biên
Hình 2.1: Biên ảnh với Pixel difference
2.2.2. Separated Pixel Difference
Đây cũng là một bộ lọc cơ bản dựa theo kỹ thuật Gradient, song bộ lọc này có
khác một chút so với bộ lọc Pixel diference, nó so sánh sự khác nhau giữa các điểm
ảnh và ở đây là hai điểm ảnh ở hai bên của điểm ảnh đang xét.
Toán tử này sử dụng mặt nạ 3 x 3, bao gồm hai mặt nạ H1 (theo chiều x) và
H2 (theo chiều y) biểu thị theo hai hướng dọc và ngang như sau:
−=
0 0 0
1 0 1
0 0 0
Hx
=
0 1 0
0 0 0
0 1- 0
Hy
Sử dụng phép nhân cuộn di chuyển 2 mặt nạ trên ảnh cần tìm biên sao cho tâm
chính giữa của mặt nạ trùng với điểm ảnh đang xét.
Giá trị điểm ảnh mới sau khi thực hiện Gradient tại điểm (i,j) được tính theo
công thức:
[ ] 2y2x GG)j,i(fG +=
G[f(i,j)] ≈ Gx + Gy
⇔ G[f(i,j)] = f(i-1,j) - f(i+1,j) + f(i,j+1) - f(i,j-1)
Ta có kết quả tìm biên theo kỹ thuật này như sau:
32
a) Ảnh gốc b) Ảnh biên
Hình 2.2: Biên ảnh với Separated Pixel difference
2.2.3. Toán tử Robert (1965)
Trong phương pháp này hai mặt nạ được sử dụng để nhân xoắn là Hx và Hy.
Phương pháp này gần giống với phương pháp Pixel difference nhưng phương pháp
này thực hiện theo hai hướng -45 độ và +45 độ, chứ không theo hai hướng x và y.
=
0 1
1- 0
Hx
=
1 0
0 1-
Hy
Chiều dài đường biên ảnh có thể rút ra bằng cách dùng bất kỳ phép xử lý
tuyến tính nào sau đây:
2
2
2
1 )j,i(y)j,i(y)j,i(y +=
{ }
{ })j,i(y)j,i(y)j,i(y
)j,i(y,)j,i(ymax)j,i(y
21
21
+=
=
Trong đó: y1(i,j) và y2(i,j) là đáp ứng rút ra từ mẫu Hx và Hy
Các phần tử trong mặt nạ gọi là trọng số. Di chuyển lần lượt các mặt nạ trên
ảnh đang xét sao cho phần tử đầu tiên của mặt nạ trùng với phần tử (i,j) đang xét
trên ảnh. Từ đó cho ra kết quả của ảnh mới theo phương pháp này.
Như vậy, ta có kết quả Gradient tại một điểm ảnh (i,j):
y(i,j)= |y(i,j+1)- y(i+1,j)| + |y(i,j)+y(i+1,j+1)|
Kết quả của toán tử Robert sau khi tiến hành tách biên:
33
a) Ảnh gốc b) Ảnh biên
Hình 2.3: Biên ảnh với toán tử Robert
2.2.4. Toán tử Prewitt
Toán tử được Prewitt đưa ra vào năm 1970 có dạng:
=
1 0 1-
2 0 2 -
1 0 1-
Hx
=
1 2 1
0 0 0
1- 2- 1-
Hx
a) Ảnh gốc b) Ảnh biên
Hình 2.4: Biên ảnh với toán tử Prewitt
2.2.5. Toán tử (mặt nạ) Sobel
Toán tử Sobel được Duda và Hart đặt ra năm 1973 với các mặt nạ tương tự
như của Robert nhưng khác cấu hình:
34
=
1 0 1-
1 0 1-
1 0 1-
Hx
=
1 1 1
0 0 0
1- 1- 1-
Hy
a) Ảnh gốc b) Ảnh biên
Hình 2.5: Biên ảnh với toán tử Sobel
2.2.6. Toán tử Frie-Chen
Phương pháp Frie-Chen được thiết kế xấp xỉ đạo hàm Gradient rời rạc. Mặt nạ
Frie-Chen xử lý có hình dạng như sau:
=
1- 0 1
2 - 0 2
1- 0 1
Hx
=
1 2 1
0 0 0
1- 2- 1-
Hy
a) Ảnh gốc b) Ảnh biên
Hình 2.6: Biên ảnh với toán tử Frie-Chen
2.2.7. Toán tử Boxcar
35
Một hạn chế chung đối với toán tử Gradient là không có khả năng phát hiện
biên trong môi trường nhiều nhiễu. Điều này đặt ra vấn đề làm giảm bớt bằng việc
mở rộng thêm kích thước của toán tử ra các khu lân cận thông qua vi phân đường
dốc.
=
1- 1- 1- 0 1 1 1
1- 1- 1- 0 1 1 1
1- 1- 1- 0 1 1 1
1- 1- 1- 0 1 1 1
1- 1- 1- 0 1 1 1
1- 1- 1- 0 1 1 1
1- 1- 1- 0 1 1 1
Hx
=
1 1 1 1 1 1 1
1 1 1 1 1 1 1
1 1 1 1 1 1 1
0 0 0 0 0 0 0
1- 1- 1- 1- 1- 1- 1-
1- 1- 1- 1- 1- 1- 1-
1- 1- 1- 1- 1- 1- 1-
Hy
a) Ảnh gốc b) Ảnh biên
Hình 2.7: Biên ảnh với toán tử Boxcar
2.2.8. Toán tử Truncated Pyramid
Abdou đã đưa ra ý tưởng dùng thao tác hình chóp nón cụt cho bộ lọc tuyến
tính. Toán tử được đưa ra ứng với hai chiều x và y như sau:
36
=
1- 1- 1- 0 1 1 1
1- 2- 2- 0 2 2 1
1- 2- 3- 0 3 2 1
1- 2- 3- 0 3 2 1
1- 2- 3- 0 3 2 1
1- 2- 2- 0 2 2 1
1- 1- 1- 0 1 1 1
Hx
=
1 1 1 1 1 1 1
1 2 2 2 2 2 1
1 2 3 3 3 2 1
0 0 0 0 0 0 0
1- 2- 3- 3- 3- 2- 1-
1- 2- 2- 2- 2- 2- 1-
1- 1- 1- 1- 1- 1- 1-
Hy
a) Ảnh gốc b) Ảnh biên
Hình 2.8: Biên ảnh với toán tử Truncated Pyramid
2.3. Các toán tử la bàn
Trong phương pháp Gradient, người ta chia nhỏ thành hai kỹ thuật (do dùng
hai toán tử khác nhau). Đó là kỹ thuật Gradient và kỹ thuật la bàn.
- Kỹ thuật Gradient như đã trình bày ở phần trước, kỹ thuật này dùng toán tử
Gradient lấy đạo hàm theo một hướng.
- Kỹ thuật la bàn dùng toán tử la bàn lấy đạo hàm theo tám hướng: Bắc, nam,
đông , tây, đông bắc, tây bắc, đông nam, tây nam.
37
Toán tử la bàn do Gradient dựa trên sự đánh giá tất cả các hướng có thể của
một đường biên ảnh trong một ảnh rời rạc. Bởi vậy thay vì chỉ áp dụng hai mặt nạ
như các toán tử trong kỹ thuật Gradient ở trên, tám mặt nạ đã được dùng, mỗi cái
cung cấp một cạnh đường biên dọc theo một trong tám hướng có thể của vòng.
Như vậy, mỗi điểm ảnh đầu ra là giá trị lớn nhất trong tám kết quả nhân xoắn
của mặt nạ với ma trận ảnh. Sau mỗi lần nhân xoắn, ta quay mặt nạ này đi một góc
450 ngược chiều kim đồng hồ : 00, 450, 900, 1350, 1800, 2250, 2700, 3150.
2.3.1 Toán tử la bàn Kirsh
Phép toán này được xem như là các toán tử thuần nhất. Nó tạo ra một sự thay
đổi nhỏ trong Gradient và tạo ra các sự so sánh lần lượt như các phương pháp trên.
Các mặt nạ được sử dụng như sau:
HĐông-Bắc =
3- 3- 3-
5 0 3-
5 5 3-
HBắc =
3- 3- 3-
3- 0 3-
5 5 5
HĐông=
5 3- 3-
5 0 3-
5 3- 3-
HĐông-Nam =
5 5 3-
5 0 3-
3- 3- 3-
HNam =
5 5 5
3- 0 3-
3- 3- 3-
HTây =
3- 3- 5
3- 0 5
3- 3- 5
HTây-Nam =
3- 5 5
3- 0 5
3- 3- 3-
HTây-Bắc =
3- 3- 3-
3- 0 5
3- 5 5
Để tìm ra biên ảnh, mỗi điểm ảnh được nhân xoắn với tất cả các mặt nạ (tâm
của mặt nạ trùng với điểm ảnh đang xét). Kết quả của toán tử tại mỗi điểm là giá trị
lớn nhất trong tám kết quả của việc nhân xoắn.
Ký hiệu Ai; i = 1,2,....,8 là Gradient theo 8 hướng như 8 mặt nạ kể trên, khi đó
biên độ Gradient tại điểm ảnh (x,y) được tính theo:
A(x,y) = Max(gi(x,y)) i = 1,2,...,8
38
a) Ảnh gốc b) Ảnh biên
Hình 2.9: Biên ảnh với toán tử Kirsh
2.3.2 Toán tử la bàn Prewitt
Cũng giống như toán tử la bàn Kirsh, toán tử la bàn Prewitt đưa ra các mặt nạ
nhân cuộn theo 8 hướng khác nhau. Giá trị độ lớn của điểm ảnh mới được thực hiện
như Kirsh. Các mặt nạ có dạng như sau:
HĐông-Bắc =
1 1 1
1- 2- 1
1- 1 - 1
HBắc =
1 1 1
1 2- 1
1- 1 - 1-
HĐông =
1- 1 1
1- 2- 1
1- 1 1
HĐông-Nam =
1- 1- 1
1- 2- 1
1 1 1
HNam =
1- 1- 1 -
1 2- 1
1 1 1
HTây =
1 1 1 -
1 2- 1 -
1 1 1-
HTây-Nam =
1 1 1 -
1 2- 1 -
1 1 1-
HTây-Bắc =
1 1 1
1 2- 1 -
1 1 - 1-
39
a) Ảnh gốc b) Ảnh biên
Hình 2.10: Biên ảnh với toán tử la bàn Prewitt
2.3.3. Robinson 3 - Level
Cũng giống như các toán tử la bàn ở trên. Robinson 3 - Level được phát triển
từ toán tử Prewitt. Các mặt nạ có dạng như sau:
HĐông-Bắc =
1- 1- 0
1- 0 1
0 1 1
HBắc =
1 1 1
0 0 0
1- 1- 1 -
HĐông =
1- 0 1
1- 0 1
1- 0 1
HĐông-Nam =
0 1 1
1- 0 1
1- 1 - 0
HNam =
1- 1- 1 -
0 0 0
1 1 1
HTây =
1 1 0
1 0 1 -
0 1- 1-
HTây-Nam =
1 0 1-
1 0 1-
1 0 1 -
HTây-Bắc =
0 1- 1-
0 1 1
1 1 0
Do tính đối xứng nên trong bộ mặt nạ trên ta chỉ cần sử dụng 4 mặt nạ là đủ.
40
a) Ảnh gốc b) Ảnh biên
Hình 2.11: Biên ảnh với toán tử Robinson 3 - level
2.3.4. Robinson 5 - Level
Toán tử Robinson 5 - Level được phát triển từ toán tử Sobel. Các mặt nạ có
dạng như sau:
HĐông-Bắc =
2- 1- 0
1- 0 1
0 1 2
HBắc =
1 2 1
0 0 0
1- 2- 1 -
HĐông =
1- 0 1
2- 0 2
1- 0 1
HĐông-Nam =
0 1 2
1- 0 1
2- 1 - 0
HNam =
1- 2- 1 -
0 0 0
1 2 1
HTây =
2 1 0
1 0 1 -
0 1- 2-
HTây-Nam =
2 0 1-
1 0 2-
1 0 1 -
HTây-Bắc =
0 1- 2-
0 1 1-
2 1 0
Do tính đối xứng nên trong bộ mặt nạ này ta cũng chỉ cần sử dụng 4 mặt nạ là
đủ.
41
a) Ảnh gốc b) Ảnh biên
Hình 2.12: Biên ảnh với toán tử Robinson 5 - level
2.4. Kỹ thuật phát hiện biên Laplace
Để khắc phục hạn chế và nhược điểm của phương pháp Gradient, trong đó sử
dụng đạo hàm riêng bậc nhất người ta nghĩ đến việc sử dụng đạo hàm riêng bậc hai
hay toán tử Laplace. Phương pháp dò biên theo toán tử Laplace hiệu quả hơn
phương pháp toán tử Gradient trong trường hợp mức xám biến đổi chậm, miền
chuyển đổi mức xám có độ trải rộng.
Toán tử Laplace được xác định như sau:
2
2
2
2
2
y
f
x
ff ∂
∂+∂
∂=∇
Toán tử Laplace dùng một số kiểu mặt nạ khác nhau nhằm tính gần đúng đạo
hàm riêng bậc hai. Các dạng mặt nạ theo toán tử Laplace bậc 3x3 có thể:
)1y,x(f)1y,x(f)y,x(f2
y
f
)y,1x(f)y,1x(f)y,x(f2
x
f
2
2
2
2
+−−−=∂
∂
+−−−=∂
∂
)1y,x(f)y,1x(f)1y,x(f)y,1x(f)y,x(f4
y
f
x
ff 2
2
2
2
2 +−+−−−−−=∂
∂+∂
∂=∇
Từ đó ta đưa ra được mặt nạ nhân chập của phương pháp đạo hàm bậc hai. Kết
quả này cho ra mặt nạ thứ ba gọi là phương pháp Four - neighbor Laplace (sử dụng
bốn láng giềng).
42
Toán tử Laplace dùng nhiều kiểu mặt nạ khác nhau để xấp xỉ rời rạc đạo hàm
bậc hai. Dưới đây là ba kiểu mặt nạ hay dùng:
H1 =
0 1- 0
1- 4 1-
0 1- 0
H2 =
1- 1- 1-
1- 8 1-
1- 1- 1-
H3 =
1 2- 1
2- 4 2-
1 2- 1
Giả sử có ảnh I, khi đó tìm biên ảnh bằng cách lấy đạo hàm bậc 2 của ảnh I
(phương pháp Laplace) nghĩa là nhân cuộn ảnh I với một trong 3 mặt nạ trên:
Ikq = I ⊗ H
Kết quả mô phỏng được thể hiện như hình sau:
a) Ảnh gốc b) Ảnh biên
Hình 2.13: Biên ảnh với kỹ thuật Laplace
Tuy nhiên kết quả thực nghiệm cho thấy, do thực hiện phương pháp đạo hàm
bậc hai cho nên kết quả rất nhạy cảm với nhiễu, để khắc phục nhược điểm này
người ta mở rộng toán tử Laplace. Dùng hàm Gauss để giảm nhiễu cho ảnh (làm
trơn ảnh).
* Phương pháp Laplace of Gauss:
Hình 2.14: Bộ lọc Laplace of Gauss
Smooth
Laplacian O(x,y) I(x,y)
43
Phương pháp này thực hiện như sau:
- Làm trơn ảnh với bộ lọc Gauss
- Tìm điểm cắt không (áp dụng bộ lọc Laplace)
Ảnh kết quả:
))y,x(G*)y,x(I()y,x(O 2∇=
- Hàm Gauss:
+ Trong 1D
2
2
2
x
-
e (x)g σ=
Đạo hàm bậc nhất của Gauss:
2
2
2
2
2
x
2
2
x
2 e
xxe2
2
1- (x)'g σ
−σ−
σ=σ=
Đạo hàm bậc nhất của Gauss:
g"(x) = 2
2
2
x
3
2
e)1x( σ
−
σ−σ
+ Trong 2D:
g(x,y) = 2
22
2
yx
e
2
1 σ
+−
σπ
logσ=
2
22
2
yx
2
22
4 e2
yx11 σ
+−
σ
+−πσ
Quá trình thực hiện:
Bước 1: Làm trơn ảnh
Để giảm bớt nhiễu cho ảnh, ta tiến hành làm trơn ảnh bằng bộ lọc Gauss. Việc
làm trơn ảnh được thực hiện bằng cách tiến hành nhân xoắn ảnh với bộ lọc Gauss.
S = I * g(x,y) = g(x,y) * I
Bộ lọc Gauss có thể được xấp xỉ là các bộ lọc với kích thước ma trận khác
nhau với các σ khác nhau.
Như vậy để thực hiện bước 1: Ta tiến hành nhân xoắn ảnh cần xử lý với bộ
lọc Gauss giống như cách thức nhân xoắn của các toán tử ta đã thực hiện ở trên. Kết
quả sau khi tiến hành bước này ảnh được làm trơn. Điều này đặc biệt có tác dụng tốt
44
với ảnh nhiễu, bước này làm mờ đi ảnh cần xử lý, nghĩa là các điểm nhiễu cũng bị
làm mờ đi trong khi những cạnh chính thì vẫn tồn tại.
Bước 2: Tiến hành đạo hàm bậc hai
Kết quả nhận được ở bước 1 là ảnh sau khi làm trơn đã loại bỏ bớt được
nhiễu. Để thực hiện phương pháp Laplace of Gauss, ta tiến hành đạo hàm bậc hai
kết quả ở bước 1. Việc đạo hàm kết quả này tương tự như việc ta tiến hành nhân
xoắn ảnh kết quả ở bước 1 với một mặt nạ nhân xoắn được tính toán từ phương
pháp Laplace.
Đạo hàm bậc 2 theo hướng x Đạo hàm bậc 2 theo hướng y
∆2S = S
x 2
2
∂
∂ + S
y2
2
∂
∂
∆2S =∆2(g* I) = (∆2g)* I
∆2g = 2
22
2
yx
2
22
3
e
2
yx2
2
1 σ
+−
σ
+−σπ
Song ở bước thứ nhất ta tiến hành nhân ảnh với bộ lọc Gauss, nên ở đây ta chỉ
phải đạo hàm ảnh S (không sử dụng công thức đạo hàm Gauss). Vì vậy, ta tiến hành
nhân ảnh sau khi làm trơn với một trong ba mặt nạ nhân xoắn của Laplace.
a) Ảnh gốc b) Ảnh biên
Hình 2.15: Biên ảnh với kỹ thuật Laplace of Gauss
45
CHƯƠNG III
CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN NÂNG CAO
3.1. Phương pháp Canny
Phương pháp này do John Canny ở phòng thí nghiệm MIT khởi xướng vào
năm 1986. Canny đã đưa một tập hợp các ràng buộc mà một phương pháp phát hiện
biên phải đạt được. Ông đã trình bày một phương pháp tối ưu nhất để thực hiện
được các ràng buộc đó. Và phương pháp này được gọi là phương pháp Canny.
3.1.1. Cơ sở lý thuyết thuật toán
Ý tưởng thuật toán: Ý tưởng của phương pháp này là định vị đúng vị trí bằng
cách cực tiểu hoá phương sai δ2 của vị trí các điểm cắt "Zero" hoặc hạn chế số điểm
cực trị cục bộ để chỉ tạo ra một đường bao.
Các ràng buộc mà phương pháp phát hiện biên Canny đã thực hiện được đó là:
mức lỗi, định vị và hiệu suất. Trong đó:
- Mức lỗi: có ý nghĩa là một phương pháp phát hiện biên chỉ và phải tìm tất cả
các biên, không biên nào được tìm bị lỗi.
- Định vị: Điều này nói đến độ chênh lệch cấp xám giữa các điểm trên cùng
một biên phả
Các file đính kèm theo tài liệu này:
- doc519.pdf