Mục Lục
Lời cam đoan . 2
Mục Lục . 3
Danh Mục Các từ viết tắt. 6
Danh mục hình vẽ. 7
Lời nói đầu . 9
Chương 1:Tổng quan về tìm kiếm ảnh dựa trên hình dạng .
1.1. Giới thiệu.12
1.2. Trích chọn đặc trưng.13
1.2.1.Biến đổiFourier . 12
1.2.1.1.Chuỗi Fourier. 13
1.2.1.2. Sự hội tụ của chuỗi Fourier. 14
1.2.1.3. Biến đổi Fourier . 14
1.2.1.4. Biến đổi Fourier rời rạc . 15
1.2.1.5. Biến đổi Fourier hai chiều . 16
1.2.1.6. Phạm vi của biến đổi Fourier. 16
1.2.2. Không gian độ chia (Scale space). 17
1.2.2.1. Cơ sở . 17
1.2.2.2. Không gian độ chia Gaussian . 19
1.2.2.3. Phạm vi của sự không tạo các đặc trưng mới . 19
1.2.2.4. Không gian độ chia mâu thuẫn với việc đaquyết định . 20
1.2.3.Thảoluận . 22
1.3. Phép đo tương đương và thực hiện phép đo.22
1.3.1. Phép đo sự giống nhau. 23
1.3.1.1. Không gian phép đo khoảng cách (Distance Metric Spaces) . 24
1.3.1.2. Khoảng cáchdạng Minkowski . 24
1.3.1.3. Khoảng cách Cosin . 24
1.3.1.4. Thông tin thống kê 2? . 25
1.3.1.5. Đường giao biểu đồ . 25
1.3.1.6. Khoảng cách bậc hai. 26
1.3.1.7. Khoảng cáchMahalanobis . 27
1.3.2.Thực hiệnphép đo . 27
1.3.2.1. Độ nhạy và độ chính xác(RPP). . 28
1.3.2.2. Tỷ lệ trọng số thành công (PWHư Percentage of Weighted Hits) . 28
1.3.2.3. Phần trăm của thứ bậc giống nhau (PSRưPercentage of Similarity Ranking ) . 29
1.3.2.4. Thảo luận . 30
1.3.3. Trích chọn đặc trưng hình dạng. 30
1.4. Thảo luận.32
Chương 2 Phương pháp tách contrario . 33
2.1. Cluster có thứ bậc và đánh giá giá trị.34
2.1.1.Giá trị nhómContrario . 34
2.1.1.1. Cơ sở: . 34
2.1.1.2. Nhóm có ý nghĩa. . 35
2.1.2. Tiêu chuẩn kết hợp tốt nhất. . 37
2.1.3. Vấn đềtính toán . 40
2.1.3.1. Lựa chọn vùng thử. . 40
2.1.3.2. Riêng rẽvà cực đại. . 42
2.2.1. Nhiễu điểm . 43
2.2.2. Phânđoạn . 43
2.3. Kết cấu nhóm và không gian tương ứng.46
2.3.1. Tại sao phải táchkết cấu không gian. . 46
2.3.2. Đối sánh nhân tố hình dạng. 47
2.3.3. Biến đổi mô tả. 49
2.3.3.1. Trường hợp tương đồng. 49
2.3.3.2. Trường hợp biến đổi mối quan hệ . 50
2.3.4. Cluster có ý nghĩa của biến đổi. 52
2.3.4.1. Phép đo sự không tương đương giữa các biến đổi. . 52
2.3.4.2 Phương thức nền . 52
2.3.4.3. Kỹ thuật nhóm . 54
2.4. Thảo luận.55
Chương 3:Phương pháp ra quyết định Contrario . 56
3.1. Một quyết định Contrario . 58
3.1.1. Phương pháp hình dạng trái ngược phương pháp nền . 58
3.1.2. Phương thức quyết định Contrario. 59
3.1.3. Ước lượng xác suất cảnh báo sai . 61
3.1.4. Luật ra quyết định Contrario . 61
3.2. Tự động thiết lập ngưỡng khoảng cách . 62
3.2.1. Số các cảnh báo sai NFA . 62
3.2.2. Đối sánh có ý nghĩa . 63
3.2.3. Ngưỡng nhận dạng tương ứng với ngữ cảnh. 64
3.2.4. Tại sao quyết định Contrario . 65
3.3. Xây dựng đặc trưng độc lập thống kê. 66
3.4.Chuẩn hóa nhân tố hình dạng từ ảnh cho đặc trưng độc lập. 68
3.4.1. Biểu diễn hình dạng bằng các mức đường. 68
3.4.2.Tiêu chuẩn hóa vàmã hóa bán cục bộ. 70
3.4.2.1. Mã hóa / Tiêu chuẩn hóa trị không đổi tương đương . 71
3.4.2.2. Mã hóa / Chuẩn hóa quan hệ bất biến . 73
3.4.3. Từ chuẩn hóa nhân tố hình dạng đến đặc trưng độc lập. . 73
3.5. Thảo luận . 76
Chương 4Thử nghiệm . 78
4.1. Thử nghiệm phương pháp nền.78
4.2. Thử nghiệm phương pháp Contrario.80
4.2.1. Hai ảnh không quan hệ với nhau . 80
4.2.2. Méo dạng quan sát xa gần . 81
4.2.3. Quan hệ với sự nghẽn cục bộ và thay đổi độ tương phản . 83
Kết luận . 88
Tài liệu thamkhảo . 89
Tóm tắt luận văn .
90 trang |
Chia sẻ: maiphuongdc | Lượt xem: 1571 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu phương pháp nhận dạng hình dạng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
π là một vấn đề cụ thể tổng quan đ−a ra một xác suất biết
tr−ớc hoặc có thể −ớc l−ợng theo kinh nghiệm trên tập dữ liệu.
Định nghĩa 2.1: Một xử lý nền là một xử lý các điểm có hạn (Xi) i= 1...M
trong E từ các biến độc lập với nhau, định dạng phân bố theo luật π.
Trình bày tập dữ liệu của M điểm (x1, x 2,... xM) trong E
M , một tập phụ của
tập dữ liệu sẽ là nhóm có nghĩa nếu các điểm quan trọng thuộc vào một vùng rất
nhỏ, ở đó xác suất của những điểm này rất nhỏ. Vì vậy, cơ sở của ph−ơng thức
Contrario là trái với giả thiết d−ới đây:
(A): mô tả M ∈ Xi (i = 1,…. M) là một xử lý nền thực sự.
Giả thiết cho khoảng cách E = (0,1)2 và π đồng dạng luật E. Đem M điểm
trong E = (0,1)2; nó luôn có thể tìm một kết nối tập R với xác suất nhỏ tuỳ ý π(R)
bao hàm trong mọi tập dữ liệu điểm. Trong thực tế, định nghĩa một nhóm có
nghĩa sẽ bao hàm tổng có hạn các vùng phụ.
2.1.1.2. Nhóm có ý nghĩa.
Đề cập một vùng R∈E bao gồm vùng gốc, giả thiết k điểm trong số x1...xM
phụ thuộc vùng có dạng xj + R, cho 1≤ j ≤ M, nếu k đủ lớn, và π(xj + R) đủ nhỏ,
chúng sẽ mô tả một tập hợp điểm trong vùng xj + R. Nhóm các điểm này sẽ đ−ợc
tách trong xj + R, bằng ph−ơng pháp trái ng−ợc với ph−ơng pháp nền.
Giả thiết các điểm thay đổi, nhóm có thể đ−ợc gộp lại quanh điểm xj bất
kỳ và có hình dạng bất kỳ. Fix cứng xác suất cho tr−ớc, vùng R sẽ phải thuộc vào
tập vùng gốc R có giới hạn, nó sẽ đ−ợc mô tả kỹ hơn. Giả thiết đơn giản hơn R giới
hạn các dự tuyển #R và với mọi R∈R, O∈ R. k ≤ M ∈ N và 0 ≤ p ≤ 1
- 36 -
Dạng luật nhị phân xử lý nền X1...X M và vùng R ∈ E với xác suất π (R), 1 có
thể giải thích nh− xác suất tại điểm cuối k ngoài các điểm M của việc xử lý vào
trong tập R. Mặc dù nghiên cứu dạng nhị thức và chúng sử dụng trong tách cấu trúc
hình học có thể tìm thấy.
Cho 1 ≤ j ≤ M và R' ∈ R
Chú ý:
X = (X1...XM): xử lý nền.
Xj = (X1... XM): Xj thành phần bị thiếu.
K (Xj, Xj, R
'): số các điểm trong danh sách Xj phụ thuộc Xj + R
'.
Định nghĩa 2.2: Đặt R là một vùng dạng R = Xj + R
'
j ∈ (1,...,M) và R' ∈ R. Gọi số cách báo sai của R = Xj + R'
Gọi R = Xj + R
' là một vùng ε có nghĩa nếu NFAg(X, j, R') ≤ ε.
Chú ý NFAg(X, j, R') cũng đ−ợc biểu thị bởi NFAg(R). Mục đích của chúng
ta là giới thiệu mở rộng số l−ợng vùng có ý nghĩa ε là nhỏ hơn ε.
Proposition 2.1
Nếu X1...XM là một xử lý nền, sự mở rộng số vùng có nghĩa ε nhỏ hơn ε.
Để tính toán số các cảnh báo lỗi là phép đo sự giống nhau giữa các nhóm
chứa trong vùng R nh− thế nào trong một tập dữ liệu điểm này ẩn chứa trong k điểm
dữ liệu khác. Mức NFAg(R) thấp hơn, (Prop 2.1) thông số điều khiển tách là ε.
Mệnh đề d−ới đây chỉ ra ảnh h−ởng của tham số #R và của thông số quyết
định ε trong kết quả tách biên là rất ít.
Mệnh đề 2.2: Đặt R là một vùng của R
(2.1)
(2.2)
- 37 -
Chú ý: k*(ε) là giá trị nhỏ nhất của điểm trong nhóm có nghĩa ε. Bằng kết quả
dự đoán, quyết định ng−ỡng này chỉ có loga phụ thuộc #R và ε.
Hình 2.2: Nhóm dữ liệu 950 điểm đồng dạng
Hình 2.2 chỉ ra một ví dụ của nhóm dữ liệu bao gồm 950 điểm đồng dạng
phân bố trong một đơn vị vuông và 50 điểm thêm vào xung quanh (0,4;0,4) và
(0,7;0,7) xung quanh 950 điểm; phân bố đồng đều trong một đơn vị vuông. Trong ví
dụ này #R= 2500 (50 kích cỡ khác cho mỗi chiều). Chính xác hai nhóm lớn nhất
đ−ợc tách (hình 2.2) NFA của miền trái thấp hơn 10-8 trong khi NFA bên phải 107
2.1.2. Tiêu chuẩn kết hợp tốt nhất.
Trong mục 2.2.1.2 đã giới thiệu hạn chế không gian của việc kiểm tra vùng từ
Xi+R, Xi là mô tả dữ liệu và R∈ R , một tập hỗn hợp có giới hạn các vùng chứa
vùng gốc trong RD. Độ d− thừa cao khi mỗi vùng có nghĩa lại liên quan tới tập mô tả
biểu diễn các vùng có nghĩa khác.
- 38 -
Hai vùng R ⊂ R', câu hỏi này dễ dàng trả lời bằng việc so sánh NFAg(R) và
NFAg(R'). Vùng có số l−ợng các cách báo sai nhỏ nhất là phù hợp hơn. Một cách
hỏi khác khi 3 hoặc nhiều vùng liên kết với nhau, vì vậy phải yêu cầu một tiêu
chuẩn hỗn hợp. Đầu tiên sẽ định nghĩa số cảnh báo sai cho một cặp vùng. Giá trị
mới này đ−ợc so sánh với NFA của vùng hỗn hợp. Giới thiệu 3 hệ số danh nghĩa.
Chú ý: Số này đ−ợc diễn dịch nh− sau: đặt R1 và R2 là hai vùng tách rời của E
và π1= π (R1), π2 =π (R2) xác suất của chúng à(M, k1 , k2, π1 , π2) là xác suất tại giá
trị nhỏ nhất k1 trong số M điểm và tại điểm thấp nhất k2 trong số M-k1 điểm, theo
thứ tự là vùng R1 và R2. Mục tiêu là định nghĩa 1 NFA mới cho mỗi thành phần.
Đặt 1<i ≠ j <M và R’, R”∈ R. Bây giờ 2 vùng thử Xi + R' và Xj + R'' có thể
giao nhau và phải thực sự với xác suất này. Chú ý: đ−ợc mô tả bằng sự thay đổi hoàn
toàn vai trò i và j:
Định nghĩa 2.3: Gọi số cách báo sai của 2 cặp vùng bất kỳ (Ri, Rj) = (X i+
R', Xj + R
'')
(2.3)
(2.4)
- 39 -
Cặp vùng bất kỳ(Ri,Rj) là có ý nghĩa ε nếu NFAgg(X,i,j,R',R'') < ε, NFAgg
(X,i,j,R',R'') cũ sẽ đ−ợc chứa trong NFAgg (Ri,Rj).
Mệnh đề 2.3: Số cặp vùng lý t−ởng nhỏ hơn ε
Mệnh đề này dẫn tới 2 phép đo kém ý nghĩa: NFA của vùng và NFA của cặp
vùng. Từ số l−ợng vùng có ý nghĩa ε trong ph−ơng thức nền ở trên đề cập tới biên độ
t−ơng tự nhau đ−ợc so sánh để định nghĩa một tiêu chuẩn hỗn hợp
Định nghĩa 2.4 (Vùng riêng biệt): Đặt R1 và R2 là hai vùng riêng biệt và R là
một vùng chứa tất cả các dữ liệu điểm của R1 và R2. Nói rằng R là riêng biệt mối
quan hệ với R1 và R2 nếu:
Tập R là vùng thử và R là một nhân tố của R. R là riêng biệt trong R nếu nó
độc lập quan hệ với mọi cặp vùng (R1, R2) chứa trong R; mỗi R chứa các điểm của
vùng R1, R2 công thức (2.5) giới thiệu một phép thử chủ yếu cho kết cấu một tập hợp
vùng Cluster. Nếu công thức 2.5 không xảy ra vùng thử đ−ợc coi nh− vùng không
có giá trị, có nghĩa vùng thử có thể chia thành nhiều cặp vùng có nghĩa khác trong
Cluster. Lenma tiếp theo sẽ cung cấp sự hữu ích trong việc gia tăng quyết định hỗn
hợp.
Lenma 2.1: Mỗi giá trị k1 và k2 trong (0,…., M). Mỗi k1, k2 ≤ M và mỗi π1 và
π2 [0,1] sao cho π1 + π2 ≤ 1.
Mệnh đề 2.4: Nếu R là riêng biệt với chú ý tới R1 và R2
Từ mệnh đề (2.4) và định nghĩa (2.4)
(2.5)
(2.6)
- 40 -
Bằng Lenma 2.1, với ( ) ( )pkMpkM ,,,,1 ββ ≤− cho mọi M, k, p công thức
biểu diễn nh− sau:
Mệnh đề 2.4 là hữu ích cho tính toán tổng quan, có thể tránh việc phải tính
toán chi tiết 3 phân bố bằng bộ lọc các cluster đó .
2.1.3. Vấn đề tính toán
2.1.3.1. Lựa chọn vùng thử.
Tập đúng của các vùng thử R nh− thế nào? Một vài lý do a > 0, r > 0 và n
∈N đề cập tới tất cả mọi vùng mà chiều dài đ−ờng biên thuộc vào tập {a, ar, ar2,
arn}. Liên hệ với một số vùng thử có nhiều hình dạng kích cỡ khác nhau. Để đơn
giản lựa chọn vùng thử có hình chữ nhật thích hợp với xác suất phân bố p đ−ợc định
nghĩa trên miền chữ nhật E của RD là kết quả kéo căng một chiều t−ơng ứng.
Định nghĩa 2.2: thừa nhận tính toán NFA của bất cứ vùng thử nào tại dữ liệu
điểm. Từ số l−ợng các độ chia là n cho mỗi chiều có MnD vùng tại dữ liệu điểm. Từ
số l−ợng các điểm quan sát khả thi. MnD sẽ rất lớn khi n tăng. Điều này giải thích
tại sao phép thử không thể thực hiện theo cách này. Tốt hơn nên giải quyết cây cấu
trúc của tập dữ liệu điểm mô tả bằng thuật toán tập trung thứ bậc. Tổ chức thứ bậc
dữ liệu đ−ợc sử dụng để giới hạn các vùng thử, bằng thủ tục nh− sau:
B−ớc 1: Bằng việc áp dụng ph−ơng pháp tập trung thứ bậc, ph−ơng pháp này
cung cấp 1 tập hợp các tập con ẩn trong tập hợp điểm. Cấu trúc cây mà trong đó mỗi
nút là một phần của tập dữ liệu và là một ứng viên Cluster. Cây này gọi là
dendgrogram.
Phần lớn các thủ tục đ−ợc thực hiện bởi việc lặp lại thủ tục nhị phân hỗn hợp.
Vì vậy trực tiếp thiết lập cây nhị phân trong mỗi ph−ơng pháp, b−ớc khởi đầu: thiết
lập nút là tập dữ liệu đơn {x1}...{xN}.Tại mỗi giai đoạn xây dựng 2 nút cha của
- 41 -
chúng. Khoảng cách nhóm, Cluster phải đ−ợc lựa chọn địa chỉ học. Trong tr−ờng
hợp mật độ phân bố dữ liệu ít, b−ớc 1có thể khoảng cách nhỏ nhất d(xi, xj) tại xi phụ
thuộc cluster đầu tiên và xj ở b−ớc 2. Các nút của cây đ−ợc tích hợp tất cả các phần
tại tất cả các mức và lớp "cháu" của nút là 2 phần mà đã đ−ợc tích hợp từ đó.
Tại sao mỗi một cấu trúc lại cần thiết, tr−ờng hợp tập các đoạn trong tập dữ
liệu điểm lớn, thừa nhận một cấu trúc cây để giảm bớt việc khảo sát tỉ mỉ nhằm
nghiên cứu một cây phụ tốt nhất đối với cấu trúc cây khởi tạo. Việc giảm bớt này dễ
bị ảnh h−ởng nếu tập các nút của cây khởi tạo bao gồm tất cả các nhóm trong tập dữ
liệu. Sự lựa chọn phép đo chính xác trên tập dữ liệu điểm và của khoảng cách cluster
nguyên phải đ−ợc định rõ cẩn thận.
Đem đến một dendrogram của tập cơ sở dữ liệu điểm, thuật toán d−ới đây
chấp nhận khảo sát tỉ mỉ tất cả các vùng tại dữ liệu điểm và hàm chứa một nút của
dendrogram.
Thuật toán nhóm
Mỗi nút G trong cây cluster hoặc dendrogram.
1- Mỗi điểm x thuộc nút:
a) Tìm vùng nhỏ nhất x + R trung tâm tại điểm này, và chứa các dữ liệu
điểm khác của nút. Gọi k+1 là số điểm dữ liệu mà nó chứa trong.
b) Tính toán NFA của vùng nh− M.# R.B (M-1, k, p (x+R))
2- Kết hợp với nút G của vùng R(G) với mức NFA đ−ợc tính toán thấp
nhất, nó chứa điểm của nút G nh−ng cũng có thể chứa dữ liệu điểm khác.
Từ thuật toán này đ−ợc tính toán, một vùng ứng cử đ−ợc kết hợp với mỗi
nút bằng một chủ ý lạm dụng sự vô hại, chú ý NFAg(G) = NFAg(R(G)). Cách
t−ơng tự, nếu G1 và G2 là một cặp nút và R(G1) và R(G2) là vùng của chúng. Chú
ý NFAgg(G1,G2) = NFAgg(R(G1), R(G2)). Bằng cách này, cây cluster đ−ợc để lại
cho NFAg và cho các cặp nút. Đặt R của vùng dạng R(G) thừa h−ởng từ cấu trúc
ấy.
- 42 -
2.1.3.2. Riêng rẽ và cực đại.
Đối mặt vấn đề có thể có nhiều nhóm có nghĩa bởi ph−ơng pháp tr−ớc,
NFA của chúng đã biết. Có thể cùng tính toán NFA của cặp cluster và so sánh
thô với NFA hợp nhất của chúng. Định nghĩa tiếp theo giới thiệu một cách để lựa
chọn cluster đúng, bằng việc sử dụng dendrogram cluster
Định nghĩa 2.5 ( Cực đại nhóm có nghĩa ε)
Một nút vùng R = R(G) trong R là ý nghĩa ε cực đại nếu và chỉ nếu:
1/ NFAg(R) ≤ ε
2/ R là riêng rẽ quan hệ với mọi cặp của sự xuống dốc.
3/ Mọi sự giảm độc lập R', NFAg(R') ≥ NFAg(R)
4/ Mọi sự tăng độc lập R', NFAg(R') >NFAg(R) hoặc tồn tại một sự giảm
độc lập R'' của R khi NFAg(R'') < NFAg (R'). Ta nói rằng G là vùng ý nghĩa ε lớn
nhất nếu là R(G).
Điều kiện 4 bao hàm R có thể bị từ bỏ cho một vùng rộng hơn nếu vùng đó
không bị áp đặt bởi một sự giảm. áp đặt điều kiện 3 và 4 chắc chắn 2 nhóm vùng
ý nghĩa cực đại khác nhau là riêng rẽ. L−u ý rằng sự riêng biệt đ−ợc yêu cầu chỉ
với mối liên hệ của cặp giảm. Định nghĩa 2.4 đáp ứng lý thuyết nh−ng không đáp
ứng trong thực hành.
2.2. Kinh nghiệm có giá trị: Nhóm đối t−ợng dựa trên đặc tr−ng thành phần
Hiện t−ợng nhóm là cần thiết trong nhận thức của con ng−ời từ đó chúng
đáp ứng cho tổ chức thông tin. Mục tiêu của những kinh nghiệm này để trích
chọn nhóm đối t−ợng trong ảnh, đó là hình dạng hình học mà một vài thành phần
sở hữu. Đ−ờng viền đối t−ợng đ−ợc trích chọn nh− một vài đ−ờng mức t−ơng
giảm trong ảnh, gọi là mức đ−ờng có ý nghĩa ([5] cho mô tả đầy đủ của thủ tục
trích chọn này). Từ những đối t−ợng đ−ợc tách gọi là O1...OM, có thể tính toán
cho chúng một mục D đặc tr−ng (độ chói, h−ớng, độ t−ơng phản...) Nếu k trong
- 43 -
số M đối t−ợng có một vài đặc tr−ng chung, liệu điều gì sẽ xảy ra khi thay đổi
hoạc C nó có đủ để nhóm chúng. Mỗi dữ liệu điểm là một điểm trong tập đ−ờng
viền của RD và ph−ơng pháp đã mô tả ở trên đ−ợc ứng dụng (thực tế, một vài các
ngang cấp nh− góc phụ thuộc vào đơn vị tròn, từ tính chung kỳ phải đ−ợc đặt vào
hàng đội, điều này có thể thực hiện với các cách t−ơng tự).
2.2.1. Nhiễu điểm
Mỗi cái chứa 2 nhóm 25 điểm thêm vào 950 không đồng dạng trong một
đơn vị vuông. Hai nhóm và 2 nhóm đ−ợc chọn với NFAg tốt (<10-7) kinh nghiệm
trong hình 5 chỉ ra sự quan trọng của phân bố tr−ớc dữ liệu điểm. Hai phân bố
khác nhau dẫn tới 2 vùng có ý nghĩa cực đại khác nhau. Nh−ng cả hai mối quan
hệ đều đúng nh−ng lại phụ thuộc vào ngữ nghĩa.
Hình 2.5: Vấn đề quan trọng của phân bố ph−ơng thức nền.
Dữ liệu gốc là hình bên trái. Nó vị trí của 500 điểm trong 0,12 500iid điểm
trong (0; 0,5) x (0; 1) và 25 điểm quanh (0,2; 0,3). Trong phần giữa; 1 phân bố
tr−ớc trong ph−ơng thức nền mang lại đồng dạng. Sau đó, một vùng có ý nghĩa
cực đại và độ rộng đơn đ−ợc tách, bao gồm 793 điểm và lg (NFAg)=44,9. Hình
bên phải, phân bố đ−ợc định nghĩa nh− sản phẩm của phân bố lề theo kinh
nghiệm trong tách dọc và tách ngang. Vùng có ý nghĩa cực đại đơn (-
log10(NFAg) = 1,6) nh−ng bây giờ nó không phù hợp với nhóm nhỏ nhất.
2.2.2. Phân đoạn
- 44 -
Các nhóm đ−ợc nhận thức nh− 1 kết quả cộng tác giữa hai đại l−ợng trong
khác nhau. Hình 2.6 chỉ ra 71 phân đoạn thẳng với h−ớng khác nhau; d−ờng nh−
vị trí phân bố đồng dạng.
Không cluster có ý nghĩa nào đ−ợc tách trong không gian sắp xếp vị trí của
chúng. Trong tất cả các kinh nghiệm, số của kích ảnh hình chữ nhật trong mỗi
lần tách là 50. Vì vậy #R= 50D.
Hình 2.6: phân đoạn ảnh đã scan và 71 đ−ờng mức có mức ý nghĩa cực đại.
Nếu h−ớng đ−ợc lựa chọn nh− một đặc tr−ng (D=1); 8 nhóm có ý nghĩa
cực đại đ−ợc tách; t−ơng ứng với h−ớng đ−ợc biểu diễn rõ nhất. Không một
cluster nào đ−ợc biểu diễn mức (trung tâm) NFAg thấp. Chỉ duy nhất một trong
số các nhóm đó là riêng rẽ nh−ng h−ớng rõ ràng không phải là một nhân tố. Chú
ý, nhóm này không bao gồm tất cả các phân đoạn trung tâm. H−ớng của chúng là
khác nhau, và nhóm của 11phân đoạn không phải là cực đại. Tất cả các nhóm
khác nhau thực sự không đ−ợc cảm nhận bởi vì chúng bị che phủ bởi sự lộn xộn
tạo ra từ tất cả các đối t−ợng khác nhau. Tuy nhiên, một nhóm không thể có đối
t−ợng chúng có một kết cấu phức tạp.
Trong hình 2.7, có 8 nhóm có ý nghĩa cực đại. Thứ tự từ NFAg từ 10-1 đến
10-5 nhóm central không bao gồm tất cả các phân đoạn dọc, bởi vì h−ớng không
chính xác. Từ đó nhóm cực đại bao gồm phân đoạn dọc không bao gồm tất cả các
đối t−ợng centra. Điều có nghĩa một mình h−ớng không ảnh h−ởng tới tách nhóm
- 45 -
này. Nó cho phép tách nhóm tốt, nh−ng vị trí của chúng không đủ kết cấu để tạo
thành kết cấu rõ ràng.
Hình 2.7: Nhóm với mối quan hệ tới h−ớng.
Xem xét khi đề cập tới hai đặc tr−ng (D =2; #R = 2500) trong không gian (sắp
xếp, h−ớng). Hai cluster có ý nghĩa cực đại đ−ợc tìm thấy nh− mong đợi nhóm có
ý nghĩa nhất là nhóm G, 11 phân đoạn dọc. NFAg của nó là 10-1,5 nó không thấp.
Nhóm thứ 2 là chính xác nh−ng ý nghĩa NFAg =0,3 là rất khó khăn. Chúng khó
t−ơng xứng NFAg = 0,3 trong không gian [ y...] sắp xếp va vị trí nhóm trung tâm
G đ−ợc chia thành 2 cluster có ý nghĩa cực đại. Chúng t−ơng ứng với 2 hàng của
phân đoạn sắp xếp G vai trò của tiêu chuẩn hỗn hợp là quyết định ở đây. Trong
không gian (y - coordinate, h−ớng) sự kết hợp tiêu chuẩn cực đại và tiêu chuẩn
hỗn hợp, điều đó có ý nghĩa hơn để mô tả tại cùng một thời điểm 2 hàng của 1
phân đoạn hơn ở trong một nhóm. Đây là trực quan, từ đó chúng ta thực sự thấy 2
hàng của các phân đoạn tại đây. Trái lại không gian (trong sự sắp xếp x, h−ớng) k
tiêu chuẩn hỗn hợp chỉ ra mô tả G có ý nghĩa hơn mô tả hỗn hợp các lớp con của
nó trong dendrogram. Quyết định này vẫn còn thích nghi với mô tả. Không một
nhóm thực tế nào với G có thể là đặc biệt với chú ý tới sắp xếp x. Nhóm t−ơng tự
- 46 -
đ−ợc mô tả trong không gian (x coordinate, y, h−ớng) với mức thấp hơn NFAg
=10-34.
Hình 2.8: nhóm trong không gian(toạ độ x, h−ớng)
Trong hình 2.8, có 2 nhóm có ý nghĩa lớn nhất thời gian này nhóm trung
tâm đ−ợc tách (NFAg = 10-1,5) nh−ng có một nhóm khác (nhóm một phần nhóm
thứ 7 trong hình 2.7). Tuy nhiên NFAg của nó = 0,3 có nghĩa nó là khó có ý
nghĩa. Nếu nhóm đ−ợc thực hiện với mối quan hệ lắp đầy vị trí 2 chiều và h−ớng,
chỉ nhóm trung tâm đ−ợc tách NFAg = 10-3,4.
2.3. Kết cấu nhóm không gian t−ơng ứng
2.3.1. Tại sao phải tách kết cấu không gian.
Hình 2.9, có thể nhận dạng rõ ràng ở vùng trái phía d−ới của ảnh một bức
tranh chi tiết của Picasso. Tuy nhiên, bức tranh đã không hoàn thành và phía d−ới
ảnh bị che lại. Nó cũng bị biến dạng bởi điểm nhìn xa. Tuy nhiên, tốc độ nén là
khác nhau. Nhận dạng hình dạng đ−ợc mô tả từ các điểm nhìn khác nhau và yêu
cầu ngăn chặn cảm nhận trực quan. Bộ mô tả hình dạng đủ rõ ràng, cục bộ hoặc
bán cục bộ. Mô tả hình dạng gọi là nhân tố hình dạng trong phần tiếp theo. Tính
toán thí dụ của một truy vấn hình dạng đ−ợc biểu diễn trong một cảnh, ph−ơng
pháp để nhận dạng nhân tố hình dạng t−ơng tự là có thể. Nó sẽ sẵn sàng cung cấp
một vài cặp chính xác, những cung cấp sai, từ nhân tố hình dạng chỉ cung cấp
thông tin cục bộ, hai đối t−ợng khác có những phần t−ơng tự có thể biểu diễn một
- 47 -
vài nhân tố hình dạng t−ơng ứng. Vì vậy nhận dạng yêu cầu tìm ra tập phù hợp
các cặp, một tập các cặp trong hình dạng tự nhiên.
2.3.2. Đối sánh nhân tố hình dạng
Lợi ích của việc hoàn thành, khái quát từng b−ớc chính của trích chọn đặc
tr−ng hình dạng và thuật toán thích hợp đ−ợc mô tả và mô tả thủ tục nhóm. Mô tả
đầu tiên là đ−ờng viền của đối t−ợng ở mức xám của ảnh rất hợp nhau, cuối cùng
với đoạn các mức đ−ờng (hoặc) đoạn cover không phải luôn đúng: thực vậy, mức
đ−ờng cung cấp một biểu diễn hoàn chỉnh của mức xám ảnh và chúng có nhiều
mức trong kết cấu. Vì vậy b−ớc đầu tiên là lựa chọn một tập nhỏ trong tất cả các
mức đ−ờng của ảnh. Ph−ơng pháp contrario đ−ợc giới thiệu và lựa chọn mức
đ−ờng gọi là đ−ờng viền có ý nghĩa. Nó chấp nhập lựa chọn khoảng 1% mức
đ−ờng của một bức ảnh không mất nội dung hình dạng. Mức đ−ờng này uốn cong
và gặp đ−ờng viền ảnh ở điểm cuối cùng.
Nhận dạng hình dạng là công cụ mạnh, vì thế đ−ờng viền có ý nghĩa phải
chia cắt trong đoạn nhỏ hơn gọi là nhân tố hình dạng. Các hình dạng không đổi
phải yêu cầu mã hóa nhân tố hình dạng không đổi; ph−ơng pháp mã hóa mối
quan hệ không đổi đ−ợc giới thiệu. Chú ý trong một vài tr−ờng hợp, ph−ơng pháp
không đổi t−ơng đ−ơng có thể đủ chính xác, phụ thuộc mức đ−ờng có ý nghĩa,
các khung không đổi trong mối quan hệ cục bộ đ−ợc tính toán trực tiếp dựa trên
mối quan hệ không đổi. Mỗi khung cục bộ định nghĩa một hệ thống tọa độ. Tọa
độ của các điểm của một cung trong hệ thống, tọa độ này có thể không đổi. Hai
đ−ờng cong có độ cong khác nhau trong một biến đổi quan hệ đ−ợc định nghĩa là
hai khung cục bộ khác nhau. Tuy nhiên khi mô tả trong mối quan hệ của hệ
thống tọa độ, chúng phải thiết lập cùng một vị trí. Từ đó chúng định nghĩa một
đoạn cong thông th−ờng gọi là một nhân tố hình dạng có quan hệ không đổi. Một
đ−ờng viền có ý nghĩa th−ờng chứa trong một vài nhân tố hình dạng lấy từ hai
ảnh và hai tập nhân tố hình dạng, làm thế nào tìm thấy nhân tố hình dạng chung.
- 48 -
Từ nhân tố hình dạng đ−ợc chuẩn hoá thực hiện nhận dạng mối quan hệ tự nhiên
bất biến. Một mô tả contrario đ−ợc giới thiệu để t−ơng ứng với nhân tố hình
dạng. Một số l−ợng các cảnh báo sai của sự t−ơng đồng đ−ợc định nghĩa và t−ơng
ứng với số các cảnh báo đ−ợc giữ lại.
Đặt I và I’ là hai ảnh, tham khảo từ ảnh mục tiêu và cảnh. Mỗi cái t−ơng
ứng giữa một nhân tố hình dạng S trong I và một nhân tố hình dạng S’ trong I’,
biến đổi hình dạng( biến đổi mối quan hệ hoặc sự t−ơng đồng ) đ−ợc tính toán
chấp nhận các tham số chứa trong nó nh− thế nào đ−ợc mô tả theo cách −ớc
l−ợng đúng và cung cấp hình dạng t−ơng ứng với một hình dạng có thể thích hợp
mối quan hệ tốt nhất.
Phần này: cung cấp nhân tố hình dạng t−ơng ứng hình dạng đơn đ−ợc
nhóm cùng nhau. Nhóm NFA của chúng nhỏ nên việc tách đáng tin cậy.
Hình 2.9: Thử nghiệm Guernica
Trong hình 2.9, thử nghiệm “ Guernica “. ảnh gốc và mức đ−ờng có ý
nghĩa cực đại [5]. Tất cả các mức nhân tố hình dạng không đổi đ−ợc mã hóa và
chuẩn hoá dựa trên sự phần đậm. Phía trên : ảnh mục tiêu; phía d−ới : ảnh và
cảnh .
- 49 -
Hình 2.10: thử nghiệm “ Guernica “ quan hệ t−ơng ứng ý nghĩa không đổi
Trong hình 2.10, thử nghiệm “ Guernica “ quan hệ t−ơng ứng ý nghĩa
không đổi. Hình này cho thấy biểu diễn nhân tố hình dạng chung cho hai bức ảnh
từ sự hạn chế tạo ra mối quan hệ bị bóp méo nhiều nhân tố hình dạng đ−ợc chuẩn
hóa đ−ờng cong khá giống nhau. Một biến đổi quan hệ xác định t−ơng ứng với sự
thích ứng giữa các nhân tố hình dạng.
2.3.3. Biến đổi mô tả
2.3.3.1. Tr−ờng hợp t−ơng đồng
Đặt S và S’ là hai nhân tố hình dạng t−ơng đồng. Độ chính xác đó là một
nhân tố hình dạng của một đoạn mức đ−ờng đ−ợc chuẩn hoá hóa đã đ−ợc mô tả
trong frame cục bộ ( hình 2.11). Một khung không đổi t−ơng đ−ơng hoàn toàn
đ−ợc xác định bởi hai điểm hoặc một điểm và một vectơ. Biểu diễn này đ−ợc
chọn lựa. Một khung cục bộ mang lại bằng một cặp ( p, v ) p là khung gốc v là
h−ớng và độ chia. Để tính S liên quan tới ( p, v ) và S’ liên quan ( p’, v’) từ S và
S’ t−ơng ứng, chú ý các b−ớc biến đổi sự t−ơng đồng, bây giờ biểu đồ t−ơng đồng
- 50 -
khung cục bộ (p,v) trên (p’,v’) bằng việc hoàn thành các chú ý. Sự t−ơng đồng
đ−ợc tính toán :
Trong hình 2.11, hai đoạn của một mức đ−ờng và khung t−ơng tự của
chúng. Biểu đồ T t−ơng đ−ơng từ R1 → R1’; R2→R2’. Tính toán khung cục bộ (R1
R2) có thể biểu diễn theo:
Hình 2.11: Hai đoạn mức đ−ờng và khung t−ơng ứng
2.3.3.2. Tr−ờng hợp biến đổi mối quan hệ
Đề cập tới tr−ờng hợp bình th−ờng mối quan hệ không đổi. Các đỉêm không
thẳng hàng cần thiết để định nghĩa khung cục bộ. Mối quan hệ thông th−ờng của
một đoạn cung đ−ợc thực hiện bằng bản đồ ba điểm ở đây (R1, R2, R3) trên bộ ba
((0,0), (0,1), (1,0)). Một bộ ba khác (R1’, R2’, R3’); đ−ợc chú ý lại bởi T. Tồn tại
một ma trận M (2 x 2) và duy nhất (tx, ty) ∈R2:
- 51 -
Tính toán
Sự phân tích này là duy nhất và hoàn toàn xác định (θ, ϕ, Sx, Sy) trong
[(0,2π) ì Rì R+ ì R+]. Chú ý quan hệ ( xR1, xR2 ) và cặp ( xR1’ ,xR2’ ) của tọa độ
R1 và R1’. Biến đổi tham số T = (θ, ϕ, Sx, Sy, tx, ty) đ−ợc xác định bằng tính toán
đại số. Đặc tính vectơ T biến đổi thành T không mập mờ, có thể chọn một chủ
tâm t−ơng tự hoặc biến đổi mối quan hệ thêm vào đó từ T đặc tr−ng T, cả hai có
thể đ−ợc nhận dạng. Vì vậy viết lại X ∈ R2, T(x) thay thế T(x).
Trong hình 2.12 : chỉ ra biến đổi 2-D điểm, Tk t−ơng ứng với quan hệ “
Guernica “ ý nghĩa không đổi ở hình 2.13. Hình 2.12 : thử nghiệm “ Guernica “.
Mỗi biểu diễn một mối quan hệ biến đổi với một đối sánh mối quan hệ ý nghĩa
không đổi mô tả bằng sáu tham số. Mỗi hình biểu diễn hai chiều cho các điểm,
mối quan hệ tx và ty ( tọa độ), Biến đổi : θ (góc quay), ϕ (shear), ln(Sx) và ln(Sy) (
zoom vào x và y) trực tiếp (tọa độ). Nhiễu là do nhân tố hình dạng tổng quan đó
rất giống với biến đổi mối quan hệ và nó không phụ thuộc một hình dạng thực tế.
Cluster phần chính cũng đ−ợc mở rộng bởi ảnh h−ởng của việc nhìn xa.
Hình 2.12: thử nghiệm “ Guernica “
- 52 -
2.3.4. Cluster có ý nghĩa của biến đổi
Vấn đề của tách hình dạng đ−ợc giảm bớt vấn đề clustering trong không
gian biến đổi. Nó là cần thiết để định nghĩa.
1. Một phép đo sự không t−ơng đ−ơng giữa các điểm trong không
gian biến đổi.
2. Một xác suất trên không gian biến đổi.
3. Chiến l−ợc nhóm.
2.3.4.1. Phép đo sự không t−ơng đ−ơng giữa các biến đổi.
Định nghĩa khoảng cách giữa các biến đổi là không đáng kể. Bởi hai lý do,
đầu tiên : biên độ lớn của các tham số trong biến đổi không so sánh trực tiếp..
Thứ hai : biểu diễn về mối quan hệ t−ơng đồng hoặc biến đổi mối liên hệ không
đổi không tốt nh− trong không gian vector. Nh− vậy khoảng cách là không cần
thiết.
Định nghĩa 2.4.1 ( tr−ờng hợp t−ơng đồng) đặt (P1, Q1) biểu diễn (P1’, Q1’)
là điểm xác định khung cục bộ của S1 trong ảnh I (S1’ trong I’). Đặt T1 là t−ơng
đồng duy nhất xác đinh bởi (P1, Q1) và (P1’, Q1’). Trong cách t−ơng tự T2 là t−ơng
đồng xác định từ một sự t−ơng ứng giữa các hình dạng thành phần với khung (P2,
Q2) và (P2’, Q2’) trong I và I’. Gọi phép đo không t−ơng đ−ơng giữa T1 và T2.Với
sự hoàn thành định nghĩa một sự t−ơng đ−ơng giữa các biến đổi quan hệ.
Định nghĩa 2.4.2 ( tr−ờng hợp quan hệ) : đặt T1 ( biểu diễn T2) là một biến
đổi quan hệ xác định bởi hai thành phần hình dạng (S1, S1’) biểu diễn (S2, S2’).
Dạng t−ơng đ−ơng từ I tới I’. Đặt (P1, Q1, R1) và (P1’, Q1’, R1’) biểu diễn (P2, Q2,
R2) và (P2, Q2, R2’) xác định khung cục bộ của S1 và S1’ ( t−ơng tự S2 và S2’) đặt
2.3.4.2 Ph−ơng thức nền
- 53 -
Để ứng dụng tách khung, đầu tiên cần một luật cơ sở. Một dữ liệu điểm ở
đây là một biến đổi t−ơng đ−ơng đ−ợc biểu diễn bởi một cặp các số (a, b) ∈ C2.
Mục đích của phần này là ph−ơng pháp trên luật cơ sở, luật Π trên tập biến đổi
t−ơng ứng. Với mục đích này, (a, b) đ−ợc xác định bởi hai khung cục bộ trong
ảnh đ−ợc t−ơng ứng, mối quan hệ (p, v) và (p’, v’). Tính toán các mô tả này thực
tế của không gian biến (p, v, p’, v’) ∈ C4. Nó tự nhiên tính toán vị trí, kích th−ớc
và h−ớng của một đối t−ợng là độc lập. Đây là phần chính; ảnh h−ởng tới một vài
đ−
Các file đính kèm theo tài liệu này:
- 000000208013R.pdf