Luận văn Nghiên cứu phương pháp nhận dạng hình dạng

Mục Lục

Lời cam đoan . 2

Mục Lục . 3

Danh Mục Các từ viết tắt. 6

Danh mục hình vẽ. 7

Lời nói đầu . 9

Chương 1:Tổng quan về tìm kiếm ảnh dựa trên hình dạng .

1.1. Giới thiệu.12

1.2. Trích chọn đặc trưng.13

1.2.1.Biến đổiFourier . 12

1.2.1.1.Chuỗi Fourier. 13

1.2.1.2. Sự hội tụ của chuỗi Fourier. 14

1.2.1.3. Biến đổi Fourier . 14

1.2.1.4. Biến đổi Fourier rời rạc . 15

1.2.1.5. Biến đổi Fourier hai chiều . 16

1.2.1.6. Phạm vi của biến đổi Fourier. 16

1.2.2. Không gian độ chia (Scale space). 17

1.2.2.1. Cơ sở . 17

1.2.2.2. Không gian độ chia Gaussian . 19

1.2.2.3. Phạm vi của sự không tạo các đặc trưng mới . 19

1.2.2.4. Không gian độ chia mâu thuẫn với việc đaquyết định . 20

1.2.3.Thảoluận . 22

1.3. Phép đo tương đương và thực hiện phép đo.22

1.3.1. Phép đo sự giống nhau. 23

1.3.1.1. Không gian phép đo khoảng cách (Distance Metric Spaces) . 24

1.3.1.2. Khoảng cáchdạng Minkowski . 24

1.3.1.3. Khoảng cách Cosin . 24

1.3.1.4. Thông tin thống kê 2? . 25

1.3.1.5. Đường giao biểu đồ . 25

1.3.1.6. Khoảng cách bậc hai. 26

1.3.1.7. Khoảng cáchMahalanobis . 27

1.3.2.Thực hiệnphép đo . 27

1.3.2.1. Độ nhạy và độ chính xác(RPP). . 28

1.3.2.2. Tỷ lệ trọng số thành công (PWHư Percentage of Weighted Hits) . 28

1.3.2.3. Phần trăm của thứ bậc giống nhau (PSRưPercentage of Similarity Ranking ) . 29

1.3.2.4. Thảo luận . 30

1.3.3. Trích chọn đặc trưng hình dạng. 30

1.4. Thảo luận.32

Chương 2 Phương pháp tách contrario . 33

2.1. Cluster có thứ bậc và đánh giá giá trị.34

2.1.1.Giá trị nhómContrario . 34

2.1.1.1. Cơ sở: . 34

2.1.1.2. Nhóm có ý nghĩa. . 35

2.1.2. Tiêu chuẩn kết hợp tốt nhất. . 37

2.1.3. Vấn đềtính toán . 40

2.1.3.1. Lựa chọn vùng thử. . 40

2.1.3.2. Riêng rẽvà cực đại. . 42

2.2.1. Nhiễu điểm . 43

2.2.2. Phânđoạn . 43

2.3. Kết cấu nhóm và không gian tương ứng.46

2.3.1. Tại sao phải táchkết cấu không gian. . 46

2.3.2. Đối sánh nhân tố hình dạng. 47

2.3.3. Biến đổi mô tả. 49

2.3.3.1. Trường hợp tương đồng. 49

2.3.3.2. Trường hợp biến đổi mối quan hệ . 50

2.3.4. Cluster có ý nghĩa của biến đổi. 52

2.3.4.1. Phép đo sự không tương đương giữa các biến đổi. . 52

2.3.4.2 Phương thức nền . 52

2.3.4.3. Kỹ thuật nhóm . 54

2.4. Thảo luận.55

Chương 3:Phương pháp ra quyết định Contrario . 56

3.1. Một quyết định Contrario . 58

3.1.1. Phương pháp hình dạng trái ngược phương pháp nền . 58

3.1.2. Phương thức quyết định Contrario. 59

3.1.3. Ước lượng xác suất cảnh báo sai . 61

3.1.4. Luật ra quyết định Contrario . 61

3.2. Tự động thiết lập ngưỡng khoảng cách . 62

3.2.1. Số các cảnh báo sai NFA . 62

3.2.2. Đối sánh có ý nghĩa . 63

3.2.3. Ngưỡng nhận dạng tương ứng với ngữ cảnh. 64

3.2.4. Tại sao quyết định Contrario . 65

3.3. Xây dựng đặc trưng độc lập thống kê. 66

3.4.Chuẩn hóa nhân tố hình dạng từ ảnh cho đặc trưng độc lập. 68

3.4.1. Biểu diễn hình dạng bằng các mức đường. 68

3.4.2.Tiêu chuẩn hóa vàmã hóa bán cục bộ. 70

3.4.2.1. Mã hóa / Tiêu chuẩn hóa trị không đổi tương đương . 71

3.4.2.2. Mã hóa / Chuẩn hóa quan hệ bất biến . 73

3.4.3. Từ chuẩn hóa nhân tố hình dạng đến đặc trưng độc lập. . 73

3.5. Thảo luận . 76

Chương 4Thử nghiệm . 78

4.1. Thử nghiệm phương pháp nền.78

4.2. Thử nghiệm phương pháp Contrario.80

4.2.1. Hai ảnh không quan hệ với nhau . 80

4.2.2. Méo dạng quan sát xa gần . 81

4.2.3. Quan hệ với sự nghẽn cục bộ và thay đổi độ tương phản . 83

Kết luận . 88

Tài liệu thamkhảo . 89

Tóm tắt luận văn .

pdf90 trang | Chia sẻ: maiphuongdc | Lượt xem: 1562 | Lượt tải: 5download
Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu phương pháp nhận dạng hình dạng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
π là một vấn đề cụ thể tổng quan đ−a ra một xác suất biết tr−ớc hoặc có thể −ớc l−ợng theo kinh nghiệm trên tập dữ liệu. Định nghĩa 2.1: Một xử lý nền là một xử lý các điểm có hạn (Xi) i= 1...M trong E từ các biến độc lập với nhau, định dạng phân bố theo luật π. Trình bày tập dữ liệu của M điểm (x1, x 2,... xM) trong E M , một tập phụ của tập dữ liệu sẽ là nhóm có nghĩa nếu các điểm quan trọng thuộc vào một vùng rất nhỏ, ở đó xác suất của những điểm này rất nhỏ. Vì vậy, cơ sở của ph−ơng thức Contrario là trái với giả thiết d−ới đây: (A): mô tả M ∈ Xi (i = 1,…. M) là một xử lý nền thực sự. Giả thiết cho khoảng cách E = (0,1)2 và π đồng dạng luật E. Đem M điểm trong E = (0,1)2; nó luôn có thể tìm một kết nối tập R với xác suất nhỏ tuỳ ý π(R) bao hàm trong mọi tập dữ liệu điểm. Trong thực tế, định nghĩa một nhóm có nghĩa sẽ bao hàm tổng có hạn các vùng phụ. 2.1.1.2. Nhóm có ý nghĩa. Đề cập một vùng R∈E bao gồm vùng gốc, giả thiết k điểm trong số x1...xM phụ thuộc vùng có dạng xj + R, cho 1≤ j ≤ M, nếu k đủ lớn, và π(xj + R) đủ nhỏ, chúng sẽ mô tả một tập hợp điểm trong vùng xj + R. Nhóm các điểm này sẽ đ−ợc tách trong xj + R, bằng ph−ơng pháp trái ng−ợc với ph−ơng pháp nền. Giả thiết các điểm thay đổi, nhóm có thể đ−ợc gộp lại quanh điểm xj bất kỳ và có hình dạng bất kỳ. Fix cứng xác suất cho tr−ớc, vùng R sẽ phải thuộc vào tập vùng gốc R có giới hạn, nó sẽ đ−ợc mô tả kỹ hơn. Giả thiết đơn giản hơn R giới hạn các dự tuyển #R và với mọi R∈R, O∈ R. k ≤ M ∈ N và 0 ≤ p ≤ 1 - 36 - Dạng luật nhị phân xử lý nền X1...X M và vùng R ∈ E với xác suất π (R), 1 có thể giải thích nh− xác suất tại điểm cuối k ngoài các điểm M của việc xử lý vào trong tập R. Mặc dù nghiên cứu dạng nhị thức và chúng sử dụng trong tách cấu trúc hình học có thể tìm thấy. Cho 1 ≤ j ≤ M và R' ∈ R Chú ý: X = (X1...XM): xử lý nền. Xj = (X1... XM): Xj thành phần bị thiếu. K (Xj, Xj, R '): số các điểm trong danh sách Xj phụ thuộc Xj + R '. Định nghĩa 2.2: Đặt R là một vùng dạng R = Xj + R ' j ∈ (1,...,M) và R' ∈ R. Gọi số cách báo sai của R = Xj + R' Gọi R = Xj + R ' là một vùng ε có nghĩa nếu NFAg(X, j, R') ≤ ε. Chú ý NFAg(X, j, R') cũng đ−ợc biểu thị bởi NFAg(R). Mục đích của chúng ta là giới thiệu mở rộng số l−ợng vùng có ý nghĩa ε là nhỏ hơn ε. Proposition 2.1 Nếu X1...XM là một xử lý nền, sự mở rộng số vùng có nghĩa ε nhỏ hơn ε. Để tính toán số các cảnh báo lỗi là phép đo sự giống nhau giữa các nhóm chứa trong vùng R nh− thế nào trong một tập dữ liệu điểm này ẩn chứa trong k điểm dữ liệu khác. Mức NFAg(R) thấp hơn, (Prop 2.1) thông số điều khiển tách là ε. Mệnh đề d−ới đây chỉ ra ảnh h−ởng của tham số #R và của thông số quyết định ε trong kết quả tách biên là rất ít. Mệnh đề 2.2: Đặt R là một vùng của R (2.1) (2.2) - 37 - Chú ý: k*(ε) là giá trị nhỏ nhất của điểm trong nhóm có nghĩa ε. Bằng kết quả dự đoán, quyết định ng−ỡng này chỉ có loga phụ thuộc #R và ε. Hình 2.2: Nhóm dữ liệu 950 điểm đồng dạng Hình 2.2 chỉ ra một ví dụ của nhóm dữ liệu bao gồm 950 điểm đồng dạng phân bố trong một đơn vị vuông và 50 điểm thêm vào xung quanh (0,4;0,4) và (0,7;0,7) xung quanh 950 điểm; phân bố đồng đều trong một đơn vị vuông. Trong ví dụ này #R= 2500 (50 kích cỡ khác cho mỗi chiều). Chính xác hai nhóm lớn nhất đ−ợc tách (hình 2.2) NFA của miền trái thấp hơn 10-8 trong khi NFA bên phải 107 2.1.2. Tiêu chuẩn kết hợp tốt nhất. Trong mục 2.2.1.2 đã giới thiệu hạn chế không gian của việc kiểm tra vùng từ Xi+R, Xi là mô tả dữ liệu và R∈ R , một tập hỗn hợp có giới hạn các vùng chứa vùng gốc trong RD. Độ d− thừa cao khi mỗi vùng có nghĩa lại liên quan tới tập mô tả biểu diễn các vùng có nghĩa khác. - 38 - Hai vùng R ⊂ R', câu hỏi này dễ dàng trả lời bằng việc so sánh NFAg(R) và NFAg(R'). Vùng có số l−ợng các cách báo sai nhỏ nhất là phù hợp hơn. Một cách hỏi khác khi 3 hoặc nhiều vùng liên kết với nhau, vì vậy phải yêu cầu một tiêu chuẩn hỗn hợp. Đầu tiên sẽ định nghĩa số cảnh báo sai cho một cặp vùng. Giá trị mới này đ−ợc so sánh với NFA của vùng hỗn hợp. Giới thiệu 3 hệ số danh nghĩa. Chú ý: Số này đ−ợc diễn dịch nh− sau: đặt R1 và R2 là hai vùng tách rời của E và π1= π (R1), π2 =π (R2) xác suất của chúng à(M, k1 , k2, π1 , π2) là xác suất tại giá trị nhỏ nhất k1 trong số M điểm và tại điểm thấp nhất k2 trong số M-k1 điểm, theo thứ tự là vùng R1 và R2. Mục tiêu là định nghĩa 1 NFA mới cho mỗi thành phần. Đặt 1<i ≠ j <M và R’, R”∈ R. Bây giờ 2 vùng thử Xi + R' và Xj + R'' có thể giao nhau và phải thực sự với xác suất này. Chú ý: đ−ợc mô tả bằng sự thay đổi hoàn toàn vai trò i và j: Định nghĩa 2.3: Gọi số cách báo sai của 2 cặp vùng bất kỳ (Ri, Rj) = (X i+ R', Xj + R '') (2.3) (2.4) - 39 - Cặp vùng bất kỳ(Ri,Rj) là có ý nghĩa ε nếu NFAgg(X,i,j,R',R'') < ε, NFAgg (X,i,j,R',R'') cũ sẽ đ−ợc chứa trong NFAgg (Ri,Rj). Mệnh đề 2.3: Số cặp vùng lý t−ởng nhỏ hơn ε Mệnh đề này dẫn tới 2 phép đo kém ý nghĩa: NFA của vùng và NFA của cặp vùng. Từ số l−ợng vùng có ý nghĩa ε trong ph−ơng thức nền ở trên đề cập tới biên độ t−ơng tự nhau đ−ợc so sánh để định nghĩa một tiêu chuẩn hỗn hợp Định nghĩa 2.4 (Vùng riêng biệt): Đặt R1 và R2 là hai vùng riêng biệt và R là một vùng chứa tất cả các dữ liệu điểm của R1 và R2. Nói rằng R là riêng biệt mối quan hệ với R1 và R2 nếu: Tập R là vùng thử và R là một nhân tố của R. R là riêng biệt trong R nếu nó độc lập quan hệ với mọi cặp vùng (R1, R2) chứa trong R; mỗi R chứa các điểm của vùng R1, R2 công thức (2.5) giới thiệu một phép thử chủ yếu cho kết cấu một tập hợp vùng Cluster. Nếu công thức 2.5 không xảy ra vùng thử đ−ợc coi nh− vùng không có giá trị, có nghĩa vùng thử có thể chia thành nhiều cặp vùng có nghĩa khác trong Cluster. Lenma tiếp theo sẽ cung cấp sự hữu ích trong việc gia tăng quyết định hỗn hợp. Lenma 2.1: Mỗi giá trị k1 và k2 trong (0,…., M). Mỗi k1, k2 ≤ M và mỗi π1 và π2 [0,1] sao cho π1 + π2 ≤ 1. Mệnh đề 2.4: Nếu R là riêng biệt với chú ý tới R1 và R2 Từ mệnh đề (2.4) và định nghĩa (2.4) (2.5) (2.6) - 40 - Bằng Lenma 2.1, với ( ) ( )pkMpkM ,,,,1 ββ ≤− cho mọi M, k, p công thức biểu diễn nh− sau: Mệnh đề 2.4 là hữu ích cho tính toán tổng quan, có thể tránh việc phải tính toán chi tiết 3 phân bố bằng bộ lọc các cluster đó . 2.1.3. Vấn đề tính toán 2.1.3.1. Lựa chọn vùng thử. Tập đúng của các vùng thử R nh− thế nào? Một vài lý do a > 0, r > 0 và n ∈N đề cập tới tất cả mọi vùng mà chiều dài đ−ờng biên thuộc vào tập {a, ar, ar2, arn}. Liên hệ với một số vùng thử có nhiều hình dạng kích cỡ khác nhau. Để đơn giản lựa chọn vùng thử có hình chữ nhật thích hợp với xác suất phân bố p đ−ợc định nghĩa trên miền chữ nhật E của RD là kết quả kéo căng một chiều t−ơng ứng. Định nghĩa 2.2: thừa nhận tính toán NFA của bất cứ vùng thử nào tại dữ liệu điểm. Từ số l−ợng các độ chia là n cho mỗi chiều có MnD vùng tại dữ liệu điểm. Từ số l−ợng các điểm quan sát khả thi. MnD sẽ rất lớn khi n tăng. Điều này giải thích tại sao phép thử không thể thực hiện theo cách này. Tốt hơn nên giải quyết cây cấu trúc của tập dữ liệu điểm mô tả bằng thuật toán tập trung thứ bậc. Tổ chức thứ bậc dữ liệu đ−ợc sử dụng để giới hạn các vùng thử, bằng thủ tục nh− sau: B−ớc 1: Bằng việc áp dụng ph−ơng pháp tập trung thứ bậc, ph−ơng pháp này cung cấp 1 tập hợp các tập con ẩn trong tập hợp điểm. Cấu trúc cây mà trong đó mỗi nút là một phần của tập dữ liệu và là một ứng viên Cluster. Cây này gọi là dendgrogram. Phần lớn các thủ tục đ−ợc thực hiện bởi việc lặp lại thủ tục nhị phân hỗn hợp. Vì vậy trực tiếp thiết lập cây nhị phân trong mỗi ph−ơng pháp, b−ớc khởi đầu: thiết lập nút là tập dữ liệu đơn {x1}...{xN}.Tại mỗi giai đoạn xây dựng 2 nút cha của - 41 - chúng. Khoảng cách nhóm, Cluster phải đ−ợc lựa chọn địa chỉ học. Trong tr−ờng hợp mật độ phân bố dữ liệu ít, b−ớc 1có thể khoảng cách nhỏ nhất d(xi, xj) tại xi phụ thuộc cluster đầu tiên và xj ở b−ớc 2. Các nút của cây đ−ợc tích hợp tất cả các phần tại tất cả các mức và lớp "cháu" của nút là 2 phần mà đã đ−ợc tích hợp từ đó. Tại sao mỗi một cấu trúc lại cần thiết, tr−ờng hợp tập các đoạn trong tập dữ liệu điểm lớn, thừa nhận một cấu trúc cây để giảm bớt việc khảo sát tỉ mỉ nhằm nghiên cứu một cây phụ tốt nhất đối với cấu trúc cây khởi tạo. Việc giảm bớt này dễ bị ảnh h−ởng nếu tập các nút của cây khởi tạo bao gồm tất cả các nhóm trong tập dữ liệu. Sự lựa chọn phép đo chính xác trên tập dữ liệu điểm và của khoảng cách cluster nguyên phải đ−ợc định rõ cẩn thận. Đem đến một dendrogram của tập cơ sở dữ liệu điểm, thuật toán d−ới đây chấp nhận khảo sát tỉ mỉ tất cả các vùng tại dữ liệu điểm và hàm chứa một nút của dendrogram. Thuật toán nhóm Mỗi nút G trong cây cluster hoặc dendrogram. 1- Mỗi điểm x thuộc nút: a) Tìm vùng nhỏ nhất x + R trung tâm tại điểm này, và chứa các dữ liệu điểm khác của nút. Gọi k+1 là số điểm dữ liệu mà nó chứa trong. b) Tính toán NFA của vùng nh− M.# R.B (M-1, k, p (x+R)) 2- Kết hợp với nút G của vùng R(G) với mức NFA đ−ợc tính toán thấp nhất, nó chứa điểm của nút G nh−ng cũng có thể chứa dữ liệu điểm khác. Từ thuật toán này đ−ợc tính toán, một vùng ứng cử đ−ợc kết hợp với mỗi nút bằng một chủ ý lạm dụng sự vô hại, chú ý NFAg(G) = NFAg(R(G)). Cách t−ơng tự, nếu G1 và G2 là một cặp nút và R(G1) và R(G2) là vùng của chúng. Chú ý NFAgg(G1,G2) = NFAgg(R(G1), R(G2)). Bằng cách này, cây cluster đ−ợc để lại cho NFAg và cho các cặp nút. Đặt R của vùng dạng R(G) thừa h−ởng từ cấu trúc ấy. - 42 - 2.1.3.2. Riêng rẽ và cực đại. Đối mặt vấn đề có thể có nhiều nhóm có nghĩa bởi ph−ơng pháp tr−ớc, NFA của chúng đã biết. Có thể cùng tính toán NFA của cặp cluster và so sánh thô với NFA hợp nhất của chúng. Định nghĩa tiếp theo giới thiệu một cách để lựa chọn cluster đúng, bằng việc sử dụng dendrogram cluster Định nghĩa 2.5 ( Cực đại nhóm có nghĩa ε) Một nút vùng R = R(G) trong R là ý nghĩa ε cực đại nếu và chỉ nếu: 1/ NFAg(R) ≤ ε 2/ R là riêng rẽ quan hệ với mọi cặp của sự xuống dốc. 3/ Mọi sự giảm độc lập R', NFAg(R') ≥ NFAg(R) 4/ Mọi sự tăng độc lập R', NFAg(R') >NFAg(R) hoặc tồn tại một sự giảm độc lập R'' của R khi NFAg(R'') < NFAg (R'). Ta nói rằng G là vùng ý nghĩa ε lớn nhất nếu là R(G). Điều kiện 4 bao hàm R có thể bị từ bỏ cho một vùng rộng hơn nếu vùng đó không bị áp đặt bởi một sự giảm. áp đặt điều kiện 3 và 4 chắc chắn 2 nhóm vùng ý nghĩa cực đại khác nhau là riêng rẽ. L−u ý rằng sự riêng biệt đ−ợc yêu cầu chỉ với mối liên hệ của cặp giảm. Định nghĩa 2.4 đáp ứng lý thuyết nh−ng không đáp ứng trong thực hành. 2.2. Kinh nghiệm có giá trị: Nhóm đối t−ợng dựa trên đặc tr−ng thành phần Hiện t−ợng nhóm là cần thiết trong nhận thức của con ng−ời từ đó chúng đáp ứng cho tổ chức thông tin. Mục tiêu của những kinh nghiệm này để trích chọn nhóm đối t−ợng trong ảnh, đó là hình dạng hình học mà một vài thành phần sở hữu. Đ−ờng viền đối t−ợng đ−ợc trích chọn nh− một vài đ−ờng mức t−ơng giảm trong ảnh, gọi là mức đ−ờng có ý nghĩa ([5] cho mô tả đầy đủ của thủ tục trích chọn này). Từ những đối t−ợng đ−ợc tách gọi là O1...OM, có thể tính toán cho chúng một mục D đặc tr−ng (độ chói, h−ớng, độ t−ơng phản...) Nếu k trong - 43 - số M đối t−ợng có một vài đặc tr−ng chung, liệu điều gì sẽ xảy ra khi thay đổi hoạc C nó có đủ để nhóm chúng. Mỗi dữ liệu điểm là một điểm trong tập đ−ờng viền của RD và ph−ơng pháp đã mô tả ở trên đ−ợc ứng dụng (thực tế, một vài các ngang cấp nh− góc phụ thuộc vào đơn vị tròn, từ tính chung kỳ phải đ−ợc đặt vào hàng đội, điều này có thể thực hiện với các cách t−ơng tự). 2.2.1. Nhiễu điểm Mỗi cái chứa 2 nhóm 25 điểm thêm vào 950 không đồng dạng trong một đơn vị vuông. Hai nhóm và 2 nhóm đ−ợc chọn với NFAg tốt (<10-7) kinh nghiệm trong hình 5 chỉ ra sự quan trọng của phân bố tr−ớc dữ liệu điểm. Hai phân bố khác nhau dẫn tới 2 vùng có ý nghĩa cực đại khác nhau. Nh−ng cả hai mối quan hệ đều đúng nh−ng lại phụ thuộc vào ngữ nghĩa. Hình 2.5: Vấn đề quan trọng của phân bố ph−ơng thức nền. Dữ liệu gốc là hình bên trái. Nó vị trí của 500 điểm trong 0,12 500iid điểm trong (0; 0,5) x (0; 1) và 25 điểm quanh (0,2; 0,3). Trong phần giữa; 1 phân bố tr−ớc trong ph−ơng thức nền mang lại đồng dạng. Sau đó, một vùng có ý nghĩa cực đại và độ rộng đơn đ−ợc tách, bao gồm 793 điểm và lg (NFAg)=44,9. Hình bên phải, phân bố đ−ợc định nghĩa nh− sản phẩm của phân bố lề theo kinh nghiệm trong tách dọc và tách ngang. Vùng có ý nghĩa cực đại đơn (- log10(NFAg) = 1,6) nh−ng bây giờ nó không phù hợp với nhóm nhỏ nhất. 2.2.2. Phân đoạn - 44 - Các nhóm đ−ợc nhận thức nh− 1 kết quả cộng tác giữa hai đại l−ợng trong khác nhau. Hình 2.6 chỉ ra 71 phân đoạn thẳng với h−ớng khác nhau; d−ờng nh− vị trí phân bố đồng dạng. Không cluster có ý nghĩa nào đ−ợc tách trong không gian sắp xếp vị trí của chúng. Trong tất cả các kinh nghiệm, số của kích ảnh hình chữ nhật trong mỗi lần tách là 50. Vì vậy #R= 50D. Hình 2.6: phân đoạn ảnh đã scan và 71 đ−ờng mức có mức ý nghĩa cực đại. Nếu h−ớng đ−ợc lựa chọn nh− một đặc tr−ng (D=1); 8 nhóm có ý nghĩa cực đại đ−ợc tách; t−ơng ứng với h−ớng đ−ợc biểu diễn rõ nhất. Không một cluster nào đ−ợc biểu diễn mức (trung tâm) NFAg thấp. Chỉ duy nhất một trong số các nhóm đó là riêng rẽ nh−ng h−ớng rõ ràng không phải là một nhân tố. Chú ý, nhóm này không bao gồm tất cả các phân đoạn trung tâm. H−ớng của chúng là khác nhau, và nhóm của 11phân đoạn không phải là cực đại. Tất cả các nhóm khác nhau thực sự không đ−ợc cảm nhận bởi vì chúng bị che phủ bởi sự lộn xộn tạo ra từ tất cả các đối t−ợng khác nhau. Tuy nhiên, một nhóm không thể có đối t−ợng chúng có một kết cấu phức tạp. Trong hình 2.7, có 8 nhóm có ý nghĩa cực đại. Thứ tự từ NFAg từ 10-1 đến 10-5 nhóm central không bao gồm tất cả các phân đoạn dọc, bởi vì h−ớng không chính xác. Từ đó nhóm cực đại bao gồm phân đoạn dọc không bao gồm tất cả các đối t−ợng centra. Điều có nghĩa một mình h−ớng không ảnh h−ởng tới tách nhóm - 45 - này. Nó cho phép tách nhóm tốt, nh−ng vị trí của chúng không đủ kết cấu để tạo thành kết cấu rõ ràng. Hình 2.7: Nhóm với mối quan hệ tới h−ớng. Xem xét khi đề cập tới hai đặc tr−ng (D =2; #R = 2500) trong không gian (sắp xếp, h−ớng). Hai cluster có ý nghĩa cực đại đ−ợc tìm thấy nh− mong đợi nhóm có ý nghĩa nhất là nhóm G, 11 phân đoạn dọc. NFAg của nó là 10-1,5 nó không thấp. Nhóm thứ 2 là chính xác nh−ng ý nghĩa NFAg =0,3 là rất khó khăn. Chúng khó t−ơng xứng NFAg = 0,3 trong không gian [ y...] sắp xếp va vị trí nhóm trung tâm G đ−ợc chia thành 2 cluster có ý nghĩa cực đại. Chúng t−ơng ứng với 2 hàng của phân đoạn sắp xếp G vai trò của tiêu chuẩn hỗn hợp là quyết định ở đây. Trong không gian (y - coordinate, h−ớng) sự kết hợp tiêu chuẩn cực đại và tiêu chuẩn hỗn hợp, điều đó có ý nghĩa hơn để mô tả tại cùng một thời điểm 2 hàng của 1 phân đoạn hơn ở trong một nhóm. Đây là trực quan, từ đó chúng ta thực sự thấy 2 hàng của các phân đoạn tại đây. Trái lại không gian (trong sự sắp xếp x, h−ớng) k tiêu chuẩn hỗn hợp chỉ ra mô tả G có ý nghĩa hơn mô tả hỗn hợp các lớp con của nó trong dendrogram. Quyết định này vẫn còn thích nghi với mô tả. Không một nhóm thực tế nào với G có thể là đặc biệt với chú ý tới sắp xếp x. Nhóm t−ơng tự - 46 - đ−ợc mô tả trong không gian (x coordinate, y, h−ớng) với mức thấp hơn NFAg =10-34. Hình 2.8: nhóm trong không gian(toạ độ x, h−ớng) Trong hình 2.8, có 2 nhóm có ý nghĩa lớn nhất thời gian này nhóm trung tâm đ−ợc tách (NFAg = 10-1,5) nh−ng có một nhóm khác (nhóm một phần nhóm thứ 7 trong hình 2.7). Tuy nhiên NFAg của nó = 0,3 có nghĩa nó là khó có ý nghĩa. Nếu nhóm đ−ợc thực hiện với mối quan hệ lắp đầy vị trí 2 chiều và h−ớng, chỉ nhóm trung tâm đ−ợc tách NFAg = 10-3,4. 2.3. Kết cấu nhóm không gian t−ơng ứng 2.3.1. Tại sao phải tách kết cấu không gian. Hình 2.9, có thể nhận dạng rõ ràng ở vùng trái phía d−ới của ảnh một bức tranh chi tiết của Picasso. Tuy nhiên, bức tranh đã không hoàn thành và phía d−ới ảnh bị che lại. Nó cũng bị biến dạng bởi điểm nhìn xa. Tuy nhiên, tốc độ nén là khác nhau. Nhận dạng hình dạng đ−ợc mô tả từ các điểm nhìn khác nhau và yêu cầu ngăn chặn cảm nhận trực quan. Bộ mô tả hình dạng đủ rõ ràng, cục bộ hoặc bán cục bộ. Mô tả hình dạng gọi là nhân tố hình dạng trong phần tiếp theo. Tính toán thí dụ của một truy vấn hình dạng đ−ợc biểu diễn trong một cảnh, ph−ơng pháp để nhận dạng nhân tố hình dạng t−ơng tự là có thể. Nó sẽ sẵn sàng cung cấp một vài cặp chính xác, những cung cấp sai, từ nhân tố hình dạng chỉ cung cấp thông tin cục bộ, hai đối t−ợng khác có những phần t−ơng tự có thể biểu diễn một - 47 - vài nhân tố hình dạng t−ơng ứng. Vì vậy nhận dạng yêu cầu tìm ra tập phù hợp các cặp, một tập các cặp trong hình dạng tự nhiên. 2.3.2. Đối sánh nhân tố hình dạng Lợi ích của việc hoàn thành, khái quát từng b−ớc chính của trích chọn đặc tr−ng hình dạng và thuật toán thích hợp đ−ợc mô tả và mô tả thủ tục nhóm. Mô tả đầu tiên là đ−ờng viền của đối t−ợng ở mức xám của ảnh rất hợp nhau, cuối cùng với đoạn các mức đ−ờng (hoặc) đoạn cover không phải luôn đúng: thực vậy, mức đ−ờng cung cấp một biểu diễn hoàn chỉnh của mức xám ảnh và chúng có nhiều mức trong kết cấu. Vì vậy b−ớc đầu tiên là lựa chọn một tập nhỏ trong tất cả các mức đ−ờng của ảnh. Ph−ơng pháp contrario đ−ợc giới thiệu và lựa chọn mức đ−ờng gọi là đ−ờng viền có ý nghĩa. Nó chấp nhập lựa chọn khoảng 1% mức đ−ờng của một bức ảnh không mất nội dung hình dạng. Mức đ−ờng này uốn cong và gặp đ−ờng viền ảnh ở điểm cuối cùng. Nhận dạng hình dạng là công cụ mạnh, vì thế đ−ờng viền có ý nghĩa phải chia cắt trong đoạn nhỏ hơn gọi là nhân tố hình dạng. Các hình dạng không đổi phải yêu cầu mã hóa nhân tố hình dạng không đổi; ph−ơng pháp mã hóa mối quan hệ không đổi đ−ợc giới thiệu. Chú ý trong một vài tr−ờng hợp, ph−ơng pháp không đổi t−ơng đ−ơng có thể đủ chính xác, phụ thuộc mức đ−ờng có ý nghĩa, các khung không đổi trong mối quan hệ cục bộ đ−ợc tính toán trực tiếp dựa trên mối quan hệ không đổi. Mỗi khung cục bộ định nghĩa một hệ thống tọa độ. Tọa độ của các điểm của một cung trong hệ thống, tọa độ này có thể không đổi. Hai đ−ờng cong có độ cong khác nhau trong một biến đổi quan hệ đ−ợc định nghĩa là hai khung cục bộ khác nhau. Tuy nhiên khi mô tả trong mối quan hệ của hệ thống tọa độ, chúng phải thiết lập cùng một vị trí. Từ đó chúng định nghĩa một đoạn cong thông th−ờng gọi là một nhân tố hình dạng có quan hệ không đổi. Một đ−ờng viền có ý nghĩa th−ờng chứa trong một vài nhân tố hình dạng lấy từ hai ảnh và hai tập nhân tố hình dạng, làm thế nào tìm thấy nhân tố hình dạng chung. - 48 - Từ nhân tố hình dạng đ−ợc chuẩn hoá thực hiện nhận dạng mối quan hệ tự nhiên bất biến. Một mô tả contrario đ−ợc giới thiệu để t−ơng ứng với nhân tố hình dạng. Một số l−ợng các cảnh báo sai của sự t−ơng đồng đ−ợc định nghĩa và t−ơng ứng với số các cảnh báo đ−ợc giữ lại. Đặt I và I’ là hai ảnh, tham khảo từ ảnh mục tiêu và cảnh. Mỗi cái t−ơng ứng giữa một nhân tố hình dạng S trong I và một nhân tố hình dạng S’ trong I’, biến đổi hình dạng( biến đổi mối quan hệ hoặc sự t−ơng đồng ) đ−ợc tính toán chấp nhận các tham số chứa trong nó nh− thế nào đ−ợc mô tả theo cách −ớc l−ợng đúng và cung cấp hình dạng t−ơng ứng với một hình dạng có thể thích hợp mối quan hệ tốt nhất. Phần này: cung cấp nhân tố hình dạng t−ơng ứng hình dạng đơn đ−ợc nhóm cùng nhau. Nhóm NFA của chúng nhỏ nên việc tách đáng tin cậy. Hình 2.9: Thử nghiệm Guernica Trong hình 2.9, thử nghiệm “ Guernica “. ảnh gốc và mức đ−ờng có ý nghĩa cực đại [5]. Tất cả các mức nhân tố hình dạng không đổi đ−ợc mã hóa và chuẩn hoá dựa trên sự phần đậm. Phía trên : ảnh mục tiêu; phía d−ới : ảnh và cảnh . - 49 - Hình 2.10: thử nghiệm “ Guernica “ quan hệ t−ơng ứng ý nghĩa không đổi Trong hình 2.10, thử nghiệm “ Guernica “ quan hệ t−ơng ứng ý nghĩa không đổi. Hình này cho thấy biểu diễn nhân tố hình dạng chung cho hai bức ảnh từ sự hạn chế tạo ra mối quan hệ bị bóp méo nhiều nhân tố hình dạng đ−ợc chuẩn hóa đ−ờng cong khá giống nhau. Một biến đổi quan hệ xác định t−ơng ứng với sự thích ứng giữa các nhân tố hình dạng. 2.3.3. Biến đổi mô tả 2.3.3.1. Tr−ờng hợp t−ơng đồng Đặt S và S’ là hai nhân tố hình dạng t−ơng đồng. Độ chính xác đó là một nhân tố hình dạng của một đoạn mức đ−ờng đ−ợc chuẩn hoá hóa đã đ−ợc mô tả trong frame cục bộ ( hình 2.11). Một khung không đổi t−ơng đ−ơng hoàn toàn đ−ợc xác định bởi hai điểm hoặc một điểm và một vectơ. Biểu diễn này đ−ợc chọn lựa. Một khung cục bộ mang lại bằng một cặp ( p, v ) p là khung gốc v là h−ớng và độ chia. Để tính S liên quan tới ( p, v ) và S’ liên quan ( p’, v’) từ S và S’ t−ơng ứng, chú ý các b−ớc biến đổi sự t−ơng đồng, bây giờ biểu đồ t−ơng đồng - 50 - khung cục bộ (p,v) trên (p’,v’) bằng việc hoàn thành các chú ý. Sự t−ơng đồng đ−ợc tính toán : Trong hình 2.11, hai đoạn của một mức đ−ờng và khung t−ơng tự của chúng. Biểu đồ T t−ơng đ−ơng từ R1 → R1’; R2→R2’. Tính toán khung cục bộ (R1 R2) có thể biểu diễn theo: Hình 2.11: Hai đoạn mức đ−ờng và khung t−ơng ứng 2.3.3.2. Tr−ờng hợp biến đổi mối quan hệ Đề cập tới tr−ờng hợp bình th−ờng mối quan hệ không đổi. Các đỉêm không thẳng hàng cần thiết để định nghĩa khung cục bộ. Mối quan hệ thông th−ờng của một đoạn cung đ−ợc thực hiện bằng bản đồ ba điểm ở đây (R1, R2, R3) trên bộ ba ((0,0), (0,1), (1,0)). Một bộ ba khác (R1’, R2’, R3’); đ−ợc chú ý lại bởi T. Tồn tại một ma trận M (2 x 2) và duy nhất (tx, ty) ∈R2: - 51 - Tính toán Sự phân tích này là duy nhất và hoàn toàn xác định (θ, ϕ, Sx, Sy) trong [(0,2π) ì Rì R+ ì R+]. Chú ý quan hệ ( xR1, xR2 ) và cặp ( xR1’ ,xR2’ ) của tọa độ R1 và R1’. Biến đổi tham số T = (θ, ϕ, Sx, Sy, tx, ty) đ−ợc xác định bằng tính toán đại số. Đặc tính vectơ T biến đổi thành T không mập mờ, có thể chọn một chủ tâm t−ơng tự hoặc biến đổi mối quan hệ thêm vào đó từ T đặc tr−ng T, cả hai có thể đ−ợc nhận dạng. Vì vậy viết lại X ∈ R2, T(x) thay thế T(x). Trong hình 2.12 : chỉ ra biến đổi 2-D điểm, Tk t−ơng ứng với quan hệ “ Guernica “ ý nghĩa không đổi ở hình 2.13. Hình 2.12 : thử nghiệm “ Guernica “. Mỗi biểu diễn một mối quan hệ biến đổi với một đối sánh mối quan hệ ý nghĩa không đổi mô tả bằng sáu tham số. Mỗi hình biểu diễn hai chiều cho các điểm, mối quan hệ tx và ty ( tọa độ), Biến đổi : θ (góc quay), ϕ (shear), ln(Sx) và ln(Sy) ( zoom vào x và y) trực tiếp (tọa độ). Nhiễu là do nhân tố hình dạng tổng quan đó rất giống với biến đổi mối quan hệ và nó không phụ thuộc một hình dạng thực tế. Cluster phần chính cũng đ−ợc mở rộng bởi ảnh h−ởng của việc nhìn xa. Hình 2.12: thử nghiệm “ Guernica “ - 52 - 2.3.4. Cluster có ý nghĩa của biến đổi Vấn đề của tách hình dạng đ−ợc giảm bớt vấn đề clustering trong không gian biến đổi. Nó là cần thiết để định nghĩa. 1. Một phép đo sự không t−ơng đ−ơng giữa các điểm trong không gian biến đổi. 2. Một xác suất trên không gian biến đổi. 3. Chiến l−ợc nhóm. 2.3.4.1. Phép đo sự không t−ơng đ−ơng giữa các biến đổi. Định nghĩa khoảng cách giữa các biến đổi là không đáng kể. Bởi hai lý do, đầu tiên : biên độ lớn của các tham số trong biến đổi không so sánh trực tiếp.. Thứ hai : biểu diễn về mối quan hệ t−ơng đồng hoặc biến đổi mối liên hệ không đổi không tốt nh− trong không gian vector. Nh− vậy khoảng cách là không cần thiết. Định nghĩa 2.4.1 ( tr−ờng hợp t−ơng đồng) đặt (P1, Q1) biểu diễn (P1’, Q1’) là điểm xác định khung cục bộ của S1 trong ảnh I (S1’ trong I’). Đặt T1 là t−ơng đồng duy nhất xác đinh bởi (P1, Q1) và (P1’, Q1’). Trong cách t−ơng tự T2 là t−ơng đồng xác định từ một sự t−ơng ứng giữa các hình dạng thành phần với khung (P2, Q2) và (P2’, Q2’) trong I và I’. Gọi phép đo không t−ơng đ−ơng giữa T1 và T2.Với sự hoàn thành định nghĩa một sự t−ơng đ−ơng giữa các biến đổi quan hệ. Định nghĩa 2.4.2 ( tr−ờng hợp quan hệ) : đặt T1 ( biểu diễn T2) là một biến đổi quan hệ xác định bởi hai thành phần hình dạng (S1, S1’) biểu diễn (S2, S2’). Dạng t−ơng đ−ơng từ I tới I’. Đặt (P1, Q1, R1) và (P1’, Q1’, R1’) biểu diễn (P2, Q2, R2) và (P2, Q2, R2’) xác định khung cục bộ của S1 và S1’ ( t−ơng tự S2 và S2’) đặt 2.3.4.2 Ph−ơng thức nền - 53 - Để ứng dụng tách khung, đầu tiên cần một luật cơ sở. Một dữ liệu điểm ở đây là một biến đổi t−ơng đ−ơng đ−ợc biểu diễn bởi một cặp các số (a, b) ∈ C2. Mục đích của phần này là ph−ơng pháp trên luật cơ sở, luật Π trên tập biến đổi t−ơng ứng. Với mục đích này, (a, b) đ−ợc xác định bởi hai khung cục bộ trong ảnh đ−ợc t−ơng ứng, mối quan hệ (p, v) và (p’, v’). Tính toán các mô tả này thực tế của không gian biến (p, v, p’, v’) ∈ C4. Nó tự nhiên tính toán vị trí, kích th−ớc và h−ớng của một đối t−ợng là độc lập. Đây là phần chính; ảnh h−ởng tới một vài đ−

Các file đính kèm theo tài liệu này:

  • pdf000000208013R.pdf