Thuật toán tăng cường ảnh viễn thám kích thước lớn
2.5.3.1. Nhược điểm của FCM với ảnh viễn thám kích thước lớn
Thuật toán phân cụm mờ [FCM] nảy sinh vấn đề khi gặp ảnh có kích thước rất lớn mà cụ thể
ở đây là ảnh viễn thám độ phân giải cao. Có hai cách để khắc phục vấn đề này. Một là, có thể áp
dụng kĩ thuật wavelet. Hai là, cải tiến trực tiếp thuật toán phân cụm mờ để khắc phục hạn chế này.
Phương án sử dụng kĩ thuật wavelet được trình bày dưới đây. Phương án cải tiến thuật toán phân
cụm mờ được trình bày trong mục 3.2.3 trong chương III.
2.5.3.2. Thuật toán tăng cường ảnh viễn thám kích thước lớn
Trong phần này, luận án đề xuất thuật toán tăng cường ảnh viễn thám kích thước lớn mà
chúng tôi tạm gọi là Large Size Remote Sensing Image Enhancement Using FCM
(LaSRSIE_FCM). Đầu tiên, ảnh đầu vào được giảm kích thước sử dụng biến đổi avelet thuận đến
kích thước đủ nhỏ được ảnh xấp xỉ cực tiểu lựa chọn. Thực hiện tăng cường ảnh xấp xỉ cực tiểu lựa
chọn này sử dụng thuật toán LoRSIE. Tiếp đó, thay ảnh xấp xỉ cực tiểu bằng ảnh xấp xỉ đã tăng
cường và thực hiện biến đổi ngược sử dụng biến đổi avelet nghịch để thu được ảnh tăng cường
ứng với ảnh gốc.
2.5.5. Thử nghiệm và đánh giá
Tập dữ liệu phục vụ cho thử nghiệm gồm ba loại: LANDSAT ETM, SPOT 5, Quickbird.Môi
trường thực nghiệm: Bộ xử lý Core 2 Duo tốc độ 1.8Gh , RAM 2G, hệ điều hành indows 7.Để
đánh giá, luận án sử dụng phương pháp trực quan và đánh giá thông qua chỉ sốtuyến tính mờ γ
[HAS][SUD] như đã mô tả trong mục 2.4.4. Các kết quả thực nghiệm, đánh giá cả về mặt trực quan
cũng như chi số chất lượng đều cho thấy kĩ thuật cải tiến tốt hơn so với kĩ thuậ
25 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 492 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Nghiên cứu nâng cao chất lượng và giải đoán ảnh viễn thám đa phổ dựa trên tính toán mềm - Nguyễn Tu Trung, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
g quan về giải đoán
ảnh viễn thám đa phổ. Tiếp theo, chương I đưa ra bức tranh tổng quan về tình hình nghiên cứu trong
và ngoài nước liên quan đến vấn đề tăng cường chất lượng ảnh và phân lớp ảnh viễn thám. Cho đến
hiện tại, các nghiên cứu trên thế giới đã đạt được những thành công to lớn từ giai đoạn thu thập ảnh
với những cải tiến sâu sắc, thành tựu lớn của các vệ tinh viễn thám ngày càng hiện đại, các vấn đề
hiệu chỉnh, tăng cường chất lượng dữ liệu cho đến việc phân lớp, phân tích ảnh viễn thám cũng như
các ứng dụng hậu phân lớp. Qua đây, luận án phân tích ưu điểm cũng như những mặt còn hạn chế
của các phương pháp và nghiên cứu đã có, làm cơ sở để nghiên cứu sinh tìm ra các phương pháp
mới, để có thể cải tiến và ứng dụng vào thực tế đem lại hiệu quả tốt hơn. Các cải tiến của luận án
được trình bày trong chương II và III.
CHƯƠNG II: PHÁT TRIỂN MỘT SỐ THUẬT TOÁN TĂNG CƯỜNG ĐỘ TƯƠNG PHẢN
ẢNH VIỄN THÁM DỰA ĐA PHỔ
2.1. Một số thuật toán tăng cường độ tương phản ảnh dựa trên logic mờ
Tăng cường ảnh mờ với toán tử tăng cường
Tăng cường ảnh mờ với toán tử Hyperbol
Tăng cường ảnh mờ dựa trên phân bố xác suất
Cải thiện độ tương phản dựa trên luật If-Then mờ
2.2. Hạn chế của các thuật toán tăng cường mờ
Qua phân tích về phương pháp tăng cường ảnh mờ đã có như được trình bày trong các mục
2.1 của luậnán, chúng tôi có một số nhận xét sau:
Một là, các thuật toán tăng cường mờ trên vẫn sử dụng tiếp cận toàn cục như các phương
pháp truyền thốngnên khó để tăng cường độ tương phản giữa các lớp phủ đất (các đối
tượng che phủ mặt đất) xuất hiện trong ảnh vệ tinh, bởi vì thông tin tương phản cục bộ và
chi tiết vẫn có thể bị mất trong các vùng sáng và tối.
Hai là, các ngưỡng cận trên max, dưới min vẫn phải chọn thủ công dựa trên lựa đồ xám với
mỗi ảnh khác nhau nên thiếu hiệu quả và việc chọn ngưỡng có thể không tốt.
Ba là, giống như phương pháp truyền thống, phương pháp tăng cường ảnh mờ chỉ thực
hiện trênmột kênh phổ (ảnh đa cấp xám hay từng kênh của ảnh đa kênh). Do đó, mầu của
các đối tượng trong ảnh đầu ra có thể không được bảo tồn.
2.3. Một số độ đo chất lượng tăng cường ảnh
Để đánh giá chất lượng ảnh, chúng ta có thể sử dụng phương pháp trực quan hay các chỉ số độ
đo chất lượng. Để đo độ tương phản của ảnh, chúng ta có thể sử dụng một số độ đo như sau:
ShannonEntropy H, Entropy mờ FH, chỉ số tuyến tính mờ γ, độ đo chất lượng ảnh IQMTrong các
8
công trình nghiên cứu và luận án, nghiên cứu sinh sử dụng độ đo Entropy và độ đo tính mờ để đánh
giá chất lượng của ảnh trước và sau tăng cường.
2.4. Đề xuất kĩ thuật tăng cường độ tương phản ảnh viễn thám dựa trên tiếp cận cục bộ
Các bước chính của kĩ thuật tăng cường ảnh viễn thám dựa trên tiếp cận cục bộ (Local based
Remote Sensing Image Enhancement-LoRSIE) được liệt kê trong bảng 2.1.
Bảng 2.1. Quy trình thuật toán tăng cường ảnh viễn thám dựa trên tiếp cận cục bộ.
Giai đoạn Nhiệm vụ
1 Cục bộ hóa ảnh viễn thám dựa trên thuật toán phân cụm
2 Xây dựng mô hình hiệu chỉnh mức xám theo cụm
3 Tính ngưỡng tự động theo cụm
4 Sinh ảnh tăng cường dựa trên việc tổng hợp các mức xám
hiệu chỉnh theo từng cụm
Trong các phần 2.5 và 2.6, luận án trình bày hai thuật toán tăng cường ảnh viễn thám dựa trên
tiếp cận cục bộ sử dụng các thuật toán phân cụm mờ CM và phân cụm rõ KMeans.
2.5. Tăng cường ảnh viễn thámsử dụng phân cụm mờ
2.5.1. Thuật toán tăng cường ảnh viễn thám sử dụng phân cụm mờ
2.5.1.1. Cục bộ hóa ảnh viễn thám dựa trên thuật toán phân cụm mờ
Phân cụm c-Means mờ [FCM] là thuật toán được dùng rộng rãi của phân lớp mờ. Trong khi
xem xét logic tập mờ, thuật toán được phát triển dựa trên phân cụm KMeans. Trong thuật toán này,
mỗi điểm ảnh không về duy nhất cụm nào và được biểu diễn bởi nhiều thành viên của mỗi cụm.
2.5.1.2. Xây dựng mô hình biến đổi mức xám theo cụm
Trong nghiên cứu này, nghiên cứu sinh xây dựng hàm biến đổi cho toán tử Giãn mức xám và
Hyperbol, và được phát biểu theo từng cụm trong bảng 2.2.
Bảng 2.2. Các hàm biến đổi mức xám theo từng cụm.
Ý nghĩa Công thức biến đổi Ti(g)
Giãn mức
xám
(21)
Biến đổi
Hyperbol
(
) [
] (22)
Trong đó:
{
(23)
9
Trong đó, g = giá trị xám gốc, = cận trên của việc giãn cụm i, = cận dưới của
việc giãn cụm i, = tâm cụm i.Giá trị của các ngưỡng và được tính tự động theo
từng cụm như trong mục 2.4.1.3.
2.5.1.3. Tính ngưỡng tự động theo cụm
Giả sử, là hàm phân bố của mức xám theo một cụm cho trước. và các tham số:
, , được thể hiện trong hình 2.1.Các ngưỡng , được xác định
bằng cách chọn sao cho vùng gạch chéo (hình 2.1) có diện tích bằng 95% tổng diện tích được bao
bởi các đường y = 0 và y = . Ý nghĩa của việc chọn ngưỡng như trên là để vùng được chọn
không bị ảnh hưởng bởi nhiễu.
Hình 2.1. Hàm phân bố và các ngưỡng theo từng cụm.
2.5.1.4. Sinh ảnh tăng cường dựa trên việc tổng hợp mức xám hiệu chỉnh theo cụm
Dựa trên mô hình biến đổi mức xám theo mỗi cụm đã xây dựng trong phần 2.5.1.2, mỗi giá trị
xám đầu vào sẽ được chuyển các thành giá trị mới tương ứng với các cụm. Nhiệm vụ còn lại là tổng
hợp các giá trị này để sinh ra giá trị xám duy nhất. Hàm tổng hợp này có dạng tổng quát như sau: g
| g’ = T(g). Trong đó,
∑
(24)
Trong đó, g = giá trị xám gốc, = cận trên của việc giãn cụm i, = g cận dưới
của việc giãn cụm i, = tâm cụm i, = giá trị độ thuộc của mức xám g theo cụm i.
2.5.2. Phát triển thuật toánLoRSIE_FCM cho ảnh đa phổ
Thuật toán LoRSIE_ CM dựa trên tiếp cận phân cụm, thực hiện tính ngưỡng tự động, khắc
phục được hạn chế 1 và 2 (nhận xét trong mục 2.2). Tuy nhiên, đối với ảnh đa kênh, vẫn chưa rõ
làm thế nào để thuật toán này có thể khắc phục được hạn chế 3. Phát triển dưới đây sẽ cho phép giải
quyết vấn đề này.
Bản chất CM là thuật toán phân cụm các đối tượng là các vector có nhiều thành phần. Và do
vậy, CM đã thực hiện rất tốt cho ảnh đa kênh như ảnh màu RGB. Như vậy, thuật toán trên áp dụng
cho ảnh viễn thám đa phổ như sau:
Bước 1:Cục bộ hóa ảnh đầu vào. Sau khi thực hiện thủ tục phân cụm, mỗi điểm ảnh P(
,
,
) sẽ được đặc trưng thêm bởi một bộ các giá trị độ thuộc ứng với các cụm khác
10
nhau. Như vậy, quan hệ cùng một điểm ảnh của một bộ (
,
,
) được đặc trưng bởi
bộ các giá trị độ thuộc trên. Do đó, giải quyết được hạn chế thứ 3 trong mục 2.2.
Bước 2: Xây dựng mô hình hiệu chỉnh mức xám. Vẫn thực hiện việc này như được trình
bày trong mục 2.4.1.b.
Bước 3: Tính ngưỡng tự động. Các ngưỡng
và
được tính tự động theo
từng cụm và từng kênh k.
Bước 4: Sinh ảnh tăng cường. Với mỗi điểm ảnh P, ta có:
∑
(25)
Trong đó,
= giá trị xám gốc của điểm ảnh P thuộc kênh thứ k,
= cận trên của việc
giãn cụm i thuộc kênh thứ k, = cận dưới của việc giãn cụm i thuộc kênh thứ k,
= tâm
cụm i thuộc kênh thứ k. Mỗi tâm gồm môt bộ (
,
,
), = giá trị độ thuộc của mức xám
g theo cụm i.
2.5.3. Thuật toán tăng cường ảnh viễn thám kích thước lớn
2.5.3.1. Nhược điểm của FCM với ảnh viễn thám kích thước lớn
Thuật toán phân cụm mờ [FCM] nảy sinh vấn đề khi gặp ảnh có kích thước rất lớn mà cụ thể
ở đây là ảnh viễn thám độ phân giải cao. Có hai cách để khắc phục vấn đề này. Một là, có thể áp
dụng kĩ thuật wavelet. Hai là, cải tiến trực tiếp thuật toán phân cụm mờ để khắc phục hạn chế này.
Phương án sử dụng kĩ thuật wavelet được trình bày dưới đây. Phương án cải tiến thuật toán phân
cụm mờ được trình bày trong mục 3.2.3 trong chương III.
2.5.3.2. Thuật toán tăng cường ảnh viễn thám kích thước lớn
Trong phần này, luận án đề xuất thuật toán tăng cường ảnh viễn thám kích thước lớn mà
chúng tôi tạm gọi là Large Size Remote Sensing Image Enhancement Using FCM
(LaSRSIE_FCM). Đầu tiên, ảnh đầu vào được giảm kích thước sử dụng biến đổi avelet thuận đến
kích thước đủ nhỏ được ảnh xấp xỉ cực tiểu lựa chọn. Thực hiện tăng cường ảnh xấp xỉ cực tiểu lựa
chọn này sử dụng thuật toán LoRSIE. Tiếp đó, thay ảnh xấp xỉ cực tiểu bằng ảnh xấp xỉ đã tăng
cường và thực hiện biến đổi ngược sử dụng biến đổi avelet nghịch để thu được ảnh tăng cường
ứng với ảnh gốc.
2.5.5. Thử nghiệm và đánh giá
Tập dữ liệu phục vụ cho thử nghiệm gồm ba loại: LANDSAT ETM, SPOT 5, Quickbird.Môi
trường thực nghiệm: Bộ xử lý Core 2 Duo tốc độ 1.8Gh , RAM 2G, hệ điều hành indows 7.Để
đánh giá, luận án sử dụng phương pháp trực quan và đánh giá thông qua chỉ sốtuyến tính mờ γ
[HAS][SUD] như đã mô tả trong mục 2.4.4. Các kết quả thực nghiệm, đánh giá cả về mặt trực quan
cũng như chi số chất lượng đều cho thấy kĩ thuật cải tiến tốt hơn so với kĩ thuật mờ.
11
Thử nghiệm đại diện
Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh LANDSAT khu vực huyện Kim Bôi có kích
thước 1581 x 1527 (điểm ảnh).
Bảng 2.3. Tăng cường ảnh với phương pháp mờ và cải tiến.
Đầu vào Hyperbol mờ Tăng cường mờ Giãn FCM Hyperbol FCM
Bảng 2.4. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.
Kênh Hyperbol mờ Tăng cường mờ Giãn FCM Hyperbol FCM
1 0.38 0.43 0.27 0.30
2 0.31 0.45 0.24 0.26
3 0.38 0.39 0.34 0.36
Bảng 2.5: Thời gian thực thi.
Thuật toán Thời gian
Hyperbol mờ 2485
Tăng cường mờ 2281
Giãn FCM LoRSIE 1028756
LaSRSIE -2 Level 57764
Hyperbol
FCM
LoRSIE 1027408
LaSRSIE -2 Level 57724
2.6. Tăng cường ảnh viễn thám sử dụng phân cụm KMeans
2.6.1. Thuật toán tăng cường ảnh viễn thám sử dụng thuật toán phân cụm KMeans
2.6.1.1. Cục bộ hóa ảnh viễn thám dựa trên thuật toán phân cụm KMeans
2.6.1.2. Xây dựng mô hình biến đổi mức xám theo cụm
Trong nghiên cứu này, nghiên cứu sinh xây dựng hàm biến đổi cho toán tử Giãn mức xám và
Hyperbol, và được phát biểu theo từng cụm trong bảng 2.16.
Bảng 2.6. Các hàm biến đổi mức xám theo từng cụm.
Ý nghĩa Công thức biến đổi T(g)
Giãn mức
xám
(32)
Biến đổi
Hyperbol
(
) [
] (33)
Trong đó:
12
{
(34)
Trong đó:g = giá trị xám gốc, = cận trên của việc giãn cụm , = cận dưới của
việc giãn cụm , = tâm cụm. Giá trị của các ngưỡng và được tính tự động theo
từng cụm như trong mục c dưới đây.
2.6.1.3. Tính ngưỡng tự động theo cụm
Giả sử, là hàm phân bố của mức xám theo một cụm cho trước. và các tham số:
, , .Các ngưỡng , tương tự như cách tính trong thuật toán tăng cường
sử dụng CM.
2.6.1.4. Sinh ảnh tăng cường dựa trên việc tổng hợp mức xám hiệu chỉnh theo cụm
Dựa trên mô hình biến đổi mức xám theo mỗi cụm đã xây dựng trong mụcb, mỗi giá trị xám
đầu vào sẽ được chuyển các thành giá trị mới tương ứng với các cụm. Nhiệm vụ còn lại là tổng hợp
các giá trị này để sinh ra giá trị xám duy nhất. Hàm tổng hợp này có dạng tổng quát như sau: g |
g’ = T(g). Trong đó,
(35)
Trong đó, g = giá trị xám gốc, = cận trên của việc giãn cụm V, = g cận dưới
của việc giãn cụm , = tâm cụm.
2.6.2. Phát triển thuật toán cho ảnh đa phổ
Bản chất KMeans là thuật toán phân cụm các đối tượng là các vector có nhiều thành phần. Và
do vậy, KMeansđã thực hiện rất tốt cho ảnh đa kênh như ảnh màu RGB. Như vậy, thuật toán trên áp
dụng cho ảnh viễn thám đa phổ như sau:
Bước 1: Cục bộ hóa ảnh đầu vào. Sau khi thực hiện thủ tục phân cụm, mỗi điểm ảnh P(
,
,
) sẽ được đặc trưng thêm bởi một bộ các giá trị độ thuộc ứng với các cụm khác
nhau. Như vậy, quan hệ cùng một điểm ảnh của một bộ (
,
,
) được đặc trưng bởi
bộ các giá trị độ thuộc trên. Do đó, giải quyết được hạn chế thứ 3 trong mục 2.2.
Bước 2: Xây dựng mô hình hiệu chỉnh mức xám. Vẫn thực hiện việc này như được trình
bày trong mục 2.5.1.b.
Bước 3: Tính ngưỡng tự động. Các ngưỡng
và
được tính tự động theo
từng cụm và từng kênh k.
Bước 4: Sinh ảnh tăng cường. Với mỗi điểm ảnh P, ta có:
(36)
13
Trong đó,
= giá trị xám gốc của điểm ảnh P thuộc kênh thứ k,
= cận trên của việc
giãn cụm thuộc kênh thứ k, = cận dưới của việc giãn cụm thuộc kênh thứ k, = tâm
cụm. Mỗi tâm gồm môt bộ ( , , )
2.6.3. Thử nghiệm và đánh giá
2.6.3.1. Quy trình thử nghiệm
Luận án tiến hành thử nghiệm thuật toán tăng cường ảnh đề xuất và so sánh với kết quả của
phương pháp tăng cường mờ.Môi trường thực nghiệm: Bộ xử lý Core 2 Duo tốc độ 1.8Gh , RAM
2G, hệ điều hành indows 7.Để đánh giá, luận án sử dụng phương pháp trực quan và đánh giá
thông qua chỉ sốtuyến tính mờ γ [HAS][SUD] như đã mô tả trong mục 2.4.4. Tập dữ liệu thử
nghiệm như được trình bày trong mục 2.4.5.2. Các kết quả thử nghiệm cho thấy kĩ thuật cải tiến cho
ảnh chất lượng tốt hơn kĩ thuật mờ.
Trong thử nghiệm dưới đây, ảnh gốc là ảnh vệ tinh LANDSAT khu vực huyện Lac Son, tỉnh
Hoà Bình.
Bảng 2.7. Tăng cường ảnh với phương pháp mờ và cải tiến.
Đầu vào Hyperbol mờ Tăng cường mờ Giãn KM Hyperbol KM
Bảng 2.8. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.
Kênh Hyperbol mờ Tăng cường mờ Giãn KM Hyperbol KM
1 0.34 0.43 0.18 0.12
2 0.29 0.43 0.21 0.17
3 0.35 0.40 0.24 0.20
2.7. Kết luận chương II
Đầu tiên, luận án đã trình bày một số toán tử tăng cường mờ và phân tích một số hạn chế của
tiếp cận tăng cường độ tương phản ảnh dựa trên logic mờ. Luận án trình bày đề xuất các giải pháp
tăng cường ảnh viễn thám dựa trên tiếp cận cục bộLoRSIE, được thể hiện qua hai thuật toán tăng
cường sử dụng thuật toán phân cụm KMeans và CM.
Thuật toán tăng cường sử dụng CM gặp vấn đề với ảnh kích thước lớn nên được cải tiến để
phát triển thành thuật toán LaRSIE_FCM. Kết quả thử nghiệm cho thấy phương pháp cải tiến cho
chất lượng ảnh tăng cường cao hơn so với phương pháp tăng cường dựa trên logic đã có và thực
hiện tốt trên ảnh viễn thám kích thước lớn. Tuy nhiên, tốc độ thực thi của LaRSIE còn chậm so với
các thuật toán dựa trên logic mờ. Trong nghiên cứu tiếp theo, luậnándự kiến sẽ nghiên cứu giải
pháp tăng tốc độ thuật toán phân cụm mờ để tăng tốc độ thực thi cho thuật toán LoRSIE và LaRSIE.
14
CHƯƠNG III: PHÁT TRIỂN MỘT SỐ THUẬT TOÁN PHÂN LỚP ẢNH VIỄN
THÁM ĐA PHỔ
3.1. Phân cụm ảnh viễn thám với thuật toán KMeans
3.1.1. Thuật toán KMeans
Thuật toán KMeans đã được trình bày trong mục 2.6.1.1.
3.1.2. Thuật toán CCEA_KMeans
Trong [Chih], các tác giả đề xuất thuật toán khởi tạo tâm CCEA để tăng tốc độ thuật toán
KMeans mờ. Thuật toán được trình bày như sau:
Đầu vào:
Tập S gồm N đối tượng xi với i = 1..N
M số tập con SBl (l = 1..M) của S
f để xác định kích thước tập con SBl của S (f < 1)
Đầu ra: Các cụm Cj (j = 1..c)
Các bước thuật toán như sau:
Bước 1: Chọn ngẫu nhiên M tập con SBl có kích thước fN từ tập dữ liệu S sao cho SBi
SBj = Ø (i ≠ j), trong đó f < 1. Đặt SU = SBl và p = 0.
Bước 2: Cho tập tâm cụm khởi đầu SCp = {Cj} và tập dữ liệu SU, sử dụng CD KM để xác
định tập các tâm cụm SCp+1 = {Cj}.
Bước 3: Cập nhật p = p + 1 và đặt SU = SU SBp+1. Nếu p ≤ M, quay lại bước 2.
Bước 4: SCM là tập tâm cụm khởi tạo.
Bước 5: Phân cụm tập S với tập tâm SCM
Nếu áp dụng CCEA cho KMeans thì trong bước 2 chỉ cần thay CD KM bằng KMeans ta
được CCEA_KMeans.
3.1.3. Thuật toán 2D-KMeans
Trong [Int], các tác giả trình bày thuật toán 2D-KMeans. Điểm khác biệt giữa KMeans và 2D-
KMeans là:
Với KMeans, mỗi đối tượng x là một vector với các thành phần là cường độ của đối tượng
tương ứng: xINT. Như vậy, mỗi tâm là một vector trung bình cường độ theo cụm: CINT.
Với 2D-KMeans, mỗi đối tượng x gồm một cặp 2 vector: vector với các thành phần cường
độ xINT và vector trung vị cục bộ xMED (công thức 18). Như vậy, mỗi tâm C gồm một cặp 2
vector: vector trung bình cường độ theo cụm: CINT và vector trung bình trung vị theo cụm:
C
MED
(công thức 19).
(37)
[ ∑ ∑
] (38)
15
3.1.4. Hạn chế của thuật toán KMeans
Thuật toán KMeans dù phân cụm ảnh viễn thám rất hiệu quả vẫn còn hai điểm hạn chế:
Hạn chế 1: Tốc độ thực thi với ảnh kích thước lớn như ảnh viễn thám còn chậm.
Hạn chế 2: Không bao gồm thông tin ngữ cảnh – lân cận của mỗi điểm ảnh [Int].
3.1.5. Một số độ đo chất lượng phân cụm ảnh
Để đánh giá chất lượng phân cụm, chúng ta có thể sử dụng chỉ số F(I), F’(I) ... Chỉ số này
tuân theo các tiêu chí về sự đồng nhất cụm[Int]. Chỉ số này được tính như sau:
√ ∑
√
(39)
√∑ [ ]
∑
√
(40)
Trong đó, I là ảnh phân đoạn, là kích thước ảnh, R là số vùng trong ảnh phân cụm,
là diện tích điểm ảnh vùng thứ i, và là lỗi màu vùng i (tổng khoảng cách Euclide giữa các vector
màu mức xám của các điểm ảnh của vùng thứ i và vector màu qui cho vùng i trong ảnh phân đoạn),
R(A) là số vùng có diện tích bằng A, và Max là diện tích của vùng lớn nhất trong ảnh phân đoạn.F(I)
càng nhỏ thì tính đồng nhất cụm càng cao tức là chất lượng phân cụm càng tốt.
3.1.6. Đề xuất thuật toán WIKMeans
3.1.6.1. Trình bày thuật toán WIKMeans
Để khăc phục hạn chế (1), trong mục này, luận án để xuất thuật toán phân cụm KMeans cải
tiến với việc khởi tạo tâm cụm sử dụng kĩ thuật avelet. Biến đổi avelet được sử dụng để giảm
kích thước ảnh. Ảnh cực tiểu của biến đổi avelet được sử dụng để tiến hành phân cụm và sinh tập
tâm khởi tạo.Thuật toán được mô tả như sau:
B1: Biến đổi avelet
B2: Phân cụm KMeans ảnh cực tiểu để được tập tâm cụm khởi tạo
B3: Phân cụm ảnh gốc với tập tâm khởi tạo thu được trong B2 ở trên.
Do thuật toán IKMeans không thực thi trực tiếp trên ảnh gốc mà trên ảnh kích thước nhỏ
hơn nên sẽ thu được tập tâm khởi tạo rất nhanh và càng nhanh nếu mức rã càng nhiều. Hơn nữa, ảnh
cực tiểu lựa chọn là ảnh xấp xỉ của ảnh ban đầu nên gần như giữa nguyên được các đặc trưng trên
ảnh gốc, khác biệt chính là về kích thước và tỉ lệ nhiễu. Do đó, tập tâm khởi tạo thu được rất gần tập
tâm khi hội tụ trong trường hợp KMeans phân cụm trực tiếp trên ảnh đầu vào. Do đó, tập tâm này là
khởi tạo rất tốt để KMeans phân cụm trên ảnh gốc.
3.1.6.2.Thử nghiệm
Luận án tiến hành thử nghiệmthuật toán đề xuất IKMeans và so sánh kết quả với thuật toán
KMeans, CCEAKMeans về mặt tốc độ thực thi phân cụm.Tập dữ liệu phục vụ cho thử nghiệm gồm
3 loại ảnh: LANDSAT, SPOT, Quickbird.Các kết quả thử nghiệm cho thấy hai điều. Một là, hời
gian thực hiện của thuật toán KMeans là rất lớn so với thuật toán đề xuất IKMeans. Hai là, thời
gian thực hiện của thuật toán đề xuất IKMeans là nhỏ hơn so với thuật toán CCEAKMeans.
16
Thử nghiệm – ảnh huyện Đà Bắc
Hình 3.1. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans, CCEAKMeans và
WIKMeans.
3.1.7. Đề xuất thuật toán CIKMeans
3.1.7.1. Trình bày thuật toán CIKMeans
Theo mục 3.1.3, với 2D-KMeans, mỗi đối tượng x gồm một cặp 2 vector: vector với các thành
phần cường độ xINT và vector trung vị cục bộ xMED. Như vậy, mỗi tâm C gồm một cặp 2 vector:
vector trung bình cường độ theo cụm: CINT và vector trung bình trung vị theo cụm: CMED.
Để khắc phục hạn chế (3), với CIKMeans (Context Information KMeans), mỗi đối tượng x
gồm một cặp 2 vector: vector với các thành phần cường độ xINT và vector gần trung vị cục bộ xHP.
x
HP
lấy xMED hoặc bên trái xMED hoặc bên phải xMED tu theo điểm nào gần với điểm trong ảnh đầu
vào nhất. Như vậy, mỗi tâm C gồm một cặp 2 vector: vector trung bình cường độ theo cụm: CINT và
vector trung bình gần trung vị theo cụm: CHP. Kết quả này đã được nghiên cứu sinh công bố trong
[TRU6].
(45)
[ ∑ ∑
] (46)
3.1.7.2. Thử nghiệm
Dữ liệu thử nghiệm như được mô tả trong mục 3.1.6.2..Để đánh giá chất lượng phân cụm,
luận ánsử dụng chỉ số F(I), như được mô tả trong mục 3.1.5. Các kết quả thử nghiệm cho thấy, về
chất lượng phân cụm, độ đồng nhất của các cụm sinh ra bởi thuật toán đề xuất CIKMeans là cao
hơn so với thuật toán 2D-KMeans.
Thử nghiệm – ảnh huyện Đà Bắc
Hình 3.9 thống kê độ đồng nhất các cụm của KMeans, IKMeans, 2D-KMeans, CIKMeans
và WICI-KMeans với số cụm lần lượt là 5, 8, 11, 14 và 17. Trong đó, ICI-KMeans là sự kết hợp
của IKMeans (khởi tạo tâm) và CIKMeans.
17
Hình 3.2.Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans, WIKMeans, 2D-
KMeans, CIKMeans và WICI-Kmeans (*1.0e+3).
3.1.8. Đề xuất thuật toán KMeansCMN
3.1.8.1. Trình bày thuật toán KMeansCMN
Với công thức tính tâm như (13), tâm thu được dễ bị ảnh hưởng bởi nhiễu. Chúng ta có thể áp
dụng phép chuẩn hóa trung bình phổ để cho một công thức tính tâm cụm có thể giảm nhiễu. Tuy
nhiên, phép chuẩn hóa này chỉ tốt khi số phần tử là rất lớn. Trong phần này, luận án đề xuất thuật
toán phân cụm KMeansCMN cải tiến cho ảnh viễn thám kích thước lớn [TRU4] và [TRU7]với
công thức tính tâm cụm áp dụng kĩ thuật chuẩn hóa trung bình phổ như sau:
- Nếu số lượng điểm ảnh trong cụm nhỏ hơn hằng số rất lớn Max thì tâm vẫn tính theo công
thức (13) như sau:
∑
(49)
- Nếu số lượng điểm ảnh trong cụm lớn hơn hằng số rất lớn Max thì tâm tính theo công thức
(17) như sau:
(50)
Thủ tục tính tâm cụm CMN(Clusterj) tại vòng lặp thứ n như sau:
Bước 1: Khởi tạo tâm theo công thức
(51)
Bước 2: Với mỗi tính theo công thức
-
(52)
Trong nghiên cứu này, chúng tôi chọn Max = 50000 và = 0.95.
3.1.8.2. Thử nghiệm
Tập dữ liệu phục vụ cho thử nghiệm gồm các ảnh LANDSAT, SPOT và Quickbird như được
mô tả trong mục 2.4.6.Để đánh giá chất lượng phân cụm, trong [Int], luận án sử dụng chỉ số F(I)
như trình bày trong mục 3.1.5. Các thử nghiệm so sánh độ đồng nhất tâm cụm và thời gian thực thi
đều cho thấy KMeansCMN tốt hơn KMeans.
18
Thử nghiệm - ảnh SPOT
Hình 3.3. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans, KMeansCMN
(*1.0e+3).
Bảng 3.1. Thời gian phân cụm (ms).
Số cụm KMeans KMeansCMN
5
Thời gian (ms) 2,616,938 2,413,791
Số vòng lặp 25 23
7
Thời gian (ms) 3,663,713 3,379,307
Số vòng lặp 23 22
10
Thời gian (ms) 11,275,333 8,618,345
Số vòng lặp 30 26
3.2. Phân cụm ảnh viễn thám với thuật toán Fuzzy C-Means
3.2.1. Hạn chế của thuật toán Fuzzy C-Means
Nhược điểm của CM với ảnh viễn thám kích thước lớn được trình bày tại mục 2.4.3 trong
chương II.
3.2.2. Đề xuất thuật toán lsiFCM
3.2.2.1. Trình bày thuật toán lsiFCM
Trong phần này, luận án đề xuất thuật toán phân cụm mờ ảnh viễn thám kích thước lớn mà
chúng tôi tạm gọi là lsi CM (large si e image u y cMeans). Thuật toán được trình bày như sau:
B1: Chia ô
Chúng ta có thể biểu diễn lại ảnh theo khía cạnh tập hợp. Biểu diễn ban đầu của ảnh theo tập
các pixel. Giả sử ảnh có kích thước M x N. Khi đó ta có:
Image = {Pix(i,j): 1 ≤ i ≤ M, 1 ≤ j ≤ N} (50)
Ảnh gốc được chia thành P x Q ô (p ô theo chiều ngang, q ô theo chiều dọc). Mỗi ô có kích
thước không quá 512 x 512 (Mc x Nc) pixel để đảm bảo thủ tục CM có thể thực thi. Theo chiều
ngang, 2 ô liền kề có phần xếp chồng bằng một nửa kích thước mỗi ô Cell(x,y). Theo chiều dọc,
2 ô liền kề có phần xếp chồng bằng một nửa kích thước mỗi ô. Khi đó, ta có biểu diễn mới của
ảnh như sau:
Image = {Cell(x,y): 1 ≤ x ≤ P, 1 ≤ y ≤ Q} (51)
19
Trong đó:
Cell(x,y) = {Pix(i,j): 1 ≤ i ≤ Mc, 1 ≤ j ≤ Nc} (52)
Mc, Nc < 1024
B2: Phân cụm FCM các ô
Tiến hành phân cụm mỗi ô Cell(x,y) với thuật toán CM.Gọi V(x,y,k) là tâm thứ k tại ô
Cell(x,y), ta được c tâm cụm của ô Cell(x,y):
CentersCell(x,y) = {V(x,y,k): 1 ≤ k ≤ c } (53)
1 ≤ x ≤ P, 1 ≤ y ≤ Q
Tính trọng số mỗi tâm thứ k của ô Cell(x,y) theo công thức:
∑ ∑
(54)
Trong đó, là giá trị hàm thuộc của điểm ảnh với cụm thứ k trong ô
Cell(x,y).
Sau khi đã phân cụm tất cả các ô, ta được:
Tập tâm cụm như sau:
CentersImage = {CentersCell(x,y) : 1 ≤ x ≤ P, 1 ≤ y ≤ Q } (55)
CentersImage = {V(x,y,k): 1 ≤ x ≤ P, 1 ≤ y ≤ Q, 1 ≤ k ≤ c } (56)
Tập các trọng số như sau:
WeiImage = {Wei(x,y,k): 1 ≤ x ≤ P, 1 ≤ y ≤ Q, 1 ≤ k ≤ c } (57)
B3: Phân cụm tập tâm cụm sử dụng FCM
Sau khi thu được tập các tâm cụm của các ô, tiếp tục thực hiện thuật toán phân cụm CM trên
tập các tâm cụm này với hàm mục tiêu và công thức tính tâm hiệu chỉnh như sau:
∑
∑
(58)
Từ đây, ta thu được tập tâm cụm với c tâm cụm cuối cùng.
B4: Tổng hợp
Từ c tâm cụm thu được trong B3, tính lại giá trị hàm thuộc của từng điểm trong ảnh ảnh đầu
vào với mỗi tâm cụm.
3.2.2.2. Thử nghiệm
Luận án tiến hànhthử nghiệm thuật toán đề xuất lsi CM và so sánh với thuật toán gốc CM.
Tập dữ liệu thử nghiệm như được mô tả trong phần 2.4.4. Trong đó, 2 mẫu với kích thước trung
bình mà vẫn có thể thực hiện với CM (trong điều kiện RAM không lớn) để so sánh kết quả của hai
thuật toán. Kích thước mỗi ô không lớn hơn 250 x 250 điểm ảnh.Để đánh giá chất lượng phân cụm,
luận án sử dụng chỉ số độ đồng nhất cụmF(I) và F’(I)[Int]như được trình bày trong mục 3.1.5.Tập
dữ liệu phục vụ cho thử nghiệm được mô tả tại mục 2.4.5.2 trong chương II.Trong thử nghiệm này
chúng tôi chọn máy tính có RAM 1GB. Các mẫu thử nghiệm là ảnh lớn mà với số cụm trong thử
20
nghiệm đủ để CM không thể thực hiện với RAM 1GB. Về mặt chất lượng phân cụm, theo đánh
giá độ đồng nhất từ các bảng và biểu đồ trên, lsi CM vẫn đảm bảo độ ổn định so với CM, thậm
chí có trường hợp tốt hơn CM.
Thử nghiệm - Ảnh gốc là ảnh vệ tinh Quickbird có kích thước 2056 x 2065 (điểm ảnh).
H
Các file đính kèm theo tài liệu này:
- tom_tat_luan_an_nghien_cuu_nang_cao_chat_luong_va_giai_doan.pdf