MỞ ĐẦU.1
1. Đặt vấn đề .1
2. Những nội dung nghiên cứu chính.3
CHƯƠNG 1:.4
GIỚI THIỆU VỀ CÔNG NGHỆ LIDAR VÀ CÁC ỨNG DỤNG.4
1.1 Tổng quan về công nghệ LiDAR.4
1.1.1 Cấu trúc hệ thống LiDAR.4
1.1.2 Đặc điểm cơ bản của công nghệ LiDAR.5
1.2. Khả năng ứng dụng của LiDAR .7
1.3. Bài toán phân loại dữ liệu LiDAR.13
1.3.2 Cơ bản về tệp tin .LAS.14
1.3.3 Phân loại đám mây điểm LiDAR trong tập tin LAS.16
1.4 Kết chương: .18
CHƯƠNG 2:.19
MỘT SỐ KỸ THUẬT PHÂN LOẠI DỮ LIỆU LIDAR.19
2.1 Nghiên cứu liên quan đến sử dụng thuật toán MCC (Multiscale Curvature
Classification) và K-Means trong phân loại dữ liệu LiDAR.19
2.1.1 Thuật toán MCC (Multiscale Curvature Classification) .19
2.1.2 Thuật toán K-Means.21
2.2. Đánh giá kết quả phân loại LiDAR.23
2.2.1 Thuật toán MCC.23
2.2.2 Thuật toán K-Means.26
55 trang |
Chia sẻ: honganh20 | Lượt xem: 742 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu kỹ thuật phân loại dữ liệu LiDAR, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
bộ cảm biến.
Hệ thống xác định quán tính IMU: Các giá trị góc xoay, góc nghiêng dọc, nghiêng
ngang, hướng bay quét của hệ thống LiDAR được xác định chính xác bằng thiết bị
đạo hàng, góc quay gương tức thời và các khoảng cách thu nhận và dữ liệu GPS được
dùng để tính toán toạ độ ba chiều của các điểm LiDAR.
5
Hệ thống GPS: Dữ liệu LiDAR được kết hợp với các thông tin vị trí chính xác
thu nhận từ thiết bị GPS và hệ thống thiết bị xác định các thông số định hướng góc
xoay, góc nghiêng dọc, nghiêng ngang cùng đặt trên máy bay. Các thông tin này được
lưu trữ và xử lý, để xác định giá trị toạ độ (x,y,z) chính xác của mỗi điểm trên mặt
đất. Hệ thống GPS gồm một máy thu đặt trên máy bay và một máy thu đặt tại mặt
đất, quá trình xử lý dữ liệu này cho ra kết quả vị trí điểm có độ chính xác cao (+/- vài
cm đến vài chục cm).
Hệ thống quản lý bay: Cho phép lập kế hoạch, thiết kế tuyến bay và theo dõi quá
trình bay quét LiDAR.
Hình 1. 1: Tổng quan về hệ thống LiDAR
1.1.2 Đặc điểm cơ bản của công nghệ LiDAR
Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không gian
GPS/INS và sự nhận biết cường độ phản xạ ánh sáng [3]. Xung của laser được phát
hướng xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ mặt đất
hay từ các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi xung sẽ đo được
thời gian đi và về của tín hiệu, tính được khoảng cách từ nguồn phát laser tới đối
tượng. Ở mỗi thời điểm phát xung laser, hệ thống định vị vệ tinh GNSS sẽ xác định
6
vị trí không gian của điểm phát, và hệ thống đạo hàng quán tính sẽ xác định các góc
định hướng trong không gian của tia quét. Với các trị đo tổng hợp đó tính được vị trí
(tọa độ không gian) của các điểm trên bề mặt đất.
Công nghệ LiDAR có nhiều tính năng vượt trội so với các công nghệ đo đạc
truyền thống, nó có những đặc điểm cơ bản như:
- Độ chính xác xác định vị trí không gian của các đối tượng địa lý rất cao. Độ
chính xác độ cao < 20cm, độ chính xác mặt phẳng < 25cm.
- Thời gian thu thập và xử lý dữ liệu cực nhanh. Thời gian bay quét LiDAR với
khoảng 1000km2 là khoảng 25-30 giờ, thời gian xử lý tạo DEM với 1000km2
là khoảng 10 ngày.
- Không giống như các phương pháp đo ảnh hay đo đạc ngoài trời khác, công
nghệ LiDAR chủ yếu là tự động hóa, ít có sự can thiệp trực tiếp của con người.
Thành quả dữ liệu rất khách quan, mức độ tin cậy cao.
- Hệ thống LiDAR thu thập dữ liệu không phụ thuộc vào ánh sáng mặt trời, có
thể thực hiện cả ngày và đêm, điều kiện thời tiết không đòi hỏi khắt khe.
- Xung ánh sáng của hệ thống LiDAR có thể đi qua đối tượng vòm như tán cây,
mặt nước, mái che kính, tấm ni lông mỏng và phản xạ tới 4 lần. Mỗi lần
phản xạ là một mức truyền khác nhau và ghi nhận một giá trị tọa độ (XYZ)
khác nhau. Đây là một tính năng đặc biệt mà công nghệ đo vẽ ảnh khác không
thể thực hiện được. Với tính năng này việc thực hiện bay quét ở vùng rừng cây
hoặc nơi có thực phủ không quá dày đặc vẫn có thể thi công và thể hiện được
bề mặt đất.
- Điểm phân giải điểm đo chi tiết cao, khi đầu phát đạt 150.000 xung trên 1 giây,
độ cao bay 1000m thì mật độ khoảng 3 điểm trên 1m2. Hiện nay có nhiều hệ
thống LiDAR có đầu phát đạt 240.000 xung trên 1 giây. Công nghệ LiDAR
với khả năng đo điểm trực tiếp ngoại nghiệp mật độ rất cao, độ chính xác lớn,
tốc độ nhanh.
- Điểm khống chế mặt đất rất ít, có thể chỉ 1 điểm cho mục đích cải chính DGPS.
Công nghệ LiDAR đặc biệt lợi ích là công cụ lý tưởng khi nó được áp dụng
7
cho các vùng xa xăm, hẻo lánh khi mà con người rất khó tiếp cận trong triển
khai đo đạc ngoại nghiệp.
- Công nghệ LiDAR ghi nhận được các giá trị mức phản xạ ánh sáng của các
đối tượng trên mặt đất, dữ liệu này có thể được dùng để tạo ra ảnh cường độ
xám, phân loại đối tượng, chiết xuất đối tượng trên mặt đất. Đây là một đặc
tính có giá trị gia tăng của dữ liệu LiDAR.
- Một số hệ thống LiDAR ngoài chức năng đo quét trên mặt đất, còn có thể thực
hiện chức năng đo sâu (hiện nay có thể đo sâu đến 40m).
- Tổ chức thi công đơn giản, gọn nhẹ hơn các phương pháp khác, số người cần
tham gia rất ít (khoảng 10-15 người).
- Hiệu quả kinh tế rất cao khi ứng dụng công nghệ LiDAR cho mục đích thu
thập dữ liệu không gian với yêu cầu thời gian ngắn, độ chính xác cao và mật
độ dày đặc [3].
1.2. Khả năng ứng dụng của LiDAR
Công nghệ LiDAR đã thể hiện nhiều ưu thế vượt trội hơn với các công nghệ
khác trong việc đo đạc thành lập bản đồ, xây dựng cơ sở dữ liệu hay mô phỏng không
gian ba chiều. Các nguồn dữ liệu thu nhận được có thể được ứng dụng trong nhiều
lĩnh vực khác nhau như giáo dục, viễn thông, theo dõi đánh giá khai thác mỏ, quân
sự, nghiên cứu lập bản đồ khu vực ngập lụt, dự báo thảm hoạ, bản đồ địa hình dải ven
biển, quy hoạch đô thị, lập bản đồ đường dây tải điện,
a) Khảo sát địa hình và lập bản đồ:
Kết quả đầu ra cơ bản là các mô hình số địa hình (DEM – Digital Elavation
Model) và mô hình số bề mặt (DSM – Digital Surface Model) với độ phân giải và độ
chính xác cao, LiDAR rất phù hợp để ứng dụng trong việc thành lập bản đồ tỷ lệ lớn,
các ứng dụng liên quan đến phát triển hoặc quản lý duy trì hạ tầng cơ sở.
8
Hình 1. 2: Ứng dụng LiDAR trong khảo sát địa hình và lập bản đồ
b) Lâm nghiệp:
Trong lĩnh vực lâm nghiệp, công nghệ LiDAR chủ yếu được sử dụng để đánh
giá, thống kê, phân tích điều kiện sống hoang dã, tương quan của các yếu tố như tán,
độ dày tán, dạng lá, hay sản lượng gỗ rừng; ước tính sinh khối, trữ lượng gỗ và các
tham số lâm nghiệp khác.
Hình 1. 3: Ứng dụng LiDAR trong lâm nghiệp
c) Lập bản đồ ngập úng:
Dữ liệu LiDAR được sử dụng hiệu quả trong xây dựng các mô hình ngập úng,
xác định ranh giới ngập úng, cung cấp thêm nhiều thông tin về các đối tượng/địa vật
chịu ảnh hưởng; từ đó thành lập bản đồ nguy cơ ngập úng, vùng ưu tiên sơ tán.
9
Hình 1. 4: Ứng dụng LiDAR trong lập bản đồ ngập úng
d) Các ứng dụng cho đới duyên hải:
Do dữ liệu LiDAR có độ chính xác cao cùng mật độ điểm dữ liệu dày đặc
trong thời gian thu thập dữ liệu ngắn. Dữ liệu này rất phù hợp cho các ứng dụng để
quản lý và dự báo xói mòn bờ biển; giúp đánh giá và dự báo bồi lắng, quan trắc cũng
như lập dự báo ngập lụt ven biển
Hình 1. 5: Ứng dụng LiDAR cho đới duyên hải
e) Địa hình ven biển:
Công nghệ LiDAR có thể giúp lập bản đồ địa hình đáy biển độ sâu tới 70m,
hữu ích trong các dự án xác định luồng lạch tàu vào, thiết kế quy hoạch cảng và các
kênh giao thông thuỷ.
10
Hình 1. 6:Ứng dụng LiDAR trong lập bản đồ địa hình ven biển
f) Trượt lở:
LiDAR có thể sử dụng để quan trắc và dự báo trượt lở, đặc biệt với ác sườn
dốc, nhờ đặc điểm thu thập dữ liệu nhanh chóng với độ chính các cao và mật độ dữ
liệu dày đặc. Công nghệ này cũng có thể được sử dụng để đánh giá nhanh thiệt hại và
thiết lập bản đồ thể hiện tình trạng hậu trượt lở nhanh chóng chính xác.
Hình 1. 7: Ứng dụng LiDAR trong quan trắc dự báo trượt lở
g) Các tuyến truyền tải:
LiDAR được áp dụng trong việc lập bản đồ các tuyến truyền tải trải dài, giúp
thể hiện chính xác vị trí các tháp truyền tải hoặc cột điện, phân định địa hình của hành
lang truyền tải và các loại đối tượng tồn tại trong hành lang (cây xanh) giúp điều
chỉnh, sửa chữa duy tu và thiết kế nâng cấp.
11
Hình 1. 8: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải
h) Lập bản đồ giao thông:
Công nghệ LiDAR thường được sử dụng để: quan trắc, giám sát, duy tu bảo
dưỡng và quản lý các đối tượng như đường sắt, đường bộ, hệ thống tín hiệu biển báo,
các trạm dừng đỗ, nhà ga bến cảng, sự xuống cấp mặt đường, điểm tai nạn, mật độ
giao thông, bùng binh, mà không cần làm gián đoạn các dịch vụ liên quan.
Hình 1. 9: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải
12
i)Mạng điện thoại di động:
Một trong những yêu cầu của việc quy hoạch và quản lý các mạng điện thoại
di động đó là cần có thông tin bề mặt địa hình, lớp phủ thực vật, các toà nhà và công
trình một cách chi tiết. Công nghệ LiDar xác định cơ sở dữ liệu chính xác và chi tiết
các thông tin về các chướng ngại vật tự nhiên và nhân tạo là cực kỳ quan trọng.
Hình 1. 10: Ứng dụng LiDAR trong quy hoạch và quản lý mạng điện thoại di động
j) Lập mô hình đô thị và mô phỏng đô thị:
Lidar thường được ứng dụng để tạo ra mô hình thành phố ảo với nền địa lý và
các công trình xây dựng, kiến trúc, như đô thị thực. Mô hình này có thể được khai
thác phục vụ rất nhiều đối tượng từ quy hoạch kiến trúc, xây dựng, giao thông. Mô
hình này cũng được chia sẻ dưới các cách linh động khác nhau như: ứng dụng
desktop, ứng dụng web, sử dụng các chuẩn mở, dễ trao đổi và dễ cấu hình phù hợp
với từng đối tượng sử dụng.
Hình 1. 11: Ứng dụng LiDAR trong lập mô hình đô thị và mô phỏng đô thị
13
1.3. Bài toán phân loại dữ liệu LiDAR
1.3.1 Khái niệm
Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không
gian GPS/INS và sự nhận biết cường độ phản xạ ánh sáng. Xung của laser được
phát hướng xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ
mặt đất hay từ các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi
xung sẽ đo được thời gian đi và về của tín hiệu, tính được khoảng cách từ
nguồn phát laser tới đối tượng. Ở mỗi thời điểm phát xung laser, hệ thống định
vị vệ tinh GNSS sẽ xác định vị trí không gian của điểm phát, và hệ thống đạo
hàng quán tính sẽ xác định các góc định hướng trong không gian của tia quét.
Với các giá trị đo tổng hợp đó sẽ tính được vị trí (tọa độ không gian) của các
điểm trên bề mặt đất. Một tín hiệu phát đi, sẽ có một hay nhiều tín hiệu phản
xạ. Kết quả cuối cùng, sẽ có được đám mây điểm.
Dữ liệu điểm của LiDAR sẽ được tiền xử lý sau khi hệ thống thu nhận
được hệ tọa độ x, y, z có độ chính xác cao của đối tượng bằng cách phân tích
thời gian tia quét phản xạ, góc quét, vị trí thu nhận từ GPS, và thông tin INS.
Thuộc tính của dữ liệu LiDAR ghi nhận được cho mỗi xung bao gồm: cường
độ, số lượng xung phản hồi, giá trị điểm phân loại, góc quét của đường bay
chụp, giá trị RGB, thời gian định vị, góc quét và hướng quét.
Bảng 1. Thuộc tính của dữ liệu LiDAR
STT Tên thuộc tính Mô tả
1 Cường độ Độ đậm nhạt của xung dữ liệu LiDAR phản xạ ghi
nhận được từ điểm LiDAR.
14
2 Số lượng xung
phản xạ
Tổng số lượng xung phản hồi.
3 Điểm phân loại Mọi điểm LiDAR đều được phân loại trong quá
trình tiền xử lý để xác định được loại đối tượng
phản xạ.
4 Góc của đường
quét
Các điểm sẽ được ký hiệu với giá trị 0 và 1. Những
điểm theo đường góc quét sẽ được gán giá trị là 1,
những điểm còn lại được gán giá trị là 0
5 RGB Dữ liệu LiDAR có thể được gán với kênh phổ R,
G, B. Giá trị này thường được thu nhận từ ảnh
cùng thời gian với đo LiDAR
6 Thời gian định vị Giờ được thu nhận từ hệ thống GPS được phát ra
từ hệ thống không vận
7 Góc quét Giá trị của góc quét thường từ - 900 đến + 900
8 Hướng quét Hướng quét là hướng gương chụp laser đang di
chuyển tại thời điểm xung laser phát ra
9 x, y, z Tọa độ và độ cao của điểm phản xạ
Dữ liệu đám mây điểm LiDAR thường rất lớn, từ vài ngàn đến vài chục triệu
điểm tùy thuộc vào độ rộng của khu vực đo vẽ và sự phức tạp của khu vực đo vẽ.
Định dạng đám mây điểm thường là .las hay .laz.
1.3.2 Cơ bản về tệp tin .LAS
Bộ dữ liệu LAS lưu trữ một hoặc nhiều tệp LAS trên đĩa, cũng như các tính
năng bề mặt bổ sung. Tệp LAS là định dạng nhị phân chuẩn công nghiệp để lưu trữ
15
dữ liệu LiDAR trong không khí. Bộ dữ liệu LAS cho phép kiểm tra các tệp LAS, ở
định dạng gốc, nhanh chóng và dễ dàng, cung cấp số liệu thống kê chi tiết và vùng
phủ sóng của dữ liệu LiDAR chứa trong các tệp LAS.Một tập dữ liệu LAS cũng có
thể lưu trữ tham chiếu đến các lớp đối tượng có chứa các ràng buộc bề mặt. Các ràng
buộc bề mặt là đường nét, đa giác nước, ranh giới khu vực, hoặc bất kỳ loại tính năng
bề mặt nào khác được thực thi trong bộ dữ liệu LAS.
Bộ dữ liệu LAS cung cấp quyền truy cập ngay vào dữ liệu LiDAR mà không
cần chuyển đổi hoặc nhập dữ liệu. Các thuộc tính điểm LAS có thể được sử dụng để
lọc ra nội dung và tượng trưng cho các điểm trong 2D và 3D. Ngoài ra, dữ liệu LiDAR
thường xuất hiện dưới dạng một nhóm tệp, tập dữ liệu LAS cung cấp khả năng xác
định tập hợp các tệp LAS hợp lý để làm việc trong các dự án được bản địa hóa.
Hình 1. 12: Hiển thị dữ liệu trong tệp tin LAS
Bộ dữ liệu LAS tương tự như một tập dữ liệu địa hình với các chế độ xem trên
bề mặt, nhưng nó cũng có thể được sử dụng để xem điểm và không yêu cầu tiền xử
lý. Người dùng không bắt buộc phải thực hiện bất kỳ quá trình xử lý nào để nhanh
chóng hiểu dữ liệu LiDAR đang làm việc. Có thể làm việc trực tiếp trên các tệp LAS,
dưới dạng tập hợp hoặc dưới dạng tệp riêng lẻ. Bộ dữ liệu LAS hỗ trợ đường viền
hoặc các ràng buộc bề mặt khác sẽ được thêm vào mô hình bề mặt. Nó được hiển thị
16
như một bề mặt hoặc một đám mây điểm, cho phép nhanh chóng đánh giá và hiểu dữ
liệu LiDAR.
Có thể hiển thị bất kỳ sai sót hoặc vấn đề dữ liệu nào một cách nhanh chóng
do hiển thị nhanh và phân tích thống kê. Phân tích có thể được tiến hành trên mỗi và
mọi tập tinLAS hoặc trên toàn bộ tập dữ liệu LAS. Nếu có lỗi trong phân loại, có thể
sửa đổi việc phân loại các tập tin LAS bằng cách sử dụng LAS Dataset 2D Profile
View.
Bộ dữ liệu LAS có thể mở rộng, cho phép làm việc với các đám mây điểm lớn
một cách nhanh chóng và hiệu quả. Đại diện bộ dữ liệu LAS tự động cập nhật khi
xoay và thu phóng xung quanh màn hình. Bộ dữ liệu LAS là một bổ sung tuyệt vời
cho luồng công việc cho bộ dữ liệu địa hình và bộ dữ liệu mosaic, có thể xem nhanh
các tệp LiDAR trước khi nhập, phân tích hoặc chia sẻ dữ liệu LiDAR.
1.3.3 Phân loại đám mây điểm LiDAR trong tập tin LAS
Dữ liệu LiDAR được lưu trong tệp tin LAS thường là đám mây điểm. Các đám
mây điểm là tập hợp các điểm thể hiện hình dạng hoặc tính năng 3D. Mỗi điểm có
tập hợp các tọa độ X, Y, Z riêng và trong một số trường hợp có thêm các thuộc tính
bổ sung. Các điểm LiDAR được lưu trữ trong các tệp LAS thường được phân thành
các loại khác nhau bằng cách sử dụng các công cụ phân loại chuyên biệt bên ngoài
ArcGIS. Phân loại này thường được hoàn thành bằng cách đặt thông số dựa trên địa
hình, sau đó chạy thuật toán trên đám mây điểm để xác định loại đối tượng được liên
kết với mỗi điểm. Mã phân loại được gán cho mỗi điểm được ghi vào tệp LAS và,
trong hầu hết các trường hợp, tuân theo tiêu chuẩn ASPRS. Khi phân loại tự động
được thực hiện trên dữ liệu LiDAR, chúng thường không phân loại hoàn toàn tất cả
các điểm một cách chính xác nhưng thường chính xác đến khoảng 90 phần trăm của
các điểm. Để đảm bảo rằng 100% các điểm LiDAR được phân loại chính xác, cần
phân loại thủ công và dọn sạch dữ liệu. Đây là một công việc rất tốn thời gian, và một
số nhà cung cấp có thể yêu cầu một chi phí bổ sung để thực hiện phân loại thủ công.
17
Hình 1. 13: Ví dụ về đám mây điểm LiDAR được hiển thị dưới dạng 3D
Phân loại đám mây điểm là quá trình phân chia các điểm thành các lớp điểm
chuyên biệt như mặt đất, nước, thảm thực vật, xây dựng, đường dây điệnPhân loại
có thể là một hoạt động chuyên sâu xử lý và nhiều bộ dữ liệu LIDAR đã trải qua phân
loại hạn chế. Mặt đất hầu như luôn được bao gồm trong một tệp LAS, vì nó là cần
thiết để tạo ra một DTM. Các phiên bản thường dùng của định dạng LAS (1.2 và 1.3)
có 8 loại phân loại được xác định trước và có thể xử lý lên đến 32; phiên bản mới hơn
(1.4), vẫn chưa được sử dụng rộng rãi, có khoảng 20 lớp được định trước và có thể
xử lý 256.
18
Đám mây
điểm
LiDAR
Tiền xử lý Lọc điểm
Lựa chọn
thuật toán
Phân loại
Đánh giá độ
chính xác
Hình 1. 14: Quy trình phân loại đám mây điểm LiDAR
Việc phân loại đám mây điểm LiDAR thường được thực hiện theo quy trình
sau:
Sau quá trình phân loại đám mây điểm LiDAR sẽ được sử dụng để
thành lập DEM/DTM và được ứng dụng trong những bài toán cụ thể.
1.4 Kết chương:
Với mục đích sử dụng triệt để các dữ liệu quét LiDAR, việc phân loại các lớp
điểm theo từng lớp đặc trưng, theo mục đích nghiên cứu từng loại đối tượng, việc
“Nghiên cứu phương pháp phân loại dữ liệu LiDAR” sẽ góp phần mở rộng ứng
dụng công nghệ LiDAR trong nghiên cứu cấu trúc không gian của lớp phủ mặt đất.
Điều này là hoàn toàn cần thiết và mang tính thực tiễn cao, đặc biệt có ý nghĩa khi sử
dụng công nghệ LiDAR trong nghiên các thảm thực vật, nghiên cứu sinh khối và tầng
thứ của rừng đa tầng nhiệt đới, nghiên cứu bờ biển hay thay đổi của bề mặt phủ.
19
CHƯƠNG 2:
MỘT SỐ KỸ THUẬT PHÂN LOẠI DỮ LIỆU LIDAR
2.1 Nghiên cứu liên quan đến sử dụng thuật toán MCC (Multiscale
Curvature Classification) và K-Means trong phân loại dữ liệu LiDAR
2.1.1 Thuật toán MCC (Multiscale Curvature Classification)
Thuật toán MCC (Multiscale Curvature Classification) là thuật toán được sử
dụng để phân loại đám mây điểm LiDAR 3D được phát triển bởi Moscow Forestry
Sciences Laboratory, sử dụng chủ yếu để phân loại các tia phản xạ LiDAR trong môi
trường rừng. Thuật toán này được sử dụng để phân loại các điểm thành hai lớp là mặt
đất (ground) và không mặt đất (non-ground). Đây là thuật toán phân loại đám mây
điểm LiDAR tự động. MCC là thuật toán lặp đa tỉ lệ để phân loại tín hiệu phản xạ
LiDAR mà vượt quá ngưỡng độ cong của bề mặt, cách tiếp cận đa tỉ lệ sẽ xác định
độ lệch của các điểm cần phân loại với bề mặt trung bình và loại bỏ dần những điểm
trên bề mặt khỏi nhóm mặt đất. Quá trình phân loại bắt đầu bằng việc xác định xem
các điểm thuộc những tia phản xạ đơn hay phản xạ cuối cùng cũng như phản xạ đầu
tiên từ thực vật. Thuật toán MCC sẽ tính toán bề mặt trung bình từ những điểm mặt
đất đặc trưng bằng phép lặp TPS (Thin Plate Spline), sau đó sẽ hiệu chỉnh nó thông
qua một lõi lọc. Những tính năng của thuật toán MCC sử dụng để phân loại đám mây
điểm LiDAR hỗ trợ cho quá trình lặp để tìm kiếm bề mặt thật của Trái đất với độ
phân giải tương ứng với mẫu.
Có bai cải tiến của thuật toán, đó là:
- Phép lặp TPS (Thin Plate Spline)
- Sử dụng cách tiếp cận đa tỉ lệ với bề mặt chuẩn được nội suy với các độ
phân giải khác nhau
- Lũy tiến độ cong mở [6]
20
Thuật toán MCC có hai tham số là s (scale - biểu thị cho tỉ lệ) và t là ngưỡng
độ cong (curvature threshold), trong đó tham số tỉ lệ là hàm của tỉ lệ các đối tượng
trên mặt đất và khoảng lấy mẫu (khoảng cách sau) của dữ liệu LiDAR [9].
Thuật toán MCC được mô tả như sau:
Input: đám mây điểm LiDAR
Output: điểm sau phân loại với hai lớp mặt đất và không mặt đất
Initial: U0 đám mây điểm LiDAR
U = {P1, P2, , Pn} – chứa các điểm chưa được phân loại
Pj(xj, yj, zj) – điểm LiDAR rời rạc
int l[1 3] – miền tỉ lệ
tl – độ cong cho miền tỉ lệ l – khởi tạo bởi người dùng
l – độ phân giải cho l
Procedure:
Phân loại những điểm có độ cao trong U0 và gán chúng vào lớp không
mặt đất
For l = 1 to 3
Repeat
Lặp tìm S = TPS(U, l, f)
Lặp tìm S’ = 3x3
For each Pj Î U
If zj > S’(xj, yj) + tli then
Phân Pj vào lớp không mặt đất
Loại Pj khỏi U
Untill điểm không thuộc U < 10% tổng số điểm
của nó
Phân lớp các điểm còn lại của U vào lớp mặt đất
End
21
2.1.2 Thuật toán K-Means
Thuật toán K-means là tìm phương pháp phân nhóm các đối tượng (objects)
đã cho vào K cụm (K là số các cụm được xác định trước, K > 0) sao cho tổng bình
phương khoảng cách giữa các đối tượng đến tâm nhóm là nhỏ nhất. Thuật toán K-
means được mô tả trên hình 2.1 và hình 2.2.
Hình 2. 1: Mô tả thuật toán K-Means
22
Hình 2. 2: Ví dụ phân loại với K-Means
Trong bài toán phân loại dữ liệu, thuật toán K-means được triển khai theo các bước:
Bước 1: Chọn K cụm trọng tâm khởi tạo, z1, z2, z3, , zn, với 0 < K ≤ n
Bước 2: Phân phối mẫu trong K-means. Mẫu thường được gán với cụm trung tâm
gần nhất theo công thức: x Î Si(n) nếu |x – zi(n)| ≤ |x – zj(n)| với j = 1, 2, 3, , k; i
≠ j; Si(n) là bộ mẫu của trọng tâm zi(n), trong đó n chỉ số bước lặp của bài toán.
Bước 3: Tính toán trọng tâm cụm mới từ mỗi cụm Si(n). Tìm giá trị mới cho mỗi zi.
Trọng tâm cụm mới, zi(n+1) sẽ là giá trị trung bình của các điểm trong Si(n) như:
zi(n+1) = (1/𝑐) ∑𝑥 𝜖𝑆𝑖(𝑛) 𝑥
Trong đó ci là tập điểm thuộc về cụm thứ i
Bước 4: So sánh zi(n) và zi(n+1) với mọi i.
Tính toán khoảng cách giữa mỗi cặp điểm trong mỗi lần lặp liên tiếp:
23
a. Nếu không có sự thay đổi đáng kể, kết thúc phương pháp, một vài tiêu chí cho kết
thúc như:
+ Nếu |zi(n+1) – zi(n)| < T với mọi i
+ N ế u ∑ 𝑘𝑗 = 1 | 𝑧 𝑖 ( 𝑛 + 1 ) − 𝑧 𝑖 ( 𝑛 ) | < 𝑇 với mọi i
b. Nếu không thì tiếp tục lặp các lần lặp tiếp theo từ bước 2.
Trong thuật toán K-means việc chọn được giá trị k sẽ có thể giúp tăng tốc được thuật
toán, tối ưu và cải tiến thuật toán tốt hơn. Có nhiều phương pháp để có thể lựa chọn
được giá trị k như sử dụng ý kiến của chuyên gia, thử mô hình với các giá trị của k
và từ đó chọn k tốt nhất hay sử dụng kỹ thuật CV (Cross - Validation), .
2.2. Đánh giá kết quả phân loại LiDAR
2.2.1 Thuật toán MCC
Trên thế giới, các nghiên cứu được công bố về MCC trong phân loại dữ liệu
LiDAR tương đối hạn chế, trong đó nổi bật nhất là nghiên cứu của tác giả Jeffrey
S.Evans và Andrew T.Hudak sử dụng phương pháp MCC trong phân loại tín hiệu
phản hồi LiDAR trong môi trường rừng. Thuật toán MCC được các tác giả giới thiệu
sử dụng phép lặp TPS để loại bỏ những điểm không thuộc nhóm mặt đất để từ đó có
thể thành lập được DEM của khu vực khảo sát. TPS là phép lặp cho phép đánh giá
trạng thái giữa các điểm, tuân thủ các dữ liệu đầu vào và kiểm soát khoảng cách các
điểm mẫu ảnh hưởng đến bề mặt ước lượng [6].
Triển khai thuật toán MCC các tác giả định nghĩa một vevtor Z(s) chứa giá trị
tọa độ của tất cả các điểm LiDAR. Vector này sẽ được sử dụng trong phép lặp bề mặt
raster sử dụng phép lặp TPS với độ phân giải theo tỉ lệ l. Một lõi lọc có kích thước
3x3 duyệt qua tất cả các phép lọc để tìm một vector mới x(s). Miền tỉ lệ l là mô hình
lặp được thiết lập với tham số của mô hình chạy đến khi hội tụ. l và t sẽ được định
nghĩa bởi người dùng [6].
24
Dung sai độ cong t sẽ được thêm vào x(s), và các điểm sẽ được phân lớp vào
lớp không mặt đất bằng việc sử dụng điều kiện
If Z(s) > c then phân lớp không mặt đất
Trong đó c là độ cong của miền tỉ lệ l.
Tiến trình phân loại sử dụng MCC được các tác giả sử dụng thể hiện trong sơ
đồ khối sau:
Hình 2. 3: Sơ đồ khối của giải thuật MCC trong phân lớp dữ liệu LiDAR
Để đánh giá thuật toán, các tác giả đã sử dụng bộ dữ liệu thu được từ phía Bắc
của Idaho. Đây là khu vực rừng phức tạp với diện tích 88ha, với các loại rừng khác
nhau như rừng trồng, rừng tư nhân, .
25
Hình 2. 4: Khu vực thực nghiệm trong nghiên cứu
Thuật toán MCC khi áp dụng vào phân loại tín hiệu phản hồi LiDAR được
thực hiện một cách tự động, kết quả tín hiệu phản hồi LiDAR được phân thành hai
loại mặt đất và không mặt đất. Lỗi khi phân loại điểm mặt đất được đánh giá qua 204
điểm trong đó có 165 điểm GPS, 39 điểm của NOAA, và sử dụng sai số trung bình
để đánh giá số điểm bị mất trong quá trình phân loại. Công thức tính toán sai số trung
bình được thể hiện [6]:
𝑅𝑀𝑆𝐸 = 0∑ (3456 78):;86? (1)
Với các tham số được lựa chọn lần lượt là l = 1.5, t = 0.3, với ba miền tỉ lệ để
phân loại điểm, kết quả được các tác giả thực nghiệm:
Hình 2. 5: Tỉ lệ các điểm thuộc hai lớp sau phân loại
Trong đó, sai số trung bình RMSE với hai khu vực thực nghiệm là 0.306 và
0.166. Kết quả chỉ ra rằng, MCC giúp cực tiểu sai số, trong khi vẫn còn tồn tại tỉ lệ
cao của điểm mặt đất và độ tin cậy cao của các điểm được cung cấp.
26
Trong khi đó nhóm tác giả Wade T.Tinkham và Hongyu Huang đã có nghiên
cứu so sánh về mức độ hiệu quả của hai thuật toán MCC và BCAL (Boise Center
Aerospace Laboratory LiDAR) trong phân loại dữ liệu LiDAR để thành lập DTM.
Độ chính xác của hai thuật toán được đánh giá qua hơn 7000 điểm đo có độ chính
xác cao với 6 kiểu dữ liệu khác nhau. Khu vực nghiên cứu được tác giả sử dụng trong
quá trình đánh giá là lưu vực RME, là một phần của Reynold. Khi đánh giá hiệu suất
tổng thể của MCC và BCAL với mỗi độ phân giải khác nhau sẽ cho ngưỡng sai số là
khác nhau. Tại độ phân giải là 1m, trị số ANOVA cho thấy không có sự khác biệt
đáng kể giữa MCC và BCAL. Tại độ phân giải 0,5m, với các loại độ phủ khác nhau
BCAL trội hơn hẳn MCC. Sau đó các tác giả tiến hành so sánh tạo DTM của hai thuật
toán là không khác biệt. Nhưng khi kết hợp hai thuật toán MCC và BCAL thì việc
tạo DTM có độ chính xác cao hơn. Sau quá trình thử nghiệm, các tác giả chỉ ra rằng
thuật toán BCAL thích hợp với khu vực có mật độ điểm dày đặc, thảm thực vật liên
tục. Ở những nơi có độ dốc thay đổi liên tục MCC sẽ có độ chính xác cao hơn [10].
Với thuật toán MCC được các tác giả giới thiệu trong nghiên cứu sử dụng phép
lặp TPS trong phân chia các tín hiệu phản xạ
Các file đính kèm theo tài liệu này:
- luan_van_nghien_cuu_ky_thuat_phan_loai_du_lieu_lidar.pdf