Luận văn Nghiên cứu kỹ thuật phân loại dữ liệu LiDAR

MỞ ĐẦU.1

1. Đặt vấn đề .1

2. Những nội dung nghiên cứu chính.3

CHƯƠNG 1:.4

GIỚI THIỆU VỀ CÔNG NGHỆ LIDAR VÀ CÁC ỨNG DỤNG.4

1.1 Tổng quan về công nghệ LiDAR.4

1.1.1 Cấu trúc hệ thống LiDAR.4

1.1.2 Đặc điểm cơ bản của công nghệ LiDAR.5

1.2. Khả năng ứng dụng của LiDAR .7

1.3. Bài toán phân loại dữ liệu LiDAR.13

1.3.2 Cơ bản về tệp tin .LAS.14

1.3.3 Phân loại đám mây điểm LiDAR trong tập tin LAS.16

1.4 Kết chương: .18

CHƯƠNG 2:.19

MỘT SỐ KỸ THUẬT PHÂN LOẠI DỮ LIỆU LIDAR.19

2.1 Nghiên cứu liên quan đến sử dụng thuật toán MCC (Multiscale Curvature

Classification) và K-Means trong phân loại dữ liệu LiDAR.19

2.1.1 Thuật toán MCC (Multiscale Curvature Classification) .19

2.1.2 Thuật toán K-Means.21

2.2. Đánh giá kết quả phân loại LiDAR.23

2.2.1 Thuật toán MCC.23

2.2.2 Thuật toán K-Means.26

55 trang | Chia sẻ: honganh20 | Lượt xem: 1178 | Lượt tải: 2

Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu kỹ thuật phân loại dữ liệu LiDAR, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

bộ cảm biến. Hệ thống xác định quán tính IMU: Các giá trị góc xoay, góc nghiêng dọc, nghiêng ngang, hướng bay quét của hệ thống LiDAR được xác định chính xác bằng thiết bị đạo hàng, góc quay gương tức thời và các khoảng cách thu nhận và dữ liệu GPS được dùng để tính toán toạ độ ba chiều của các điểm LiDAR. 5 Hệ thống GPS: Dữ liệu LiDAR được kết hợp với các thông tin vị trí chính xác thu nhận từ thiết bị GPS và hệ thống thiết bị xác định các thông số định hướng góc xoay, góc nghiêng dọc, nghiêng ngang cùng đặt trên máy bay. Các thông tin này được lưu trữ và xử lý, để xác định giá trị toạ độ (x,y,z) chính xác của mỗi điểm trên mặt đất. Hệ thống GPS gồm một máy thu đặt trên máy bay và một máy thu đặt tại mặt đất, quá trình xử lý dữ liệu này cho ra kết quả vị trí điểm có độ chính xác cao (+/- vài cm đến vài chục cm). Hệ thống quản lý bay: Cho phép lập kế hoạch, thiết kế tuyến bay và theo dõi quá trình bay quét LiDAR. Hình 1. 1: Tổng quan về hệ thống LiDAR 1.1.2 Đặc điểm cơ bản của công nghệ LiDAR Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không gian GPS/INS và sự nhận biết cường độ phản xạ ánh sáng [3]. Xung của laser được phát hướng xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ mặt đất hay từ các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi xung sẽ đo được thời gian đi và về của tín hiệu, tính được khoảng cách từ nguồn phát laser tới đối tượng. Ở mỗi thời điểm phát xung laser, hệ thống định vị vệ tinh GNSS sẽ xác định 6 vị trí không gian của điểm phát, và hệ thống đạo hàng quán tính sẽ xác định các góc định hướng trong không gian của tia quét. Với các trị đo tổng hợp đó tính được vị trí (tọa độ không gian) của các điểm trên bề mặt đất. Công nghệ LiDAR có nhiều tính năng vượt trội so với các công nghệ đo đạc truyền thống, nó có những đặc điểm cơ bản như: - Độ chính xác xác định vị trí không gian của các đối tượng địa lý rất cao. Độ chính xác độ cao < 20cm, độ chính xác mặt phẳng < 25cm. - Thời gian thu thập và xử lý dữ liệu cực nhanh. Thời gian bay quét LiDAR với khoảng 1000km2 là khoảng 25-30 giờ, thời gian xử lý tạo DEM với 1000km2 là khoảng 10 ngày. - Không giống như các phương pháp đo ảnh hay đo đạc ngoài trời khác, công nghệ LiDAR chủ yếu là tự động hóa, ít có sự can thiệp trực tiếp của con người. Thành quả dữ liệu rất khách quan, mức độ tin cậy cao. - Hệ thống LiDAR thu thập dữ liệu không phụ thuộc vào ánh sáng mặt trời, có thể thực hiện cả ngày và đêm, điều kiện thời tiết không đòi hỏi khắt khe. - Xung ánh sáng của hệ thống LiDAR có thể đi qua đối tượng vòm như tán cây, mặt nước, mái che kính, tấm ni lông mỏng và phản xạ tới 4 lần. Mỗi lần phản xạ là một mức truyền khác nhau và ghi nhận một giá trị tọa độ (XYZ) khác nhau. Đây là một tính năng đặc biệt mà công nghệ đo vẽ ảnh khác không thể thực hiện được. Với tính năng này việc thực hiện bay quét ở vùng rừng cây hoặc nơi có thực phủ không quá dày đặc vẫn có thể thi công và thể hiện được bề mặt đất. - Điểm phân giải điểm đo chi tiết cao, khi đầu phát đạt 150.000 xung trên 1 giây, độ cao bay 1000m thì mật độ khoảng 3 điểm trên 1m2. Hiện nay có nhiều hệ thống LiDAR có đầu phát đạt 240.000 xung trên 1 giây. Công nghệ LiDAR với khả năng đo điểm trực tiếp ngoại nghiệp mật độ rất cao, độ chính xác lớn, tốc độ nhanh. - Điểm khống chế mặt đất rất ít, có thể chỉ 1 điểm cho mục đích cải chính DGPS. Công nghệ LiDAR đặc biệt lợi ích là công cụ lý tưởng khi nó được áp dụng 7 cho các vùng xa xăm, hẻo lánh khi mà con người rất khó tiếp cận trong triển khai đo đạc ngoại nghiệp. - Công nghệ LiDAR ghi nhận được các giá trị mức phản xạ ánh sáng của các đối tượng trên mặt đất, dữ liệu này có thể được dùng để tạo ra ảnh cường độ xám, phân loại đối tượng, chiết xuất đối tượng trên mặt đất. Đây là một đặc tính có giá trị gia tăng của dữ liệu LiDAR. - Một số hệ thống LiDAR ngoài chức năng đo quét trên mặt đất, còn có thể thực hiện chức năng đo sâu (hiện nay có thể đo sâu đến 40m). - Tổ chức thi công đơn giản, gọn nhẹ hơn các phương pháp khác, số người cần tham gia rất ít (khoảng 10-15 người). - Hiệu quả kinh tế rất cao khi ứng dụng công nghệ LiDAR cho mục đích thu thập dữ liệu không gian với yêu cầu thời gian ngắn, độ chính xác cao và mật độ dày đặc [3]. 1.2. Khả năng ứng dụng của LiDAR Công nghệ LiDAR đã thể hiện nhiều ưu thế vượt trội hơn với các công nghệ khác trong việc đo đạc thành lập bản đồ, xây dựng cơ sở dữ liệu hay mô phỏng không gian ba chiều. Các nguồn dữ liệu thu nhận được có thể được ứng dụng trong nhiều lĩnh vực khác nhau như giáo dục, viễn thông, theo dõi đánh giá khai thác mỏ, quân sự, nghiên cứu lập bản đồ khu vực ngập lụt, dự báo thảm hoạ, bản đồ địa hình dải ven biển, quy hoạch đô thị, lập bản đồ đường dây tải điện, a) Khảo sát địa hình và lập bản đồ: Kết quả đầu ra cơ bản là các mô hình số địa hình (DEM – Digital Elavation Model) và mô hình số bề mặt (DSM – Digital Surface Model) với độ phân giải và độ chính xác cao, LiDAR rất phù hợp để ứng dụng trong việc thành lập bản đồ tỷ lệ lớn, các ứng dụng liên quan đến phát triển hoặc quản lý duy trì hạ tầng cơ sở. 8 Hình 1. 2: Ứng dụng LiDAR trong khảo sát địa hình và lập bản đồ b) Lâm nghiệp: Trong lĩnh vực lâm nghiệp, công nghệ LiDAR chủ yếu được sử dụng để đánh giá, thống kê, phân tích điều kiện sống hoang dã, tương quan của các yếu tố như tán, độ dày tán, dạng lá, hay sản lượng gỗ rừng; ước tính sinh khối, trữ lượng gỗ và các tham số lâm nghiệp khác. Hình 1. 3: Ứng dụng LiDAR trong lâm nghiệp c) Lập bản đồ ngập úng: Dữ liệu LiDAR được sử dụng hiệu quả trong xây dựng các mô hình ngập úng, xác định ranh giới ngập úng, cung cấp thêm nhiều thông tin về các đối tượng/địa vật chịu ảnh hưởng; từ đó thành lập bản đồ nguy cơ ngập úng, vùng ưu tiên sơ tán. 9 Hình 1. 4: Ứng dụng LiDAR trong lập bản đồ ngập úng d) Các ứng dụng cho đới duyên hải: Do dữ liệu LiDAR có độ chính xác cao cùng mật độ điểm dữ liệu dày đặc trong thời gian thu thập dữ liệu ngắn. Dữ liệu này rất phù hợp cho các ứng dụng để quản lý và dự báo xói mòn bờ biển; giúp đánh giá và dự báo bồi lắng, quan trắc cũng như lập dự báo ngập lụt ven biển Hình 1. 5: Ứng dụng LiDAR cho đới duyên hải e) Địa hình ven biển: Công nghệ LiDAR có thể giúp lập bản đồ địa hình đáy biển độ sâu tới 70m, hữu ích trong các dự án xác định luồng lạch tàu vào, thiết kế quy hoạch cảng và các kênh giao thông thuỷ. 10 Hình 1. 6:Ứng dụng LiDAR trong lập bản đồ địa hình ven biển f) Trượt lở: LiDAR có thể sử dụng để quan trắc và dự báo trượt lở, đặc biệt với ác sườn dốc, nhờ đặc điểm thu thập dữ liệu nhanh chóng với độ chính các cao và mật độ dữ liệu dày đặc. Công nghệ này cũng có thể được sử dụng để đánh giá nhanh thiệt hại và thiết lập bản đồ thể hiện tình trạng hậu trượt lở nhanh chóng chính xác. Hình 1. 7: Ứng dụng LiDAR trong quan trắc dự báo trượt lở g) Các tuyến truyền tải: LiDAR được áp dụng trong việc lập bản đồ các tuyến truyền tải trải dài, giúp thể hiện chính xác vị trí các tháp truyền tải hoặc cột điện, phân định địa hình của hành lang truyền tải và các loại đối tượng tồn tại trong hành lang (cây xanh) giúp điều chỉnh, sửa chữa duy tu và thiết kế nâng cấp. 11 Hình 1. 8: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải h) Lập bản đồ giao thông: Công nghệ LiDAR thường được sử dụng để: quan trắc, giám sát, duy tu bảo dưỡng và quản lý các đối tượng như đường sắt, đường bộ, hệ thống tín hiệu biển báo, các trạm dừng đỗ, nhà ga bến cảng, sự xuống cấp mặt đường, điểm tai nạn, mật độ giao thông, bùng binh, mà không cần làm gián đoạn các dịch vụ liên quan. Hình 1. 9: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải 12 i)Mạng điện thoại di động: Một trong những yêu cầu của việc quy hoạch và quản lý các mạng điện thoại di động đó là cần có thông tin bề mặt địa hình, lớp phủ thực vật, các toà nhà và công trình một cách chi tiết. Công nghệ LiDar xác định cơ sở dữ liệu chính xác và chi tiết các thông tin về các chướng ngại vật tự nhiên và nhân tạo là cực kỳ quan trọng. Hình 1. 10: Ứng dụng LiDAR trong quy hoạch và quản lý mạng điện thoại di động j) Lập mô hình đô thị và mô phỏng đô thị: Lidar thường được ứng dụng để tạo ra mô hình thành phố ảo với nền địa lý và các công trình xây dựng, kiến trúc, như đô thị thực. Mô hình này có thể được khai thác phục vụ rất nhiều đối tượng từ quy hoạch kiến trúc, xây dựng, giao thông. Mô hình này cũng được chia sẻ dưới các cách linh động khác nhau như: ứng dụng desktop, ứng dụng web, sử dụng các chuẩn mở, dễ trao đổi và dễ cấu hình phù hợp với từng đối tượng sử dụng. Hình 1. 11: Ứng dụng LiDAR trong lập mô hình đô thị và mô phỏng đô thị 13 1.3. Bài toán phân loại dữ liệu LiDAR 1.3.1 Khái niệm Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không gian GPS/INS và sự nhận biết cường độ phản xạ ánh sáng. Xung của laser được phát hướng xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ mặt đất hay từ các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi xung sẽ đo được thời gian đi và về của tín hiệu, tính được khoảng cách từ nguồn phát laser tới đối tượng. Ở mỗi thời điểm phát xung laser, hệ thống định vị vệ tinh GNSS sẽ xác định vị trí không gian của điểm phát, và hệ thống đạo hàng quán tính sẽ xác định các góc định hướng trong không gian của tia quét. Với các giá trị đo tổng hợp đó sẽ tính được vị trí (tọa độ không gian) của các điểm trên bề mặt đất. Một tín hiệu phát đi, sẽ có một hay nhiều tín hiệu phản xạ. Kết quả cuối cùng, sẽ có được đám mây điểm. Dữ liệu điểm của LiDAR sẽ được tiền xử lý sau khi hệ thống thu nhận được hệ tọa độ x, y, z có độ chính xác cao của đối tượng bằng cách phân tích thời gian tia quét phản xạ, góc quét, vị trí thu nhận từ GPS, và thông tin INS. Thuộc tính của dữ liệu LiDAR ghi nhận được cho mỗi xung bao gồm: cường độ, số lượng xung phản hồi, giá trị điểm phân loại, góc quét của đường bay chụp, giá trị RGB, thời gian định vị, góc quét và hướng quét. Bảng 1. Thuộc tính của dữ liệu LiDAR STT Tên thuộc tính Mô tả 1 Cường độ Độ đậm nhạt của xung dữ liệu LiDAR phản xạ ghi nhận được từ điểm LiDAR. 14 2 Số lượng xung phản xạ Tổng số lượng xung phản hồi. 3 Điểm phân loại Mọi điểm LiDAR đều được phân loại trong quá trình tiền xử lý để xác định được loại đối tượng phản xạ. 4 Góc của đường quét Các điểm sẽ được ký hiệu với giá trị 0 và 1. Những điểm theo đường góc quét sẽ được gán giá trị là 1, những điểm còn lại được gán giá trị là 0 5 RGB Dữ liệu LiDAR có thể được gán với kênh phổ R, G, B. Giá trị này thường được thu nhận từ ảnh cùng thời gian với đo LiDAR 6 Thời gian định vị Giờ được thu nhận từ hệ thống GPS được phát ra từ hệ thống không vận 7 Góc quét Giá trị của góc quét thường từ - 900 đến + 900 8 Hướng quét Hướng quét là hướng gương chụp laser đang di chuyển tại thời điểm xung laser phát ra 9 x, y, z Tọa độ và độ cao của điểm phản xạ Dữ liệu đám mây điểm LiDAR thường rất lớn, từ vài ngàn đến vài chục triệu điểm tùy thuộc vào độ rộng của khu vực đo vẽ và sự phức tạp của khu vực đo vẽ. Định dạng đám mây điểm thường là .las hay .laz. 1.3.2 Cơ bản về tệp tin .LAS Bộ dữ liệu LAS lưu trữ một hoặc nhiều tệp LAS trên đĩa, cũng như các tính năng bề mặt bổ sung. Tệp LAS là định dạng nhị phân chuẩn công nghiệp để lưu trữ 15 dữ liệu LiDAR trong không khí. Bộ dữ liệu LAS cho phép kiểm tra các tệp LAS, ở định dạng gốc, nhanh chóng và dễ dàng, cung cấp số liệu thống kê chi tiết và vùng phủ sóng của dữ liệu LiDAR chứa trong các tệp LAS.Một tập dữ liệu LAS cũng có thể lưu trữ tham chiếu đến các lớp đối tượng có chứa các ràng buộc bề mặt. Các ràng buộc bề mặt là đường nét, đa giác nước, ranh giới khu vực, hoặc bất kỳ loại tính năng bề mặt nào khác được thực thi trong bộ dữ liệu LAS. Bộ dữ liệu LAS cung cấp quyền truy cập ngay vào dữ liệu LiDAR mà không cần chuyển đổi hoặc nhập dữ liệu. Các thuộc tính điểm LAS có thể được sử dụng để lọc ra nội dung và tượng trưng cho các điểm trong 2D và 3D. Ngoài ra, dữ liệu LiDAR thường xuất hiện dưới dạng một nhóm tệp, tập dữ liệu LAS cung cấp khả năng xác định tập hợp các tệp LAS hợp lý để làm việc trong các dự án được bản địa hóa. Hình 1. 12: Hiển thị dữ liệu trong tệp tin LAS Bộ dữ liệu LAS tương tự như một tập dữ liệu địa hình với các chế độ xem trên bề mặt, nhưng nó cũng có thể được sử dụng để xem điểm và không yêu cầu tiền xử lý. Người dùng không bắt buộc phải thực hiện bất kỳ quá trình xử lý nào để nhanh chóng hiểu dữ liệu LiDAR đang làm việc. Có thể làm việc trực tiếp trên các tệp LAS, dưới dạng tập hợp hoặc dưới dạng tệp riêng lẻ. Bộ dữ liệu LAS hỗ trợ đường viền hoặc các ràng buộc bề mặt khác sẽ được thêm vào mô hình bề mặt. Nó được hiển thị 16 như một bề mặt hoặc một đám mây điểm, cho phép nhanh chóng đánh giá và hiểu dữ liệu LiDAR. Có thể hiển thị bất kỳ sai sót hoặc vấn đề dữ liệu nào một cách nhanh chóng do hiển thị nhanh và phân tích thống kê. Phân tích có thể được tiến hành trên mỗi và mọi tập tinLAS hoặc trên toàn bộ tập dữ liệu LAS. Nếu có lỗi trong phân loại, có thể sửa đổi việc phân loại các tập tin LAS bằng cách sử dụng LAS Dataset 2D Profile View. Bộ dữ liệu LAS có thể mở rộng, cho phép làm việc với các đám mây điểm lớn một cách nhanh chóng và hiệu quả. Đại diện bộ dữ liệu LAS tự động cập nhật khi xoay và thu phóng xung quanh màn hình. Bộ dữ liệu LAS là một bổ sung tuyệt vời cho luồng công việc cho bộ dữ liệu địa hình và bộ dữ liệu mosaic, có thể xem nhanh các tệp LiDAR trước khi nhập, phân tích hoặc chia sẻ dữ liệu LiDAR. 1.3.3 Phân loại đám mây điểm LiDAR trong tập tin LAS Dữ liệu LiDAR được lưu trong tệp tin LAS thường là đám mây điểm. Các đám mây điểm là tập hợp các điểm thể hiện hình dạng hoặc tính năng 3D. Mỗi điểm có tập hợp các tọa độ X, Y, Z riêng và trong một số trường hợp có thêm các thuộc tính bổ sung. Các điểm LiDAR được lưu trữ trong các tệp LAS thường được phân thành các loại khác nhau bằng cách sử dụng các công cụ phân loại chuyên biệt bên ngoài ArcGIS. Phân loại này thường được hoàn thành bằng cách đặt thông số dựa trên địa hình, sau đó chạy thuật toán trên đám mây điểm để xác định loại đối tượng được liên kết với mỗi điểm. Mã phân loại được gán cho mỗi điểm được ghi vào tệp LAS và, trong hầu hết các trường hợp, tuân theo tiêu chuẩn ASPRS. Khi phân loại tự động được thực hiện trên dữ liệu LiDAR, chúng thường không phân loại hoàn toàn tất cả các điểm một cách chính xác nhưng thường chính xác đến khoảng 90 phần trăm của các điểm. Để đảm bảo rằng 100% các điểm LiDAR được phân loại chính xác, cần phân loại thủ công và dọn sạch dữ liệu. Đây là một công việc rất tốn thời gian, và một số nhà cung cấp có thể yêu cầu một chi phí bổ sung để thực hiện phân loại thủ công. 17 Hình 1. 13: Ví dụ về đám mây điểm LiDAR được hiển thị dưới dạng 3D Phân loại đám mây điểm là quá trình phân chia các điểm thành các lớp điểm chuyên biệt như mặt đất, nước, thảm thực vật, xây dựng, đường dây điệnPhân loại có thể là một hoạt động chuyên sâu xử lý và nhiều bộ dữ liệu LIDAR đã trải qua phân loại hạn chế. Mặt đất hầu như luôn được bao gồm trong một tệp LAS, vì nó là cần thiết để tạo ra một DTM. Các phiên bản thường dùng của định dạng LAS (1.2 và 1.3) có 8 loại phân loại được xác định trước và có thể xử lý lên đến 32; phiên bản mới hơn (1.4), vẫn chưa được sử dụng rộng rãi, có khoảng 20 lớp được định trước và có thể xử lý 256. 18 Đám mây điểm LiDAR Tiền xử lý Lọc điểm Lựa chọn thuật toán Phân loại Đánh giá độ chính xác Hình 1. 14: Quy trình phân loại đám mây điểm LiDAR Việc phân loại đám mây điểm LiDAR thường được thực hiện theo quy trình sau: Sau quá trình phân loại đám mây điểm LiDAR sẽ được sử dụng để thành lập DEM/DTM và được ứng dụng trong những bài toán cụ thể. 1.4 Kết chương: Với mục đích sử dụng triệt để các dữ liệu quét LiDAR, việc phân loại các lớp điểm theo từng lớp đặc trưng, theo mục đích nghiên cứu từng loại đối tượng, việc “Nghiên cứu phương pháp phân loại dữ liệu LiDAR” sẽ góp phần mở rộng ứng dụng công nghệ LiDAR trong nghiên cứu cấu trúc không gian của lớp phủ mặt đất. Điều này là hoàn toàn cần thiết và mang tính thực tiễn cao, đặc biệt có ý nghĩa khi sử dụng công nghệ LiDAR trong nghiên các thảm thực vật, nghiên cứu sinh khối và tầng thứ của rừng đa tầng nhiệt đới, nghiên cứu bờ biển hay thay đổi của bề mặt phủ. 19 CHƯƠNG 2: MỘT SỐ KỸ THUẬT PHÂN LOẠI DỮ LIỆU LIDAR 2.1 Nghiên cứu liên quan đến sử dụng thuật toán MCC (Multiscale Curvature Classification) và K-Means trong phân loại dữ liệu LiDAR 2.1.1 Thuật toán MCC (Multiscale Curvature Classification) Thuật toán MCC (Multiscale Curvature Classification) là thuật toán được sử dụng để phân loại đám mây điểm LiDAR 3D được phát triển bởi Moscow Forestry Sciences Laboratory, sử dụng chủ yếu để phân loại các tia phản xạ LiDAR trong môi trường rừng. Thuật toán này được sử dụng để phân loại các điểm thành hai lớp là mặt đất (ground) và không mặt đất (non-ground). Đây là thuật toán phân loại đám mây điểm LiDAR tự động. MCC là thuật toán lặp đa tỉ lệ để phân loại tín hiệu phản xạ LiDAR mà vượt quá ngưỡng độ cong của bề mặt, cách tiếp cận đa tỉ lệ sẽ xác định độ lệch của các điểm cần phân loại với bề mặt trung bình và loại bỏ dần những điểm trên bề mặt khỏi nhóm mặt đất. Quá trình phân loại bắt đầu bằng việc xác định xem các điểm thuộc những tia phản xạ đơn hay phản xạ cuối cùng cũng như phản xạ đầu tiên từ thực vật. Thuật toán MCC sẽ tính toán bề mặt trung bình từ những điểm mặt đất đặc trưng bằng phép lặp TPS (Thin Plate Spline), sau đó sẽ hiệu chỉnh nó thông qua một lõi lọc. Những tính năng của thuật toán MCC sử dụng để phân loại đám mây điểm LiDAR hỗ trợ cho quá trình lặp để tìm kiếm bề mặt thật của Trái đất với độ phân giải tương ứng với mẫu. Có bai cải tiến của thuật toán, đó là: - Phép lặp TPS (Thin Plate Spline) - Sử dụng cách tiếp cận đa tỉ lệ với bề mặt chuẩn được nội suy với các độ phân giải khác nhau - Lũy tiến độ cong mở [6] 20 Thuật toán MCC có hai tham số là s (scale - biểu thị cho tỉ lệ) và t là ngưỡng độ cong (curvature threshold), trong đó tham số tỉ lệ là hàm của tỉ lệ các đối tượng trên mặt đất và khoảng lấy mẫu (khoảng cách sau) của dữ liệu LiDAR [9]. Thuật toán MCC được mô tả như sau: Input: đám mây điểm LiDAR Output: điểm sau phân loại với hai lớp mặt đất và không mặt đất Initial: U0 đám mây điểm LiDAR U = {P1, P2, , Pn} – chứa các điểm chưa được phân loại Pj(xj, yj, zj) – điểm LiDAR rời rạc int l[1 3] – miền tỉ lệ tl – độ cong cho miền tỉ lệ l – khởi tạo bởi người dùng l – độ phân giải cho l Procedure: Phân loại những điểm có độ cao trong U0 và gán chúng vào lớp không mặt đất For l = 1 to 3 Repeat Lặp tìm S = TPS(U, l, f) Lặp tìm S’ = 3x3 For each Pj Î U If zj > S’(xj, yj) + tli then Phân Pj vào lớp không mặt đất Loại Pj khỏi U Untill điểm không thuộc U < 10% tổng số điểm của nó Phân lớp các điểm còn lại của U vào lớp mặt đất End 21 2.1.2 Thuật toán K-Means Thuật toán K-means là tìm phương pháp phân nhóm các đối tượng (objects) đã cho vào K cụm (K là số các cụm được xác định trước, K > 0) sao cho tổng bình phương khoảng cách giữa các đối tượng đến tâm nhóm là nhỏ nhất. Thuật toán K- means được mô tả trên hình 2.1 và hình 2.2. Hình 2. 1: Mô tả thuật toán K-Means 22 Hình 2. 2: Ví dụ phân loại với K-Means Trong bài toán phân loại dữ liệu, thuật toán K-means được triển khai theo các bước: Bước 1: Chọn K cụm trọng tâm khởi tạo, z1, z2, z3, , zn, với 0 < K ≤ n Bước 2: Phân phối mẫu trong K-means. Mẫu thường được gán với cụm trung tâm gần nhất theo công thức: x Î Si(n) nếu |x – zi(n)| ≤ |x – zj(n)| với j = 1, 2, 3, , k; i ≠ j; Si(n) là bộ mẫu của trọng tâm zi(n), trong đó n chỉ số bước lặp của bài toán. Bước 3: Tính toán trọng tâm cụm mới từ mỗi cụm Si(n). Tìm giá trị mới cho mỗi zi. Trọng tâm cụm mới, zi(n+1) sẽ là giá trị trung bình của các điểm trong Si(n) như: zi(n+1) = (1/𝑐) ∑𝑥 𝜖𝑆𝑖(𝑛) 𝑥 Trong đó ci là tập điểm thuộc về cụm thứ i Bước 4: So sánh zi(n) và zi(n+1) với mọi i. Tính toán khoảng cách giữa mỗi cặp điểm trong mỗi lần lặp liên tiếp: 23 a. Nếu không có sự thay đổi đáng kể, kết thúc phương pháp, một vài tiêu chí cho kết thúc như: + Nếu |zi(n+1) – zi(n)| < T với mọi i + N ế u ∑ 𝑘𝑗 = 1 | 𝑧 𝑖 ( 𝑛 + 1 ) − 𝑧 𝑖 ( 𝑛 ) | < 𝑇 với mọi i b. Nếu không thì tiếp tục lặp các lần lặp tiếp theo từ bước 2. Trong thuật toán K-means việc chọn được giá trị k sẽ có thể giúp tăng tốc được thuật toán, tối ưu và cải tiến thuật toán tốt hơn. Có nhiều phương pháp để có thể lựa chọn được giá trị k như sử dụng ý kiến của chuyên gia, thử mô hình với các giá trị của k và từ đó chọn k tốt nhất hay sử dụng kỹ thuật CV (Cross - Validation), . 2.2. Đánh giá kết quả phân loại LiDAR 2.2.1 Thuật toán MCC Trên thế giới, các nghiên cứu được công bố về MCC trong phân loại dữ liệu LiDAR tương đối hạn chế, trong đó nổi bật nhất là nghiên cứu của tác giả Jeffrey S.Evans và Andrew T.Hudak sử dụng phương pháp MCC trong phân loại tín hiệu phản hồi LiDAR trong môi trường rừng. Thuật toán MCC được các tác giả giới thiệu sử dụng phép lặp TPS để loại bỏ những điểm không thuộc nhóm mặt đất để từ đó có thể thành lập được DEM của khu vực khảo sát. TPS là phép lặp cho phép đánh giá trạng thái giữa các điểm, tuân thủ các dữ liệu đầu vào và kiểm soát khoảng cách các điểm mẫu ảnh hưởng đến bề mặt ước lượng [6]. Triển khai thuật toán MCC các tác giả định nghĩa một vevtor Z(s) chứa giá trị tọa độ của tất cả các điểm LiDAR. Vector này sẽ được sử dụng trong phép lặp bề mặt raster sử dụng phép lặp TPS với độ phân giải theo tỉ lệ l. Một lõi lọc có kích thước 3x3 duyệt qua tất cả các phép lọc để tìm một vector mới x(s). Miền tỉ lệ l là mô hình lặp được thiết lập với tham số của mô hình chạy đến khi hội tụ. l và t sẽ được định nghĩa bởi người dùng [6]. 24 Dung sai độ cong t sẽ được thêm vào x(s), và các điểm sẽ được phân lớp vào lớp không mặt đất bằng việc sử dụng điều kiện If Z(s) > c then phân lớp không mặt đất Trong đó c là độ cong của miền tỉ lệ l. Tiến trình phân loại sử dụng MCC được các tác giả sử dụng thể hiện trong sơ đồ khối sau: Hình 2. 3: Sơ đồ khối của giải thuật MCC trong phân lớp dữ liệu LiDAR Để đánh giá thuật toán, các tác giả đã sử dụng bộ dữ liệu thu được từ phía Bắc của Idaho. Đây là khu vực rừng phức tạp với diện tích 88ha, với các loại rừng khác nhau như rừng trồng, rừng tư nhân, . 25 Hình 2. 4: Khu vực thực nghiệm trong nghiên cứu Thuật toán MCC khi áp dụng vào phân loại tín hiệu phản hồi LiDAR được thực hiện một cách tự động, kết quả tín hiệu phản hồi LiDAR được phân thành hai loại mặt đất và không mặt đất. Lỗi khi phân loại điểm mặt đất được đánh giá qua 204 điểm trong đó có 165 điểm GPS, 39 điểm của NOAA, và sử dụng sai số trung bình để đánh giá số điểm bị mất trong quá trình phân loại. Công thức tính toán sai số trung bình được thể hiện [6]: 𝑅𝑀𝑆𝐸 = 0∑ (3456 78):;86? (1) Với các tham số được lựa chọn lần lượt là l = 1.5, t = 0.3, với ba miền tỉ lệ để phân loại điểm, kết quả được các tác giả thực nghiệm: Hình 2. 5: Tỉ lệ các điểm thuộc hai lớp sau phân loại Trong đó, sai số trung bình RMSE với hai khu vực thực nghiệm là 0.306 và 0.166. Kết quả chỉ ra rằng, MCC giúp cực tiểu sai số, trong khi vẫn còn tồn tại tỉ lệ cao của điểm mặt đất và độ tin cậy cao của các điểm được cung cấp. 26 Trong khi đó nhóm tác giả Wade T.Tinkham và Hongyu Huang đã có nghiên cứu so sánh về mức độ hiệu quả của hai thuật toán MCC và BCAL (Boise Center Aerospace Laboratory LiDAR) trong phân loại dữ liệu LiDAR để thành lập DTM. Độ chính xác của hai thuật toán được đánh giá qua hơn 7000 điểm đo có độ chính xác cao với 6 kiểu dữ liệu khác nhau. Khu vực nghiên cứu được tác giả sử dụng trong quá trình đánh giá là lưu vực RME, là một phần của Reynold. Khi đánh giá hiệu suất tổng thể của MCC và BCAL với mỗi độ phân giải khác nhau sẽ cho ngưỡng sai số là khác nhau. Tại độ phân giải là 1m, trị số ANOVA cho thấy không có sự khác biệt đáng kể giữa MCC và BCAL. Tại độ phân giải 0,5m, với các loại độ phủ khác nhau BCAL trội hơn hẳn MCC. Sau đó các tác giả tiến hành so sánh tạo DTM của hai thuật toán là không khác biệt. Nhưng khi kết hợp hai thuật toán MCC và BCAL thì việc tạo DTM có độ chính xác cao hơn. Sau quá trình thử nghiệm, các tác giả chỉ ra rằng thuật toán BCAL thích hợp với khu vực có mật độ điểm dày đặc, thảm thực vật liên tục. Ở những nơi có độ dốc thay đổi liên tục MCC sẽ có độ chính xác cao hơn [10]. Với thuật toán MCC được các tác giả giới thiệu trong nghiên cứu sử dụng phép lặp TPS trong phân chia các tín hiệu phản xạ

Các file đính kèm theo tài liệu này:

luan_van_nghien_cuu_ky_thuat_phan_loai_du_lieu_lidar.pdf