Luận văn Phân loại lớp phủ đô thị cho khu vực Hà Nội - Việt Nam sử dụng ảnh vệ tinh venus

CHƯƠNG 1. TỔNG QUAN. 1

1. Tổng quan bài toán nghiên cứu:. 1

2. Giới thiệu tổng quan về viễn thám và dữ liệu viễn thám.1

2.1. Khái niệm về viễn thám.1

2.2. Nguyên lý thu nhận dữ liệu viễn thám. 3

2.3. Phân loại viễn thám với các hệ thống cảm biến tự động:. 7

2.4. Các đặc trưng cơ bản của ảnh viễn thám. 11

3. Ứng dụng ảnh viễn thám để phân loại lớp phủ mặt đất và lớp phủ đô thị.13

3.1. Ứng dụng ảnh viễn thám để phân loại lớp phủ mặt đất.13

3.2. Ứng dụng ảnh viễn thám để phân loại lớp phủ đô thị.15

3.3. Bài toán phân lớp phủ đô thị ở Việt Nam. 15

4. Dữ liệu vệ tinh Venus.16

4.1. Giới thiệu tổng quan vệ tinh Venus. 16

4.2. Đặc trưng cơ bản và định dạng ảnh vệ tinh Venus:.17

5. Mục đích và ý nghĩa của bài toán được giải quyết trong luận văn.19

5.1. Ý nghĩa khoa học.19

5.2. Ý nghĩa thực tiễn. 19

CHƯƠNG 2. PHƯƠNG PHÁP PHÂN LOẠI LỚP PHỦ ĐÔ THỊ.20

1. Các phương pháp phân loại lớp phủ mặt đất và lớp phủ đô thị sử dụng

ảnh viễn thám.20

1.1. Các phương pháp phân loại lớp phủ mặt đất. 20

1.2. Các phương pháp phân loại lớp phủ đô thị. 21

2. Một số phương pháp kết hợp ảnh.21

3. Các phương pháp học máy nền tảng trong nghiên cứu phân lớp phủ. 23

3.1 Support Vector Machine.23

3.2 Artificial Neural Network. 25

pdf59 trang | Chia sẻ: honganh20 | Ngày: 16/03/2022 | Lượt xem: 432 | Lượt tải: 3download
Bạn đang xem trước 20 trang tài liệu Luận văn Phân loại lớp phủ đô thị cho khu vực Hà Nội - Việt Nam sử dụng ảnh vệ tinh venus, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ác dải này có thể được ghép lại với nhau để tạo thành một bức ảnh của một khu vực rộng lớn với độ phân giải 1 km. Trong một chu kỳ quay ngày đêm nó có thể quan sát được toàn bộ trái đất, một nửa vào thời gian ban ngày và một nửa vào thời gian ban đêm. Đối với hầu hết các vệ tinh quỹ đạo cực người ta chọn sao cho nó đồng bộ với mặt trời, nghĩa là góc nghêng của mặt phẳng quỹ đạo vệ tinh được giữ không đổi so với mặt phẳng hoàng đạo suốt thời gian trong năm. Điều này đảm bảo cho vệ tinh bay qua một địa phương đã cho vào cùng một giờ địa phương mỗi ngày. Vệ tinh quỹ đạo cực không quan sát được thường xuyên liên tục như vệ tinh địa tĩnh, nhưng thiết bị có thể đa dạng hơn, độ cao gần trái đất hơn nên nó cho ta thông tin chi tiết hơn. Vệ tinh cực có ưu điểm là chụp trực tiếp được ảnh mây ở phía dưới nó với độ phân giải rất cao nên chúng cho ta thông tin chi tiết về về mây, về các cơn bão và những hệ thống thời tiết khắc nghiệt. [4] 10 Hình 1.5 Vệ tinh địa tĩnh và Vệ tinh quỹ đạo cực Nguồn ảnh: ĐHQG.Khí Tượng Vệ Tinh (NXB Đại Học Quốc Gia 2007) - Nguyễn Văn Tuyên, Trang 17 Phân loại dựa vào ghi nhận quang phổ: Gồm 3 loại: - Viễn thám trong dải sóng nhìn thấy được và hồng ngoại: 0.4-0.76µm (1µm = 1x10-3mm). - Viễn thám hồng ngoại nhiệt: bước sóng từ 3-22µm - Viễn thám siêu cao tần: 1mm-1m Các loại quang phổ được dùng trong các hệ thống cảm biến tự động: Có 5 loại thường được sử dụng quang phổ được sử dụng trong viễn thám như sau: - Ánh sáng nhìn thấy được: là các bước sóng từ 0.4-0.76 microns ( 1 microns = 1000 mm). Năng lượng được cung cấp bởi các bước sóng này tạo ra rất quan trọng trong cảm biến tự động. - Hồng ngoại gần: bước sóng từ 0.77-1.34 microns - Hồng ngoại trung bình: bước sóng từ 1.55-2.4 microns - Hồng ngoại nhiệt: bước sóng tù 3-22 microns - Siêu cao tần: là các ánh sáng có bước sóng từ 1-30 microns Tầng khí quyển không hấp thụ các bước sóng lớn hơn 2 cm mà nó cho phép năng lượng ngày và đêm mà không có sự ảnh hưởng của các đámmây, sương mù và mưa [3]. 11 Hình 1.6 Các bước sóng thường được sử dụng trong viễn thám Nguồn ảnh: 2.4. Các đặc trưng cơ bản của ảnh viễn thám Ảnh vệ tinh là các hình ảnh về trái đất hoặc các hành tinh khác ghi nhận bởi các vệ tinh quan sát. Các vệ tinh thường được vận hành bởi các tổ chức chính phủ, hoặc các tổ chức kinh doanh trên thế giới. Hiện tại có rất nhiều vệ tinh quan sát và chúng có đặc điểm chung như: độ phân giải về không gian, độ phân giải về quang phổ, độ phân giải về phóng xạ độ phân giải về biểu thị thời gian. Chi tiết mô tả các độ phân giải như sau [3]: - Độ phân giải về không gian: là kích thước của pixel trên mặt đất, hay kích thước của đối tượng nhỏ nhất có khả năng phân biệt trên ảnh. Tham chiếu IFOV( Instantaneous Field of View) trường quan sát hiện thời – nó là vùng xung quanh cảm biến vệ tinh nhìn thấy được. Hình 1.7 Độ phân giải về không gian của ảnh vệ tinh Nguồn ảnh: Introduction to Remote Sensing of Environment - R.B. Smith (2002) 12 Ví dụ: Ảnh Venus có độ phân giải về không gian là 10m tức là vùng phủ của Venus có độ phủ trên bề mặt trái đất là 10x10m. - Độ phân giải phổ: Là số lượng và kích thước của các khoảng phổ mà các bộ cảm thu nhận và ghi lại dữ liệu, có khả năng cảm biến để tiếp nhận từ ánh sáng mặt trời. Nếu camera thông thường trên điện thoại có thể thấy các ánh sáng màu: đỏ, xanh lá, xanh da trời thì nhiều cảm biến vệ tinh có thể cảm biến được các bước sóng khác nhau như: cận hồng ngoại, hồng ngoại nhiệt, vi sóng (như radar). Ngoài ra còn liên quan đến cơ chế ghi nhận thông tin phổ. Hình 1.8 Độ phân giải phổ của ảnh vệ tinh Ví dụ: cảm biến TIRS được gắn trên vệ tinh Landsat8 có thể thu nhận được bước sóng từ 10.6 đến 12.51 microsmetes. - Độ phân giải về bức xạ: được mô tả về khả năng phân biệt được các sự khác nhau rất nhỏ trong nhiệt ánh sáng, hơn nữa nó có khả năng phát hiện những khác biệt rất nhỏ của sự phản chiếu hoặc năng lượng sóng điện từ. Ví dụ: Ảnh 1 bit, 7 bit, 8 bit, 11 bit,... - Độ phân giải về thời gian: là khoảng thời gian liên tiếp giữa 2 lần quan sát thành công bên ngoài vùng tương tự trên bề mặt trái đất. Ví dụ: Với ảnh vệ tinh Venus là 2 ngày 13 Bảng 1.1 Bảng so sánh một số đặc tính của các ảnh vệ tinh STT Tên ảnh vệ tinh Phân loại Đặc trưng về độ phân giải không gian Độ phân giải phổ (không bao gồm phổ nhìn thấy được) Độ phân giải bức xạ Độ phân giải về thời gian 1 MODIS Quang học 250 – 1000m36 kênh 12 bits Hàng ngày 2 SPOT 5 Quang học 10m 4 kênh (Green, Red, Near IR, SWIR) 8 bits 2-3 ngày, phụ thuộc vào vĩ độ 3 Landsat 8 Quang học 30m 10 kênh (Coastal - > TIRS2) 12 bits 16 ngày 4 Sentinel 2A Quang học 10 – 20m 12 kênh (Coastal - > SWIR) 12 bits 10 ngày 5 Venus Quang học 10 m 12 kênh (visible and near-infrared) 12 bits 2 ngày 3. Ứng dụng ảnh viễn thám để phân loại lớp phủ mặt đất và lớp phủ đô thị 3.1. Ứng dụng ảnh viễn thám để phân loại lớp phủ mặt đất Land cover (LC): là một thuật ngữ dùng để chỉ độ phủ trên bề mặt của trái đất. Một số ví dụ về độ che phủ đất là: thực vật, tòa nhà, nước và mây. Độ che phủ của đất phản ánh sự bức xạ ánh sáng của Mặt Trời sau đó được chụp lại bởi các cảm biến của vệ tinh. Việc sử dụng đất và phân lớp độ che phủ đất (LULCC- Land use and land cover classification) đã được xem xét như một trong những ứng dụng cơ bản và quan trọng nhất trong viễn thám vì các sản phẩm LULCC rất cần thiết cho một loạt các ứng dụng liên quan đến môi trường. 14 Hình 1.9 Bản đồ sự thay đổi phân lớp phủ đất cho đồng bằng sông Hồng tính đến năm 2010 Nguồn ảnh: https://www.researchgate.net/figure/Land-cover-map-of-Hanoi- using-the-Support-Vector-Machine-Classification_fig4_289530399 Thông thường, phân lớp phủ được phân loại dựa vào nghiên cứu theo vùng, khu vực hoặc các nghiên cứu toàn cầu. - Nghiên cứu theo khu vực: tập trung vào các phương thức phân lớp phủ cho một hoặc một vài khu vực đặc biệt - Nghiên cứu toàn cầu: phân lớp liên quan đến sự mở rộng toàn cầu Độ chính xác về độ phủ của đất mức toàn cầu vẫn nhỏ hơn các bản đồ phân lớp phủ của đất theo khu vực. Cũng có thể hiểu đó là những thách thức trong phân lớp phủ ở mức mở rộng toàn cầu bao gồm: có nhiều loại độ phủ của đất, do thiếu dữ liệu thực địa. 15 Một số nghiên cứu độ phủ của đất theo khu vực được đề cập đến như: (1) Xiaoping Zhang đã sử dụng dữ liệu ảnh Landsat để giám sát tự động bề mặt không thấm nước ở đảo Zhoushan từ 2006-2011 và đạt được độ chính xác khoảng 86-88%. (2) Mẫn Đức Chức đã thực hiện composite ảnh sử dụng dữ liệu ảnh Landsat8 trong 3 năm từ 2014-2016 để đưa ra bản đồ che phủ đất tốt nhất đạt được độ chính xác 83,91%. 3.2. Ứng dụng ảnh viễn thám để phân loại lớp phủ đô thị Một trong những thách thức cấp bách nhất ở hiện tại và cả tương lai là sự đô thị hóa trên toàn cầu. Đô thị hóa là quá trình phát triển kinh tế, xã hội, song song với sự mở rộng không gian đô thị. Khi dân số trên toàn cầu tăng lên và nền kinh tế của các quốc gia tiếp tục phát triển mà không còn dựa vào các hệ thống nông nghiệp, các thành phố sẽ tăng lên và mở rộng hơn. Sự phát triển đô thị thường xâm phạm đến đất trồng rừng hoặc đất nông nghiệp. Sự tăng trưởng thành phố là một chỉ số của công nghiệp hóa (phát triển) và nhìn chung đều có ảnh hưởng tiêu cực đến sức khỏe môi trường của một vùng. Có được thông tin lớp phủ đô thị sẽ giúp những nhà hoạch định chính sách xây dựng được chiến lược phát triển hợp lý và bền vững mà vẫn có thể bảo vệ được môi trường. Lớp phủ đô thị sẽ được đặc trưng bởi hỗn hợp các kiểu lớp phủ khác nhau, là các tổ hợp của các lớp phủ khác biệt nhau về phổ phản xạ. Do tính chất không đồng nhất này, nên trong viễn thám, việc phân loại các kiểu lớp phủ đô thị thường gặp rất nhiều khó khăn. Đường giao thông, các công trình nhà ở, bãi đỗ xe được phủ bởi vật liệu không thấm nước như nhựa đường, đá, vật liệu xây dựng v.v là các mặt không thấm và chúng có tính chất vật lý riêng do đó được ghi nhận trên dải quang phổ điện từ như là một đối tượng. 3.3. Bài toán phân lớp phủ đô thị ở Việt Nam Quá trình đô thị hoá là quá trình phát triển về kinh tế, xã hội, văn hoá và không gian kiến trúc. Quá trình này thường làm thay đổi đáng kể các điều kiện sinh thái đô thị được thể hiện qua việc biến đổi không gian bề mặt của lớp phủ từ các hệ 16 sinh thái tự nhiên sang môi trường chịu tác động bởi con người. Thông tin chính xác và cập nhật về tình trạng và xu hướng của các hệ sinh thái đô thị cần thiết để phát triển các chiến lược phát triển bền vững và cải thiện cuộc sống đô thị cũng như giúp các nhà quản lý theo dõi biến động và ra quyết định. Có nhiều phương pháp khác nhau cũng như nhiều cách tiếp cận khác nhau có thể được lựa chọn để nghiên cứu quá trình đô thị hoá qua thay đổi lớp phủ đô thị. Trong đó, viễn thám và hệ thông tin địa lý (GIS) là những phương pháp hiện đại, là những công cụ mạnh có khả năng giúp giải quyết các vấn đề ở tầm vĩ mô về không gian trong thời gian ngắn. [7] Hà Nội là thủ đô của nước Cộng hòa Xã hội chủ nghĩa Việt Nam, nằm ở đầu của đồng bằng sông Hồng, thuộc khu vực phía bắc và. Tiếp giáp các tỉnh: phía Bắc giáp Thái Nguyên, phía Đông giáp Bắc Ninh và Hưng Yên, phía Nam giáp Vĩnh Phúc và phía Tây giáp các tỉnh Phú Thọ và Hòa Bình[1]. Hà Nội có diện tích bao phủ 3358.9 ﷻ và là thành phố có mật độ dân số lớn thứ 2, với 8.053.663 người tính đến ngày 11 tháng 7 năm 2019 ( Theo kết quả thống kê sơ bộ của Tổng cục thống kê năm 2019). Hà Nội đang phát triển dựa trên một khu vực trung tâm và các đô thị vệ tinh. Ngoài tám khu công nghiệp hiện có, năm khu công nghiệp quy mô lớn mới và 16 khu công nghiệp vừa và nhỏ cùng các cụm công nghiệp đang được xây dựng [2]. Để đáp ứng được mức độ tăng trưởng đô thị, cần kế hoạch phát triển đô thị toàn diện cùng với các biện pháp quy hoạch thích hợp cần được nhà nước có chính sách đưa ra và thực hiện kịp thời. Nhiều khả năng khu vực đô thị sẽ nhanh chóng mở rộng về phía ngoại ô dọc theo các khu công nghiệp dọc các tuyến đường huyết mạch. Theo đó, với cơ sở hạ tầng không đầy đủ sẽ tạo ra nhiều vấn đề với đô thị ngổn ngang và dịch vụ xã hội không phù hợp. 4. Dữ liệu vệ tinh Venus 4.1. Giới thiệu tổng quan vệ tinh Venus Vệ tinh khoa học Venus phóng lên từ khoảng 8 giờ 36 sáng 2/8/2017 (theo giờ Việt Nam). Hoạt động giám sát thảm thực vật và môi trường, đây là một nỗ lực hợp tác chung giữa Trung tâm nghiên cứu không gian quốc gia Pháp Centre National d’Etudes Spatiales (CNES) và Cơ quan không gian Israel- Israel Space Agency(ISA). Theo chu kỳ hai ngày, vệ tinh Venus sẽ ghi lại hình ảnh 100 địa điểm riêng biệt trên toàn thế giới trong khoảng thời gian hai năm rưỡi, qua đó hình thành biểu 17 đồ về ảnh hưởng của biến đổi khí hậu đối với hệ sinh thái và nông nghiệp cũng như phục vụ nghiên cứu lượng khí carbon và sự phát triển của thực vật. Độ phân giải ảnh vệ tinh VENµS là 10m, với trường quan sát khoảng 27km. Chu kỳ lặp lại quỹ đạo trong vòng 2 ngày, với góc quan sát cố định. Cung cấp hình ảnh trong 12 dải quang phổ có bước sóng trong khoảng từ 415nm đến 910nm. [6] Hình 1.10 Ảnh vệ tinh Venus Nguồn ảnh vệ tinh Venus (photo credit: SCIENCE, TECHNOLOGY AND SPACE MINISTRY) 4.2. Đặc trưng cơ bản và định dạng ảnh vệ tinh Venus: Định dạng ảnh Venus gồm 2 loại: L1C và L2A Ảnh L1C: Phản xạ ở tầng khí quyển cao nhất (có khả năng sử dụng cho vị trí địa lý cho từng vùng khác nhau). Ảnh mức 1 này có độ phân giải hình học 5m, được dùng làm đầu vào cho các bộ xử lý mức 2. Có định dạng: VENUS_20180131-143921-000_L1C_25MAYO_D_V0-8.zip Ảnh L2A cung cấp : - Làm mịn mây, bóng mây và hơi nước bao phủ - Độ phản xạ bề mặt sau khi hiệu chỉnh khí quyển cho toàn bộ dải quang phổ (vẫn giữ định vị cố định) - Độ phân giải hình học 10m 18 Có định dạng: VENUS_20180707-182652-000_L2A_DESIP2_D_V1-0.zip Dữ liệu ảnh Venus bao gồm: - Chứa các siêu dữ liệu hình thành việc thu nhận ảnh. - Thể hiện ngày tháng và thời gian ảnh được ghi nhận - Phép chiếu và độ bao phủ về địa lý - TOA phản xạ trên 12 kênh từ B01 đến B12 Ngoài ra, có ảnh mức 3 sẽ cung cấp các biến như mức L2A nhưng mỗi tuần sẽ tối đa hoá số lượng pixel ảnh không mây và cùng có độ phân giải hình học là 10m [7]. Bảng 1.2 Đặc điểm ảnh vệ tinh Venus Vệ tinh Các dải phổ và đặc điểm nhận dạng Bước sóng (nanometers) Băng thông (nanometers) Xử lý chính Venus Band 1 420 40 Sự điều chỉnh về khí quyển Band 2 443 40 Sương mù, mây Band 3 490 40 Sự điều chỉnh về khí quyển Band 4 555 40 Đất Band 5 638 40 Đất Band 6 638 40 DEM, chất lượng ảnh Band 7 672 30 Đất Band 8 702 24 Đất Band 9 742 16 Đất Band 10 782 16 Đất Band 11 865 40 Đất Band 12 910 20 Hơi nước 19 5. Mục đích và ý nghĩa của bài toán được giải quyết trong luận văn 5.1. Ý nghĩa khoa học Trong thực tế việc nghiên cứu, quan sát đánh giá phân lớp phủ trên bề mặt trái đất bằng các phương pháp hiện đại như kết hợp ảnh vệ tinh đã được áp dụng ở rất nhiều loại ảnh vệ tinh( Landsat, SPOT, ) cho nhiều khu vực trên thế giới. Hướng nghiên cứu kết hợp ảnh vệ tinh và tạo ra bản đồ lớp phủ với GIS là khuynh hướng phát triển phần mềm mà các chuyên gia đưa ra, cùng với trí tuệ nhân tạo, nhận dạng; nhằm thiết lập các công cụ hiệu quả trong các ứng dụng của GIS đối với các hoạt động kinh tế xã hội, an ninh quốc phòng. Ý nghĩa khoa học: Kết quả sẽ làm sáng tỏ thêm về phương pháp áp dụng kết hợp ảnh vệ tinh trong phân lớp phủ trên bề mặt trái đất nói chung và phân lớp phủ đô thị nói riêng. Hệ thống hoá lại cách tiếp cận nghiên cứu, các bước xử lý và phân lớp ảnh vệ tinh mới như ảnh vệ tinh Venus. 5.2. Ý nghĩa thực tiễn Đề xuất những khả năng phát hiện bất thường trong quy hoạch, theo dõi biến động và quản lý tốc độ tăng trưởng đô thị của thành phố Hà Nội – Việt Nam. Góp phần thêm mới vào kết quả bản đồ phân lớp phủ cho kho dữ liệu nghiên cứu ảnh vệ tinh Venus. 20 CHƯƠNG 2. PHƯƠNG PHÁP PHÂN LOẠI LỚP PHỦ ĐÔ THỊ 1. Các phương pháp phân loại lớp phủ mặt đất và lớp phủ đô thị sử dụng ảnh viễn thám 1.1. Các phương pháp phân loại lớp phủ mặt đất Để nghiên cứu biến động lớp phủ mặt đất có nhiều phương pháp khác nhau với nhiều nguồn tài liệu khác nhau như: từ các số liệu thống kê hàng năm, số liệu kiểm kê, hay từ các cuộc điều tra. Các phương pháp này thường tốn nhiều thời gian, kinh phí và không thể hiện được sự thay đổi từ trạng thái này sang trạng thái khác của lớp phủ mặt đất, và vị trí không gian của sự thay đổi đó. Phương pháp sử dụng dữ liệu viễn thám đã khắc phục được những nhược điểm đó. Cơ sở của dữ liệu viễn thám là phản xạ phổ của các đối tượng tự nhiên, có thể phân tích và thể hiện, đặc biệt có thể chia tách các vùng của các đối tượng trong lớp phủ mặt đất với các diện tích vùng riêng biệt. Dựa trên đặc trưng phản xạ phổ của các lớp đối tượng, bằng các mô hình, phần mềm chuyên dụng, dữ liệu viễn thám được xử lý để xác định và chia tách với từng đối tượng. Dữ liệu viễn thám đa thời gian cho phép xác định nhanh biến động lớp phủ mặt đất trong các khoảng thời gian giữa các thời điểm thu ảnh. Các thông tin về các đối tượng lớp phủ sau khi chiết tách, có thể tạo ra các bản đồ hiện trạng và tính toán cụ thể diện tích tại từng thời điểm cũng như tổng hợp phân tích kết quả về phân bố và biến động Hiện nay, có nhiều phương pháp tiếp cận để phân loại ảnh vệ tinh như: - Phương pháp phân loại tự động không giám sát (unsupervised classification): là phân loại thuần túy theo tính chất phổ, phụ thuộc hoàn toàn vào máy mà không biết rõ tên nhãn hay tính chất của lớp phổ đó. - Phương pháp phân loại tự động có giám sát (supervised classification): là phân loại theo xác suất cực đại (maximum likelihood). Việc lựa chọn tập mẫu được tiến hành thông qua khảo sát biểu đồ hình cột (histogram) của các pixel ảnh vệ tinh cho từng đối tượng lớp phủ mặt đất cho vùng nghiên cứu - Phương pháp phân ngưỡng (manual thresholds): dùng để chuyển ảnh đầu vào (gồm ảnh màu hoặc ảnh xám) về không gian ảnh nhị phân (chỉ gồm 2 màu) nhằm đơn giản hóa quá trình xử lý - Phương pháp sử dụng logic mờ (Fuzzy logic): dựa trên nguyên tắc mỗi pixel có thể thuộc về nhiều lớp phủ và mỗi lớp phủ sẽ chiếm tỷ lệ phần trăm tương 21 ứng trong mỗi pixel. Tập mờ là một bộ mà các phần tử có mức độ thành viên. Một phần tử của tập mờ có thể là thành viên đầy đủ (100% thành viên) hoặc thành viên một phần (từ 0% đến 100% thành viên) Trong các phương pháp phân loại này thường sử dụng một số thuật toán phổ biến như khoảng cách ngắn nhất (minimum distance), xác suất cực đại (maximum likelihood), K – Means, C –Means, ISODATA 1.2. Các phương pháp phân loại lớp phủ đô thị Ứng dụng viễn thám trong theo dõi biến động đô thị thực chất là nghiên cứu biến động lớp phủ mặt đất của đô thị, tập trung vào các đối tượng chính như: đất nông nghiệp, đất ở, đất bằng chưa sử dụng, mặt nước, để từ đó đưa ra xu thế biến động của đô thị về mặt không gian. Từ dữ liệu ảnh vệ tinh có độ phân giải cao, tiến hành xử lý, giải đoán, phân loại, chiết tách các thông tin, thành lập bản đồ lớp phủ mặt đất tại các thời điểm. Trong phân loại lớp phủ đô thị ở phạm vi nghiên cứu, tôi sử dụng phương pháp phân loại tự động có giám sát (supervised classification). 2. Một số phương pháp kết hợp ảnh Phương pháp kết hợp ảnh: là quá trình kết hợp các ảnh cùng loại trong một khoảng thời gian nhất định được kết hợp với nhau để chọn ra tối đa hoặc tối thiểu điểm của ảnh (chẳng hạn như: chỉ số thực vật, độ phản xạ của một kênh hoặc nhiệt độ) được chọn làm đại diện của các điều kiện bề mặt trong quá trình đo[8]. Các hình ảnh vệ tinh quang học có một nhược điểm lớn, chúng bị ảnh hưởng nặng nề bởi sự bao phủ của các đám mây. Nếu một vùng bị bao phủ bởi mây trong suốt quá trình vệ tinh bay qua, dữ liệu ghi nhận được coi như là không có gì. Do đó, đã có rất nhiều nhà nghiên cứu tìm các các phương pháp khác nhau để xử lý mây và ảnh hưởng của mây. Kết hợp ảnh dựa trên các điểm ảnh là một mô hình trong ngành khoa học viễn thám, tập trung vào việc tạo ra các bức ảnh kết hợp không có mây, phóng xạ. Ảnh kết hợp này là các khoảng không gian lớn liền kề nhau [9]. Trong quá khứ, đã có một số phương pháp kết hợp cho những ảnh không gian độ phân giải thấp (chẳng hạn 500x500m hoặc lớn hơn). Những phương pháp này mục đích chính là để giảm sự tác động của mây, sự ô nhiễm hóa chất, khối dữ liệu và các hiệu ứng quan sát, những thứ vốn luôn có trong các bức ảnh. 22 Gần đây, một số lượng lớn các phương pháp kết hợp các điểm ảnh tốt nhất (Best-Available-Pixel - BAP) đã được đề xuất cho các ảnh vệ tinh cỡ vừa và lớn. Nhìn chung, các phương pháp BAP thay thế các điểm ảnh bị mây che phủ với các điểm ảnh chất lượng tốt nhất từ một tập các ứng viên dựa trên các quy tắc cơ bản. Theo một hướng khác, Griffiths và các đồng sự đã đề xuất một phương pháp BAP xếp hạng điểm ảnh ứng viên bởi tập chỉ số như là khoảng cách tới mây và bóng mây, năm và ngày trong năm (DOY) [10]. Phương pháp này được cải thiện bằng việc kết hợp thêm các chỉ số mới về độ mờ trong khí quyển và loại cảm biến. Năm 2018, nhóm tác giả Mẫn Đức Chức, Nguyễn Thanh Thủy, Bùi Quang Hưng, Kristofer Lasko và Nguyễn Thị Nhật Thanh đã thực hiện một cải tiến mới trong việc kết hợp ảnh. Để lựa chọn được điểm ảnh tốt nhất, nhóm tác giả xây dựng bộ chỉ số Year, DOY, Opacity, DistanceToCloud/CloudShadow [3]. Bảng 2. 1 Đặc trưng các phương pháp kết hợp ảnh ST T Tác giả Ảnh vệ tinh Phương pháp 1 Hansen, 2008 [12] Landsat 5, 7 吠൭〼㄰〼㄰〼〼 min ㄰esNw em 慬吠 〼 ㄰esNw em 慬w 慬吠 〼 Trong đó: 吠൭〼㄰〼㄰〼〼: Điểm ảnh được lựa chọn cho việc kết hợp ㄰esNw em 慬w 慬吠 〼 : xác suất bị ảnh hưởng bởi mây/bóng mây của cùng điểm ảnh trong n ảnh ứng viên Nếu 2 hoặc nhiều hơn các điểm ảnh ứng viên có cùng Pcloud&shadow, thì chọn điểm ảnh gần nhất so với giá trị tham chiếu rừng (100) 2 White, 2014 [10] Landsat 5, 7 吠൭〼㄰〼㄰〼〼 max sﷻ e e〼 eܿ 吠㄰esw em e 〼慬e 慬吠 〼 3 Mẫn Đức Chức, Landsat 8 吠൭〼㄰〼㄰〼〼 max sﷻ e e〼 〼 e eܿ 吠 ㄰esw em 慬吠 〼 23 2018 [3] 3. Các phương pháp học máy nền tảng trong nghiên cứu phân lớp phủ Về cơ bản nhất, phân lớp phủ là một loại phân lớp dữ liệu ảnh. Có nhiều phương pháp từ các ngưỡng cơ bản đến tiên tiến hơn chẳng hạn như: khoảng cách tối đa (Maximum Likelihood), hồi quy logistic (logistic regression), cây quyết định, Random Forest, Neural Network, Support Vector Machine (SVM), chi tiết như mô tả dưới đây: 3.1 Support Vector Machine Support Vector Machines (SVM) là một nhóm của các phương pháp học có giám sát, được giới thiệu ở [12]. Các SVM tìm ra ranh giới quyết định mang lại sự khái quát tốt nhất - còn được gọi là siêu mặt phẳng tách biệt tối ưu trong không gian đa chiều. Giả sử dữ liệu huấn luyện được đại diện bởi {xi, yi}, i = 1, ..., k, trong đó x ∈ Rn là một vectơ không gian n chiều và y ∈ {1, -1} là nhãn của lớp. Tập dữ liệu huấn luyện này có thể được phân tách bằng một siêu mặt phẳng nếu tồn tại một vectơ w = (w1, ..., wk) và một vô hướng b thỏa mãn bất đẳng thức sau: 24 吠 (w൭吠 + b) -1 + 吠 ≥ 0 ∀y = {+1, -1} (5) m + 吠 吠 (6) Trong đó 吠 là biến yếu cho biết khoảng cách của mẫu dữ liệu từ siêu mặt phẳng tối ưu. Hàm mục tiêu có thể được viết như sau: C là hằng số được sử dụng để kiểm soát mức độ phạt liên quan đến các mẫu huấn luyện xảy ra ở phía sai của siêu mặt phẳng tách tối ưu. C nên được xem xét chặt chẽ cho từng nhiệm vụ phân loại cá nhân. Siêu mặt phẳng tối ưu có thể được xác định bằng cách giảm thiểu hàm mục tiêu trong biểu thức. (2) theo các ràng buộc trong biểu thức. (1). Điều này có thể được thực hiện bằng cách sử dụng các số nhân Lagrange và phương pháp lập trình bậc hai. Cách tiếp cận cơ bản để phân loại SVM có thể được mở rộng để cho phép các ranh giới quyết định phi tuyến bằng cách ánh xạ dữ liệu đầu vào vào không gian chiều cao hơn để trong không gian mới, dữ liệu có thể được phân tách tuyến tính. Để làm điều này, một hàm kernel được giới thiệu: K (൭吠൭ ) = (φ(൭吠 ), φ(൭ )), trong đó một mẫu dữ liệu đầu vào x có thể được biểu diễn là (x) trong không gian H. Hạt nhân này cho phép tính toán sản phẩm bên trong (φ(൭吠 ), φ(൭ )) mà không cần biết chính xác biểu diễn của các mẫu dữ liệu ൭吠và ൭ trong không gian cao hơn. Tồn tại một số loại hàm bao gồm hạt nhân dựa trên đa thức và cơ sở xuyên tâm (RBF), v.v. Do SVM được phát triển như một trình phân loại nhị phân, nên cần điều chỉnh phương thức này với các vấn đề phân loại đa lớp. Có hai cách tiếp cận phổ biến để giải quyết vấn đề. Phương pháp thứ nhất được gọi là phương pháp một đối một và phương pháp thứ hai là phương pháp một đối nhiều[3]. 25 3.2 Artificial Neural Network Artificial Neural Networks (ANNs) là một nhóm mô hình học thống kê được lấy cảm hứng từ mạng lưới thần kinh sinh học trong mô phỏng não người [13]. ANNs bao gồm một nhóm các nút thần kinh được kết nối với nhau tương ứng như các tế bào thần kinh của bộ não con người. Mô hình được sử dụng rộng rãi và giải thích đơn giản nhất là mô hình tri giác đa lớp multilayer perceptron (MLP), một mạng lưới thần kinh chuyển tiếp thức ăn. Hình 2.1 giới thiệu mô hình tri giác 3 lớp với 3 đầu vào, 2 đầu ra và một lớp ẩn với 5 nơron. Hình 2.1 Ví dụ về mô hình tri giác đa lớp multilayer perceptron (MLP) Mỗi neuron là các liên kết đầu vào khác nhau, ở mỗi thành phần neuron, các đầu vào được tổng hợp với các trọng số nhất định, thêm phần sai số. Gía trị tổng sau đó được biến đổi sử dụng một hàm hoạt động f để có các khác biệt cho các neuron khác nhau. Hay nói cách khác, đưa ra các đầu vào ൭ của phân lớp, đầu ra của lớp n+1 được tính toán như sau: 吠 m吠 慬+ ൭) + m吠浔吠 慬+ (7) 26 Đây là những hàm hoạt động khác nhau, một số hàm tiêu chuẩn như sau: Hàm xác định: ൭ ൭ (8) Hàm đơn vị điều chỉnh tuyến tính Rectified linear unit (ReLU): ൭ we ൭ ൭ we ൭ (9) Hàm Sigmoid: ൭ +〼൭ (10) Hàm Tanh: ൭ +〼൭ (11) Có rất nhiều nghiên cứu sử dụng ANNs để phân loại lớp phủ và nhiều mô hình được đưa ra có độ chính xác cao hơn các phương pháp phân lớp truyền thống [3]. 3.3 eXtreme Gradient Boosting Gần đây, Chen và Guestrin, đã công bố một bản nâng cấp của GBM, được gọi là eXtreme Gradient Boosting (XGBoost) [3]. Từ sau đó, nó đã tạo nên ảnh hưởng lớn trong cộng đồng học máy, trở thành giải pháp chiến thắng trong nhiều cuộc thi Học máy. Một số nghiên cứu trong các lĩnh vực khoa học khác đã chứng minh hiệu suất vượt trội của nó so với các thuật toán phổ biến. 27 Trong Gradient Boosting, các cây được xây dựng liên tiếp nhau và mỗi mô hình mới sử dụng thuật toán Gradient Descent. Mô hình cuối cùng là kết quả của sự tăng thêm của nhiều hàm khác nhau từ khi bắt đầu. Trong XGBoost, các cây có thể được xây dựng song song. Nó cũng có mô hình bên trong để xử lý dữ liệu đầu vào thưa. Do đó nó có thể làm việc tốt trong nhiều trường hợp mà dữ liệu ảnh bị thiếu do mây. Nguyên lý chính khác biệ

Các file đính kèm theo tài liệu này:

  • pdfluan_van_phan_loai_lop_phu_do_thi_cho_khu_vuc_ha_noi_viet_na.pdf
Tài liệu liên quan