CHƯƠNG 1. TỔNG QUAN. 1
1. Tổng quan bài toán nghiên cứu:. 1
2. Giới thiệu tổng quan về viễn thám và dữ liệu viễn thám.1
2.1. Khái niệm về viễn thám.1
2.2. Nguyên lý thu nhận dữ liệu viễn thám. 3
2.3. Phân loại viễn thám với các hệ thống cảm biến tự động:. 7
2.4. Các đặc trưng cơ bản của ảnh viễn thám. 11
3. Ứng dụng ảnh viễn thám để phân loại lớp phủ mặt đất và lớp phủ đô thị.13
3.1. Ứng dụng ảnh viễn thám để phân loại lớp phủ mặt đất.13
3.2. Ứng dụng ảnh viễn thám để phân loại lớp phủ đô thị.15
3.3. Bài toán phân lớp phủ đô thị ở Việt Nam. 15
4. Dữ liệu vệ tinh Venus.16
4.1. Giới thiệu tổng quan vệ tinh Venus. 16
4.2. Đặc trưng cơ bản và định dạng ảnh vệ tinh Venus:.17
5. Mục đích và ý nghĩa của bài toán được giải quyết trong luận văn.19
5.1. Ý nghĩa khoa học.19
5.2. Ý nghĩa thực tiễn. 19
CHƯƠNG 2. PHƯƠNG PHÁP PHÂN LOẠI LỚP PHỦ ĐÔ THỊ.20
1. Các phương pháp phân loại lớp phủ mặt đất và lớp phủ đô thị sử dụng
ảnh viễn thám.20
1.1. Các phương pháp phân loại lớp phủ mặt đất. 20
1.2. Các phương pháp phân loại lớp phủ đô thị. 21
2. Một số phương pháp kết hợp ảnh.21
3. Các phương pháp học máy nền tảng trong nghiên cứu phân lớp phủ. 23
3.1 Support Vector Machine.23
3.2 Artificial Neural Network. 25
59 trang |
Chia sẻ: honganh20 | Lượt xem: 481 | Lượt tải: 3
Bạn đang xem trước 20 trang tài liệu Luận văn Phân loại lớp phủ đô thị cho khu vực Hà Nội - Việt Nam sử dụng ảnh vệ tinh venus, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ác dải này có thể được ghép lại với nhau để tạo
thành một bức ảnh của một khu vực rộng lớn với độ phân giải 1 km. Trong một chu
kỳ quay ngày đêm nó có thể quan sát được toàn bộ trái đất, một nửa vào thời gian
ban ngày và một nửa vào thời gian ban đêm.
Đối với hầu hết các vệ tinh quỹ đạo cực người ta chọn sao cho nó đồng bộ
với mặt trời, nghĩa là góc nghêng của mặt phẳng quỹ đạo vệ tinh được giữ không
đổi so với mặt phẳng hoàng đạo suốt thời gian trong năm. Điều này đảm bảo cho vệ
tinh bay qua một địa phương đã cho vào cùng một giờ địa phương mỗi ngày. Vệ
tinh quỹ đạo cực không quan sát được thường xuyên liên tục như vệ tinh địa tĩnh,
nhưng thiết bị có thể đa dạng hơn, độ cao gần trái đất hơn nên nó cho ta thông tin
chi tiết hơn. Vệ tinh cực có ưu điểm là chụp trực tiếp được ảnh mây ở phía dưới nó
với độ phân giải rất cao nên chúng cho ta thông tin chi tiết về về mây, về các cơn
bão và những hệ thống thời tiết khắc nghiệt. [4]
10
Hình 1.5 Vệ tinh địa tĩnh và Vệ tinh quỹ đạo cực
Nguồn ảnh:
ĐHQG.Khí Tượng Vệ
Tinh (NXB Đại Học Quốc Gia 2007) - Nguyễn Văn Tuyên, Trang 17
Phân loại dựa vào ghi nhận quang phổ:
Gồm 3 loại:
- Viễn thám trong dải sóng nhìn thấy được và hồng ngoại: 0.4-0.76µm (1µm
= 1x10-3mm).
- Viễn thám hồng ngoại nhiệt: bước sóng từ 3-22µm
- Viễn thám siêu cao tần: 1mm-1m
Các loại quang phổ được dùng trong các hệ thống cảm biến tự động:
Có 5 loại thường được sử dụng quang phổ được sử dụng trong viễn thám như sau:
- Ánh sáng nhìn thấy được: là các bước sóng từ 0.4-0.76 microns ( 1 microns
= 1000 mm). Năng lượng được cung cấp bởi các bước sóng này tạo ra rất quan
trọng trong cảm biến tự động.
- Hồng ngoại gần: bước sóng từ 0.77-1.34 microns
- Hồng ngoại trung bình: bước sóng từ 1.55-2.4 microns
- Hồng ngoại nhiệt: bước sóng tù 3-22 microns
- Siêu cao tần: là các ánh sáng có bước sóng từ 1-30 microns
Tầng khí quyển không hấp thụ các bước sóng lớn hơn 2 cm mà nó cho phép năng
lượng ngày và đêm mà không có sự ảnh hưởng của các đámmây, sương mù và mưa [3].
11
Hình 1.6 Các bước sóng thường được sử dụng trong viễn thám
Nguồn ảnh:
2.4. Các đặc trưng cơ bản của ảnh viễn thám
Ảnh vệ tinh là các hình ảnh về trái đất hoặc các hành tinh khác ghi nhận bởi
các vệ tinh quan sát. Các vệ tinh thường được vận hành bởi các tổ chức chính phủ,
hoặc các tổ chức kinh doanh trên thế giới. Hiện tại có rất nhiều vệ tinh quan sát và
chúng có đặc điểm chung như: độ phân giải về không gian, độ phân giải về quang
phổ, độ phân giải về phóng xạ độ phân giải về biểu thị thời gian. Chi tiết mô tả các
độ phân giải như sau [3]:
- Độ phân giải về không gian: là kích thước của pixel trên mặt đất, hay kích
thước của đối tượng nhỏ nhất có khả năng phân biệt trên ảnh. Tham chiếu
IFOV( Instantaneous Field of View) trường quan sát hiện thời – nó là vùng xung
quanh cảm biến vệ tinh nhìn thấy được.
Hình 1.7 Độ phân giải về không gian của ảnh vệ tinh
Nguồn ảnh: Introduction to Remote Sensing of Environment -
R.B. Smith (2002)
12
Ví dụ: Ảnh Venus có độ phân giải về không gian là 10m tức là vùng phủ của
Venus có độ phủ trên bề mặt trái đất là 10x10m.
- Độ phân giải phổ: Là số lượng và kích thước của các khoảng phổ mà các
bộ cảm thu nhận và ghi lại dữ liệu, có khả năng cảm biến để tiếp nhận từ ánh sáng
mặt trời. Nếu camera thông thường trên điện thoại có thể thấy các ánh sáng màu: đỏ,
xanh lá, xanh da trời thì nhiều cảm biến vệ tinh có thể cảm biến được các bước sóng
khác nhau như: cận hồng ngoại, hồng ngoại nhiệt, vi sóng (như radar). Ngoài ra còn
liên quan đến cơ chế ghi nhận thông tin phổ.
Hình 1.8 Độ phân giải phổ của ảnh vệ tinh
Ví dụ: cảm biến TIRS được gắn trên vệ tinh Landsat8 có thể thu nhận được
bước sóng từ 10.6 đến 12.51 microsmetes.
- Độ phân giải về bức xạ: được mô tả về khả năng phân biệt được các sự
khác nhau rất nhỏ trong nhiệt ánh sáng, hơn nữa nó có khả năng phát hiện những
khác biệt rất nhỏ của sự phản chiếu hoặc năng lượng sóng điện từ.
Ví dụ: Ảnh 1 bit, 7 bit, 8 bit, 11 bit,...
- Độ phân giải về thời gian: là khoảng thời gian liên tiếp giữa 2 lần quan sát
thành công bên ngoài vùng tương tự trên bề mặt trái đất.
Ví dụ: Với ảnh vệ tinh Venus là 2 ngày
13
Bảng 1.1 Bảng so sánh một số đặc tính của các ảnh vệ tinh
STT
Tên ảnh
vệ tinh
Phân
loại
Đặc trưng
về độ phân
giải không
gian
Độ phân giải phổ
(không bao gồm
phổ nhìn thấy
được)
Độ phân giải
bức xạ
Độ phân giải
về thời gian
1 MODIS
Quang
học
250 – 1000m36 kênh 12 bits Hàng ngày
2 SPOT 5
Quang
học
10m
4 kênh (Green,
Red, Near IR,
SWIR)
8 bits
2-3 ngày, phụ
thuộc vào vĩ
độ
3 Landsat 8
Quang
học
30m
10 kênh (Coastal -
> TIRS2)
12 bits 16 ngày
4
Sentinel
2A
Quang
học
10 – 20m
12 kênh (Coastal -
> SWIR)
12 bits 10 ngày
5 Venus
Quang
học
10 m
12 kênh (visible
and near-infrared)
12 bits 2 ngày
3. Ứng dụng ảnh viễn thám để phân loại lớp phủ mặt đất và lớp phủ đô thị
3.1. Ứng dụng ảnh viễn thám để phân loại lớp phủ mặt đất
Land cover (LC): là một thuật ngữ dùng để chỉ độ phủ trên bề mặt của trái
đất. Một số ví dụ về độ che phủ đất là: thực vật, tòa nhà, nước và mây. Độ che phủ
của đất phản ánh sự bức xạ ánh sáng của Mặt Trời sau đó được chụp lại bởi các cảm
biến của vệ tinh.
Việc sử dụng đất và phân lớp độ che phủ đất (LULCC- Land use and land
cover classification) đã được xem xét như một trong những ứng dụng cơ bản và
quan trọng nhất trong viễn thám vì các sản phẩm LULCC rất cần thiết cho một loạt
các ứng dụng liên quan đến môi trường.
14
Hình 1.9 Bản đồ sự thay đổi phân lớp phủ đất cho đồng bằng sông Hồng
tính đến năm 2010
Nguồn ảnh: https://www.researchgate.net/figure/Land-cover-map-of-Hanoi-
using-the-Support-Vector-Machine-Classification_fig4_289530399
Thông thường, phân lớp phủ được phân loại dựa vào nghiên cứu theo vùng,
khu vực hoặc các nghiên cứu toàn cầu.
- Nghiên cứu theo khu vực: tập trung vào các phương thức phân lớp
phủ cho một hoặc một vài khu vực đặc biệt
- Nghiên cứu toàn cầu: phân lớp liên quan đến sự mở rộng toàn cầu
Độ chính xác về độ phủ của đất mức toàn cầu vẫn nhỏ hơn các bản đồ phân
lớp phủ của đất theo khu vực. Cũng có thể hiểu đó là những thách thức trong phân
lớp phủ ở mức mở rộng toàn cầu bao gồm: có nhiều loại độ phủ của đất, do thiếu dữ
liệu thực địa.
15
Một số nghiên cứu độ phủ của đất theo khu vực được đề cập đến như:
(1) Xiaoping Zhang đã sử dụng dữ liệu ảnh Landsat để giám sát tự động bề
mặt không thấm nước ở đảo Zhoushan từ 2006-2011 và đạt được độ chính xác
khoảng 86-88%.
(2) Mẫn Đức Chức đã thực hiện composite ảnh sử dụng dữ liệu ảnh
Landsat8 trong 3 năm từ 2014-2016 để đưa ra bản đồ che phủ đất tốt nhất đạt được
độ chính xác 83,91%.
3.2. Ứng dụng ảnh viễn thám để phân loại lớp phủ đô thị
Một trong những thách thức cấp bách nhất ở hiện tại và cả tương lai là sự đô
thị hóa trên toàn cầu. Đô thị hóa là quá trình phát triển kinh tế, xã hội, song song
với sự mở rộng không gian đô thị. Khi dân số trên toàn cầu tăng lên và nền kinh tế
của các quốc gia tiếp tục phát triển mà không còn dựa vào các hệ thống nông
nghiệp, các thành phố sẽ tăng lên và mở rộng hơn. Sự phát triển đô thị thường xâm
phạm đến đất trồng rừng hoặc đất nông nghiệp. Sự tăng trưởng thành phố là một chỉ
số của công nghiệp hóa (phát triển) và nhìn chung đều có ảnh hưởng tiêu cực đến
sức khỏe môi trường của một vùng. Có được thông tin lớp phủ đô thị sẽ giúp những
nhà hoạch định chính sách xây dựng được chiến lược phát triển hợp lý và bền vững
mà vẫn có thể bảo vệ được môi trường.
Lớp phủ đô thị sẽ được đặc trưng bởi hỗn hợp các kiểu lớp phủ khác nhau, là
các tổ hợp của các lớp phủ khác biệt nhau về phổ phản xạ. Do tính chất không đồng
nhất này, nên trong viễn thám, việc phân loại các kiểu lớp phủ đô thị thường gặp rất
nhiều khó khăn. Đường giao thông, các công trình nhà ở, bãi đỗ xe được phủ bởi
vật liệu không thấm nước như nhựa đường, đá, vật liệu xây dựng v.v là các mặt
không thấm và chúng có tính chất vật lý riêng do đó được ghi nhận trên dải quang
phổ điện từ như là một đối tượng.
3.3. Bài toán phân lớp phủ đô thị ở Việt Nam
Quá trình đô thị hoá là quá trình phát triển về kinh tế, xã hội, văn hoá và
không gian kiến trúc. Quá trình này thường làm thay đổi đáng kể các điều kiện sinh
thái đô thị được thể hiện qua việc biến đổi không gian bề mặt của lớp phủ từ các hệ
16
sinh thái tự nhiên sang môi trường chịu tác động bởi con người. Thông tin chính
xác và cập nhật về tình trạng và xu hướng của các hệ sinh thái đô thị cần thiết để
phát triển các chiến lược phát triển bền vững và cải thiện cuộc sống đô thị cũng như giúp
các nhà quản lý theo dõi biến động và ra quyết định. Có nhiều phương pháp khác nhau
cũng như nhiều cách tiếp cận khác nhau có thể được lựa chọn để nghiên cứu quá trình đô
thị hoá qua thay đổi lớp phủ đô thị. Trong đó, viễn thám và hệ thông tin địa lý (GIS) là
những phương pháp hiện đại, là những công cụ mạnh có khả năng giúp giải quyết các
vấn đề ở tầm vĩ mô về không gian trong thời gian ngắn. [7]
Hà Nội là thủ đô của nước Cộng hòa Xã hội chủ nghĩa Việt Nam, nằm ở đầu
của đồng bằng sông Hồng, thuộc khu vực phía bắc và. Tiếp giáp các tỉnh: phía Bắc
giáp Thái Nguyên, phía Đông giáp Bắc Ninh và Hưng Yên, phía Nam giáp Vĩnh
Phúc và phía Tây giáp các tỉnh Phú Thọ và Hòa Bình[1]. Hà Nội có diện tích bao
phủ 3358.9 ﷻ và là thành phố có mật độ dân số lớn thứ 2, với 8.053.663 người
tính đến ngày 11 tháng 7 năm 2019 ( Theo kết quả thống kê sơ bộ của Tổng cục
thống kê năm 2019). Hà Nội đang phát triển dựa trên một khu vực trung tâm và các
đô thị vệ tinh. Ngoài tám khu công nghiệp hiện có, năm khu công nghiệp quy mô
lớn mới và 16 khu công nghiệp vừa và nhỏ cùng các cụm công nghiệp đang được
xây dựng [2]. Để đáp ứng được mức độ tăng trưởng đô thị, cần kế hoạch phát triển
đô thị toàn diện cùng với các biện pháp quy hoạch thích hợp cần được nhà nước có
chính sách đưa ra và thực hiện kịp thời. Nhiều khả năng khu vực đô thị sẽ nhanh
chóng mở rộng về phía ngoại ô dọc theo các khu công nghiệp dọc các tuyến đường
huyết mạch. Theo đó, với cơ sở hạ tầng không đầy đủ sẽ tạo ra nhiều vấn đề với đô
thị ngổn ngang và dịch vụ xã hội không phù hợp.
4. Dữ liệu vệ tinh Venus
4.1. Giới thiệu tổng quan vệ tinh Venus
Vệ tinh khoa học Venus phóng lên từ khoảng 8 giờ 36 sáng 2/8/2017 (theo giờ
Việt Nam). Hoạt động giám sát thảm thực vật và môi trường, đây là một nỗ lực hợp tác
chung giữa Trung tâm nghiên cứu không gian quốc gia Pháp Centre National d’Etudes
Spatiales (CNES) và Cơ quan không gian Israel- Israel Space Agency(ISA).
Theo chu kỳ hai ngày, vệ tinh Venus sẽ ghi lại hình ảnh 100 địa điểm riêng
biệt trên toàn thế giới trong khoảng thời gian hai năm rưỡi, qua đó hình thành biểu
17
đồ về ảnh hưởng của biến đổi khí hậu đối với hệ sinh thái và nông nghiệp cũng như
phục vụ nghiên cứu lượng khí carbon và sự phát triển của thực vật. Độ phân giải
ảnh vệ tinh VENµS là 10m, với trường quan sát khoảng 27km. Chu kỳ lặp lại quỹ
đạo trong vòng 2 ngày, với góc quan sát cố định. Cung cấp hình ảnh trong 12 dải
quang phổ có bước sóng trong khoảng từ 415nm đến 910nm. [6]
Hình 1.10 Ảnh vệ tinh Venus
Nguồn ảnh vệ tinh Venus (photo credit: SCIENCE, TECHNOLOGY AND
SPACE MINISTRY)
4.2. Đặc trưng cơ bản và định dạng ảnh vệ tinh Venus:
Định dạng ảnh Venus gồm 2 loại: L1C và L2A
Ảnh L1C: Phản xạ ở tầng khí quyển cao nhất (có khả năng sử dụng cho vị trí
địa lý cho từng vùng khác nhau). Ảnh mức 1 này có độ phân giải hình học 5m, được
dùng làm đầu vào cho các bộ xử lý mức 2.
Có định dạng: VENUS_20180131-143921-000_L1C_25MAYO_D_V0-8.zip
Ảnh L2A cung cấp :
- Làm mịn mây, bóng mây và hơi nước bao phủ
- Độ phản xạ bề mặt sau khi hiệu chỉnh khí quyển cho toàn bộ dải quang phổ
(vẫn giữ định vị cố định)
- Độ phân giải hình học 10m
18
Có định dạng: VENUS_20180707-182652-000_L2A_DESIP2_D_V1-0.zip
Dữ liệu ảnh Venus bao gồm:
- Chứa các siêu dữ liệu hình thành việc thu nhận ảnh.
- Thể hiện ngày tháng và thời gian ảnh được ghi nhận
- Phép chiếu và độ bao phủ về địa lý
- TOA phản xạ trên 12 kênh từ B01 đến B12
Ngoài ra, có ảnh mức 3 sẽ cung cấp các biến như mức L2A nhưng mỗi tuần
sẽ tối đa hoá số lượng pixel ảnh không mây và cùng có độ phân giải hình học là
10m [7].
Bảng 1.2 Đặc điểm ảnh vệ tinh Venus
Vệ
tinh
Các dải phổ và
đặc điểm nhận
dạng
Bước sóng
(nanometers)
Băng thông
(nanometers)
Xử lý chính
Venus
Band 1
420 40 Sự điều chỉnh về khí
quyển
Band 2 443 40 Sương mù, mây
Band 3 490 40 Sự điều chỉnh về khí
quyển
Band 4 555 40 Đất
Band 5 638 40 Đất
Band 6 638 40 DEM, chất lượng ảnh
Band 7 672 30 Đất
Band 8 702 24 Đất
Band 9 742 16 Đất
Band 10 782 16 Đất
Band 11 865 40 Đất
Band 12 910 20 Hơi nước
19
5. Mục đích và ý nghĩa của bài toán được giải quyết trong luận văn
5.1. Ý nghĩa khoa học
Trong thực tế việc nghiên cứu, quan sát đánh giá phân lớp phủ trên bề mặt
trái đất bằng các phương pháp hiện đại như kết hợp ảnh vệ tinh đã được áp dụng ở
rất nhiều loại ảnh vệ tinh( Landsat, SPOT, ) cho nhiều khu vực trên thế giới.
Hướng nghiên cứu kết hợp ảnh vệ tinh và tạo ra bản đồ lớp phủ với GIS là
khuynh hướng phát triển phần mềm mà các chuyên gia đưa ra, cùng với trí tuệ nhân
tạo, nhận dạng; nhằm thiết lập các công cụ hiệu quả trong các ứng dụng của GIS đối
với các hoạt động kinh tế xã hội, an ninh quốc phòng.
Ý nghĩa khoa học: Kết quả sẽ làm sáng tỏ thêm về phương pháp áp dụng kết
hợp ảnh vệ tinh trong phân lớp phủ trên bề mặt trái đất nói chung và phân lớp phủ
đô thị nói riêng. Hệ thống hoá lại cách tiếp cận nghiên cứu, các bước xử lý và phân
lớp ảnh vệ tinh mới như ảnh vệ tinh Venus.
5.2. Ý nghĩa thực tiễn
Đề xuất những khả năng phát hiện bất thường trong quy hoạch, theo dõi biến
động và quản lý tốc độ tăng trưởng đô thị của thành phố Hà Nội – Việt Nam. Góp
phần thêm mới vào kết quả bản đồ phân lớp phủ cho kho dữ liệu nghiên cứu ảnh vệ
tinh Venus.
20
CHƯƠNG 2. PHƯƠNG PHÁP PHÂN LOẠI LỚP PHỦ ĐÔ THỊ
1. Các phương pháp phân loại lớp phủ mặt đất và lớp phủ đô thị sử
dụng ảnh viễn thám
1.1. Các phương pháp phân loại lớp phủ mặt đất
Để nghiên cứu biến động lớp phủ mặt đất có nhiều phương pháp khác nhau
với nhiều nguồn tài liệu khác nhau như: từ các số liệu thống kê hàng năm, số liệu
kiểm kê, hay từ các cuộc điều tra. Các phương pháp này thường tốn nhiều thời gian,
kinh phí và không thể hiện được sự thay đổi từ trạng thái này sang trạng thái khác
của lớp phủ mặt đất, và vị trí không gian của sự thay đổi đó. Phương pháp sử dụng
dữ liệu viễn thám đã khắc phục được những nhược điểm đó.
Cơ sở của dữ liệu viễn thám là phản xạ phổ của các đối tượng tự nhiên, có
thể phân tích và thể hiện, đặc biệt có thể chia tách các vùng của các đối tượng trong
lớp phủ mặt đất với các diện tích vùng riêng biệt. Dựa trên đặc trưng phản xạ phổ
của các lớp đối tượng, bằng các mô hình, phần mềm chuyên dụng, dữ liệu viễn
thám được xử lý để xác định và chia tách với từng đối tượng. Dữ liệu viễn thám đa
thời gian cho phép xác định nhanh biến động lớp phủ mặt đất trong các khoảng thời
gian giữa các thời điểm thu ảnh. Các thông tin về các đối tượng lớp phủ sau khi
chiết tách, có thể tạo ra các bản đồ hiện trạng và tính toán cụ thể diện tích tại từng
thời điểm cũng như tổng hợp phân tích kết quả về phân bố và biến động
Hiện nay, có nhiều phương pháp tiếp cận để phân loại ảnh vệ tinh như:
- Phương pháp phân loại tự động không giám sát (unsupervised
classification): là phân loại thuần túy theo tính chất phổ, phụ thuộc hoàn toàn vào
máy mà không biết rõ tên nhãn hay tính chất của lớp phổ đó.
- Phương pháp phân loại tự động có giám sát (supervised classification): là
phân loại theo xác suất cực đại (maximum likelihood). Việc lựa chọn tập mẫu được
tiến hành thông qua khảo sát biểu đồ hình cột (histogram) của các pixel ảnh vệ tinh
cho từng đối tượng lớp phủ mặt đất cho vùng nghiên cứu
- Phương pháp phân ngưỡng (manual thresholds): dùng để chuyển ảnh đầu
vào (gồm ảnh màu hoặc ảnh xám) về không gian ảnh nhị phân (chỉ gồm 2 màu)
nhằm đơn giản hóa quá trình xử lý
- Phương pháp sử dụng logic mờ (Fuzzy logic): dựa trên nguyên tắc mỗi
pixel có thể thuộc về nhiều lớp phủ và mỗi lớp phủ sẽ chiếm tỷ lệ phần trăm tương
21
ứng trong mỗi pixel. Tập mờ là một bộ mà các phần tử có mức độ thành viên. Một
phần tử của tập mờ có thể là thành viên đầy đủ (100% thành viên) hoặc thành viên
một phần (từ 0% đến 100% thành viên)
Trong các phương pháp phân loại này thường sử dụng một số thuật toán phổ
biến như khoảng cách ngắn nhất (minimum distance), xác suất cực đại (maximum
likelihood), K – Means, C –Means, ISODATA
1.2. Các phương pháp phân loại lớp phủ đô thị
Ứng dụng viễn thám trong theo dõi biến động đô thị thực chất là nghiên cứu
biến động lớp phủ mặt đất của đô thị, tập trung vào các đối tượng chính như: đất
nông nghiệp, đất ở, đất bằng chưa sử dụng, mặt nước, để từ đó đưa ra xu thế biến
động của đô thị về mặt không gian.
Từ dữ liệu ảnh vệ tinh có độ phân giải cao, tiến hành xử lý, giải đoán, phân
loại, chiết tách các thông tin, thành lập bản đồ lớp phủ mặt đất tại các thời điểm.
Trong phân loại lớp phủ đô thị ở phạm vi nghiên cứu, tôi sử dụng phương
pháp phân loại tự động có giám sát (supervised classification).
2. Một số phương pháp kết hợp ảnh
Phương pháp kết hợp ảnh: là quá trình kết hợp các ảnh cùng loại trong một
khoảng thời gian nhất định được kết hợp với nhau để chọn ra tối đa hoặc tối thiểu
điểm của ảnh (chẳng hạn như: chỉ số thực vật, độ phản xạ của một kênh hoặc nhiệt
độ) được chọn làm đại diện của các điều kiện bề mặt trong quá trình đo[8].
Các hình ảnh vệ tinh quang học có một nhược điểm lớn, chúng bị ảnh hưởng
nặng nề bởi sự bao phủ của các đám mây. Nếu một vùng bị bao phủ bởi mây trong
suốt quá trình vệ tinh bay qua, dữ liệu ghi nhận được coi như là không có gì. Do đó,
đã có rất nhiều nhà nghiên cứu tìm các các phương pháp khác nhau để xử lý mây và
ảnh hưởng của mây. Kết hợp ảnh dựa trên các điểm ảnh là một mô hình trong ngành
khoa học viễn thám, tập trung vào việc tạo ra các bức ảnh kết hợp không có mây,
phóng xạ. Ảnh kết hợp này là các khoảng không gian lớn liền kề nhau [9]. Trong
quá khứ, đã có một số phương pháp kết hợp cho những ảnh không gian độ phân giải
thấp (chẳng hạn 500x500m hoặc lớn hơn). Những phương pháp này mục đích chính
là để giảm sự tác động của mây, sự ô nhiễm hóa chất, khối dữ liệu và các hiệu ứng
quan sát, những thứ vốn luôn có trong các bức ảnh.
22
Gần đây, một số lượng lớn các phương pháp kết hợp các điểm ảnh tốt nhất
(Best-Available-Pixel - BAP) đã được đề xuất cho các ảnh vệ tinh cỡ vừa và lớn.
Nhìn chung, các phương pháp BAP thay thế các điểm ảnh bị mây che phủ với các
điểm ảnh chất lượng tốt nhất từ một tập các ứng viên dựa trên các quy tắc cơ bản.
Theo một hướng khác, Griffiths và các đồng sự đã đề xuất một phương pháp BAP
xếp hạng điểm ảnh ứng viên bởi tập chỉ số như là khoảng cách tới mây và bóng mây,
năm và ngày trong năm (DOY) [10]. Phương pháp này được cải thiện bằng việc kết
hợp thêm các chỉ số mới về độ mờ trong khí quyển và loại cảm biến. Năm 2018,
nhóm tác giả Mẫn Đức Chức, Nguyễn Thanh Thủy, Bùi Quang Hưng, Kristofer
Lasko và Nguyễn Thị Nhật Thanh đã thực hiện một cải tiến mới trong việc kết hợp
ảnh. Để lựa chọn được điểm ảnh tốt nhất, nhóm tác giả xây dựng bộ chỉ số Year,
DOY, Opacity, DistanceToCloud/CloudShadow [3].
Bảng 2. 1 Đặc trưng các phương pháp kết hợp ảnh
ST
T
Tác giả Ảnh vệ
tinh
Phương pháp
1 Hansen,
2008
[12]
Landsat
5, 7
吠൭〼 〼〼 〼 min es N w em
慬 吠 〼 es N w em
慬 w 慬 吠 〼
Trong đó:
吠൭〼 〼〼 〼 : Điểm ảnh được lựa chọn cho việc kết hợp
es N w em
慬 w 慬 吠 〼 : xác suất bị ảnh hưởng bởi mây/bóng mây của
cùng điểm ảnh trong n ảnh ứng viên
Nếu 2 hoặc nhiều hơn các điểm ảnh ứng viên có cùng
Pcloud&shadow, thì chọn điểm ảnh gần nhất so với giá trị tham chiếu
rừng (100)
2 White,
2014
[10]
Landsat
5, 7
吠൭〼 〼〼 〼
max sﷻ e e 〼
eܿ 吠 es w em
e 〼慬 e
慬 吠 〼
3 Mẫn
Đức
Chức,
Landsat
8
吠൭〼 〼〼 〼
max sﷻ e e 〼 〼 e eܿ 吠
es w em
慬 吠 〼
23
2018 [3]
3. Các phương pháp học máy nền tảng trong nghiên cứu phân lớp phủ
Về cơ bản nhất, phân lớp phủ là một loại phân lớp dữ liệu ảnh. Có nhiều phương
pháp từ các ngưỡng cơ bản đến tiên tiến hơn chẳng hạn như: khoảng cách tối đa
(Maximum Likelihood), hồi quy logistic (logistic regression), cây quyết định, Random
Forest, Neural Network, Support Vector Machine (SVM), chi tiết như mô tả dưới đây:
3.1 Support Vector Machine
Support Vector Machines (SVM) là một nhóm của các phương pháp học có giám
sát, được giới thiệu ở [12]. Các SVM tìm ra ranh giới quyết định mang lại sự khái quát
tốt nhất - còn được gọi là siêu mặt phẳng tách biệt tối ưu trong không gian đa chiều.
Giả sử dữ liệu huấn luyện được đại diện bởi {xi, yi}, i = 1, ..., k, trong đó x ∈
Rn là một vectơ không gian n chiều và y ∈ {1, -1} là nhãn của lớp. Tập dữ liệu
huấn luyện này có thể được phân tách bằng một siêu mặt phẳng nếu tồn tại một
vectơ w = (w1, ..., wk) và một vô hướng b thỏa mãn bất đẳng thức sau:
24
吠 (w൭吠 + b) -1 + 吠 ≥ 0 ∀y = {+1, -1}
(5)
m + 吠 吠
(6)
Trong đó 吠 là biến yếu cho biết khoảng cách của mẫu dữ liệu từ siêu mặt
phẳng tối ưu. Hàm mục tiêu có thể được viết như sau:
C là hằng số được sử dụng để kiểm soát mức độ phạt liên quan đến các mẫu
huấn luyện xảy ra ở phía sai của siêu mặt phẳng tách tối ưu. C nên được xem xét
chặt chẽ cho từng nhiệm vụ phân loại cá nhân. Siêu mặt phẳng tối ưu có thể được
xác định bằng cách giảm thiểu hàm mục tiêu trong biểu thức. (2) theo các ràng buộc
trong biểu thức. (1). Điều này có thể được thực hiện bằng cách sử dụng các số nhân
Lagrange và phương pháp lập trình bậc hai.
Cách tiếp cận cơ bản để phân loại SVM có thể được mở rộng để cho phép
các ranh giới quyết định phi tuyến bằng cách ánh xạ dữ liệu đầu vào vào không gian
chiều cao hơn để trong không gian mới, dữ liệu có thể được phân tách tuyến tính.
Để làm điều này, một hàm kernel được giới thiệu: K (൭吠 ൭ ) = (φ(൭吠 ), φ(൭ )), trong
đó một mẫu dữ liệu đầu vào x có thể được biểu diễn là (x) trong không gian H. Hạt
nhân này cho phép tính toán sản phẩm bên trong (φ(൭吠 ), φ(൭ )) mà không cần biết
chính xác biểu diễn của các mẫu dữ liệu ൭吠và ൭ trong không gian cao hơn. Tồn tại
một số loại hàm bao gồm hạt nhân dựa trên đa thức và cơ sở xuyên tâm (RBF), v.v.
Do SVM được phát triển như một trình phân loại nhị phân, nên cần điều
chỉnh phương thức này với các vấn đề phân loại đa lớp. Có hai cách tiếp cận phổ
biến để giải quyết vấn đề. Phương pháp thứ nhất được gọi là phương pháp một đối
một và phương pháp thứ hai là phương pháp một đối nhiều[3].
25
3.2 Artificial Neural Network
Artificial Neural Networks (ANNs) là một nhóm mô hình học thống kê được
lấy cảm hứng từ mạng lưới thần kinh sinh học trong mô phỏng não người [13].
ANNs bao gồm một nhóm các nút thần kinh được kết nối với nhau tương ứng như
các tế bào thần kinh của bộ não con người. Mô hình được sử dụng rộng rãi và giải
thích đơn giản nhất là mô hình tri giác đa lớp multilayer perceptron (MLP), một
mạng lưới thần kinh chuyển tiếp thức ăn. Hình 2.1 giới thiệu mô hình tri giác 3 lớp
với 3 đầu vào, 2 đầu ra và một lớp ẩn với 5 nơron.
Hình 2.1 Ví dụ về mô hình tri giác đa lớp multilayer perceptron (MLP)
Mỗi neuron là các liên kết đầu vào khác nhau, ở mỗi thành phần neuron, các
đầu vào được tổng hợp với các trọng số nhất định, thêm phần sai số. Gía trị tổng sau
đó được biến đổi sử dụng một hàm hoạt động f để có các khác biệt cho các neuron
khác nhau. Hay nói cách khác, đưa ra các đầu vào ൭ của phân lớp, đầu ra của lớp
n+1 được tính toán như sau:
吠 m吠
慬+ ൭ ) + m吠 浔吠 慬+ (7)
26
Đây là những hàm hoạt động khác nhau, một số hàm tiêu chuẩn như sau:
Hàm xác định: ൭ ൭ (8)
Hàm đơn vị điều chỉnh tuyến tính Rectified linear unit (ReLU):
൭
we ൭
൭ we ൭
(9)
Hàm Sigmoid: ൭
+〼 ൭
(10)
Hàm Tanh: ൭
+〼 ൭
(11)
Có rất nhiều nghiên cứu sử dụng ANNs để phân loại lớp phủ và nhiều mô hình
được đưa ra có độ chính xác cao hơn các phương pháp phân lớp truyền thống [3].
3.3 eXtreme Gradient Boosting
Gần đây, Chen và Guestrin, đã công bố một bản nâng cấp của GBM, được
gọi là eXtreme Gradient Boosting (XGBoost) [3]. Từ sau đó, nó đã tạo nên ảnh
hưởng lớn trong cộng đồng học máy, trở thành giải pháp chiến thắng trong nhiều
cuộc thi Học máy. Một số nghiên cứu trong các lĩnh vực khoa học khác đã chứng
minh hiệu suất vượt trội của nó so với các thuật toán phổ biến.
27
Trong Gradient Boosting, các cây được xây dựng liên tiếp nhau và mỗi mô
hình mới sử dụng thuật toán Gradient Descent. Mô hình cuối cùng là kết quả của sự
tăng thêm của nhiều hàm khác nhau từ khi bắt đầu. Trong XGBoost, các cây có thể
được xây dựng song song. Nó cũng có mô hình bên trong để xử lý dữ liệu đầu vào
thưa. Do đó nó có thể làm việc tốt trong nhiều trường hợp mà dữ liệu ảnh bị thiếu
do mây. Nguyên lý chính khác biệ
Các file đính kèm theo tài liệu này:
- luan_van_phan_loai_lop_phu_do_thi_cho_khu_vuc_ha_noi_viet_na.pdf