Ánh xạ sử dụng đất thời gian cao độ phân giải Việt Nam - Truong Thinh Van
University of Tsukuba
Environmental Studies
Ẩn danh
Luận án
Năm xuất bản
Số trang
132
Thời gian đọc
20 phút
Lượt xem
0
Lượt tải
0
Phí lưu trữ
40 Point
Mục lục chi tiết
Abstract
Acknowledgement
List of Figures
List of Tables
List of Publications
List of Acronyms and Abbreviations
1. Introduction
1.1. Background of the research problem
1.2. The status of global LULC mapping
1.3. The need of having a time series of high resolution LULC maps for Vietnam
1.4. Method of LULC classification
1.5. Accuracy assessment of LULC map
1.6. Challenge and opportunities for LULC mapping
1.7. Research aims and objectives
2. The relationship between accuracy of land use and land cover map with number of map’s category
2.3. Result and discussion
2.3.1. Land cover map’s accuracy in individual studies
2.3.2. Land cover map’s accuracy synthesized from multiple studies
3. Annual Forest Cover Maps for Vietnam During 2015-2018 Using ALOS-2/PALSAR-2 and Auxiliary Data
3.2. Materials and methods
3.2.1. Satellite Images and Preprocessing
3.2.2. Classification Method
3.2.3. Collection of reference data
3.2.4. Method for Accuracy Assessment and Area Estimation
3.2.5. Method for Comparing FNF Maps from Difference Sources
3.3.
3.3.1. Classification result for three test sites
3.3.2. Forest/Non-Forest Maps Using ScanSAR/NDVI/SRTM
3.3.3. Comparison of Forest Cover Data from Multiple Sources
3.4.
3.4.1. Improvement of Forest Classification Using Multi-Temporal ScanSAR Images
3.4.2. Forest Change in Vietnam Between 2015 and 2018
3.4.3. Forest Dynamics in Vietnam
3.4.4. The Need of Having Reliable Forest Maps for User Communities
4. Creation of a High-Resolution Land Use Land Cover Map for Vietnam Using a Time-Feature Convolutional Neural Network
4.2. Materials and methods
4.2.1. Satellite images pre-processing
4.2.2. Reference data collection and accuracy assessment
4.2.3. Classification algorithm
4.3.
4.3.1. Time series of Sentinel-2 images
4.3.2. LULC map of mainland Vietnam
4.3.3. Comparison with other LULC products
4.4.
4.4.1. Improvements of our LULC map
4.4.2. The practicability of utilizing multi-year data for cloud-free optical image generation
4.4.3. Multi-temporal data for LULC classification
4.4.4. Potentials of time-feature CNN for future studies
5. The first time series of 10-m land use and land cover maps at the national scale for Vietnam from 2017 to 2022
5.2. Materials and methods
5.2.1. Creation of a time series of reference data and accuracy assessment
5.3.
5.3.1. A time series of LULC maps for Mainland Vietnam
5.3.2. LULC change in Vietnam from 2017 to 2022
5.3.3. Updating LULC map for Vietnam
5.4.
5.4.1. Comparing accuracy of different LULC product using the benchmark study
5.4.2. Support to national statistical data
5.4.3. Application for future LULC prediction
5.4.4. The demand on high-resolution LULC maps of Vietnam
5.4.5. Limitation and future studies
6. Conclusions and Remarks
6.1. Summary of key findings and contributions
6.2. Limitations and recommendations
Bibliography
Tóm tắt nội dung
I. Ánh Xạ Sử Dụng Đất Độ Phân Giải Cao Việt Nam
Bản đồ sử dụng đất đóng vai trò then chốt trong quản lý tài nguyên thiên nhiên. Công nghệ viễn thám hiện đại cho phép tạo ra các bản đồ LULC với độ chính xác cao. Nghiên cứu này tập trung vào việc phát triển chuỗi thời gian bản đồ sử dụng đất độ phân giải cao cho Việt Nam. Phương pháp kết hợp ảnh vệ tinh độ phân giải cao và machine learning phân loại đất mang lại kết quả vượt trội. Dữ liệu từ Sentinel-2, PALSAR-2 và các nguồn viễn thám khác được tích hợp toàn diện. Hệ thống GIS Việt Nam được ứng dụng để xử lý và phân tích dữ liệu không gian. Kết quả nghiên cứu cung cấp thông tin quan trọng về biến động sử dụng đất giai đoạn 2017-2022. Độ chính xác tổng thể đạt trên 90% cho 12 loại hình sử dụng đất. Công nghệ này hỗ trợ giám sát biến động đất đai hiệu quả hơn các phương pháp truyền thống.
1.1. Tầm Quan Trọng Của Bản Đồ Sử Dụng Đất
Bản đồ sử dụng đất cung cấp thông tin thiết yếu cho nhiều lĩnh vực. Dữ liệu LULC hỗ trợ nghiên cứu biến đổi khí hậu và mở rộng đô thị. Thông tin này giúp đánh giá tác động của hoạt động con người đến hệ sinh thái. Phân loại sử dụng đất chính xác là nền tảng cho quy hoạch bền vững. Các nhà hoạch định chính sách cần dữ liệu cập nhật để ra quyết định. Bản đồ độ phân giải cao phát hiện những thay đổi nhỏ trên bề mặt đất. Công nghệ viễn thám hiện đại giúp giám sát diện tích rừng, đất nông nghiệp và khu đô thị.
1.2. Thách Thức Trong Lập Bản Đồ LULC
Việc tạo bản đồ LULC độ phân giải cao gặp nhiều khó khăn. Thiếu dữ liệu huấn luyện chất lượng là rào cản lớn. Ảnh vệ tinh độ phân giải cao thường có độ phủ thời gian hạn chế. Mây che phủ ảnh hưởng đến chất lượng ảnh vệ tinh ở vùng nhiệt đới. Xử lý dữ liệu quy mô quốc gia đòi hỏi tài nguyên tính toán lớn. Chi phí thu thập và xử lý dữ liệu viễn thám rất cao. Cần phương pháp tự động hóa để giảm thời gian và công sức. Machine learning phân loại đất giúp khắc phục một phần những hạn chế này.
1.3. Mục Tiêu Nghiên Cứu Chính
Nghiên cứu nhằm tạo chuỗi thời gian bản đồ LULC cho Việt Nam. Mục tiêu là đạt độ phân giải không gian 10 mét. Độ chính xác mục tiêu vượt trội so với các bản đồ hiện có. Nghiên cứu phát triển phương pháp tự động hóa quy trình lập bản đồ. Kết hợp nhiều nguồn dữ liệu viễn thám để tăng độ tin cậy. Đánh giá biến động sử dụng đất giai đoạn 2017-2022. Cung cấp công cụ hữu ích cho quản lý tài nguyên đất đai Việt Nam.
II. Phương Pháp Viễn Thám Và Machine Learning
Công nghệ viễn thám kết hợp machine learning tạo đột phá trong lập bản đồ sử dụng đất. Nghiên cứu sử dụng mạng nơ-ron tích chập (CNN) để phân loại đất tự động. Dữ liệu đa thời gian từ Sentinel-2 và PALSAR-2 được tích hợp. Phương pháp Time-Feature CNN xử lý thông tin theo mùa hiệu quả. Ảnh vệ tinh độ phân giải cao từ nhiều nguồn được kết hợp thông minh. Google Earth Engine hỗ trợ xử lý dữ liệu quy mô lớn. Quy trình loại bỏ mây tự động cải thiện chất lượng ảnh đầu vào. Kỹ thuật lấy mẫu ngẫu nhiên phân tầng đảm bảo dữ liệu huấn luyện đại diện. Phương pháp di chuyển dữ liệu tham chiếu giúp tạo chuỗi thời gian bản đồ. Độ chính xác tổng thể đạt 90.2% cho 12 loại hình sử dụng đất. Kết quả vượt trội so với các bản đồ LULC 10m hiện có cho Việt Nam.
2.1. Dữ Liệu Ảnh Vệ Tinh Đa Nguồn
Nghiên cứu kết hợp nhiều loại ảnh vệ tinh khác nhau. Sentinel-2 cung cấp ảnh quang học độ phân giải 10m miễn phí. PALSAR-2/ScanSAR cung cấp dữ liệu radar xuyên qua mây. Landsat bổ sung thông tin chuỗi thời gian dài hạn. SPOT cung cấp ảnh độ phân giải cao cho khu vực quan trọng. Dữ liệu đa thời gian giúp nắm bắt đặc điểm theo mùa. Sáu mùa trong năm được sử dụng thay vì bốn mùa. Phương pháp này cải thiện khả năng phân biệt các loại đất. Kết hợp ảnh quang học và radar tăng độ tin cậy phân loại.
2.2. Mạng Nơ ron Tích Chập Time Feature
CNN được thiết kế đặc biệt cho dữ liệu chuỗi thời gian. Kiến trúc mạng xử lý đặc trưng không gian và thời gian đồng thời. Lớp tích chập trích xuất đặc điểm từ ảnh đa phổ. Lớp thời gian nắm bắt biến động theo mùa. Machine learning phân loại đất tự động từ dữ liệu huấn luyện. Mô hình học được các mẫu phức tạp trong dữ liệu. Độ chính xác phân loại cao hơn phương pháp truyền thống. Quy trình tự động giảm thời gian xử lý đáng kể.
2.3. Xử Lý Ảnh Và Loại Bỏ Mây
Mây là vấn đề lớn với ảnh vệ tinh vùng nhiệt đới. Nghiên cứu phát triển phương pháp loại bỏ mây đơn giản nhưng hiệu quả. Ảnh từ nhiều năm được kết hợp để tạo ảnh không mây. Google Earth Engine hỗ trợ xử lý quy mô lớn. Thuật toán chọn pixel tốt nhất từ nhiều ảnh khác nhau. Phương pháp này dễ triển khai và cho kết quả ổn định. Ảnh đầu ra có chất lượng cao phục vụ phân loại. Quy trình tự động giảm can thiệp thủ công.
III. Giám Sát Biến Động Đất Đai Qua Thời Gian
Chuỗi thời gian bản đồ LULC từ 2017-2022 cung cấp cái nhìn toàn diện về biến động đất đai. Phương pháp di chuyển dữ liệu tham chiếu giúp tạo bản đồ nhiều năm. Độ chính xác tổng thể vượt 94% cho tất cả các năm. Kết quả vượt ngưỡng chuẩn 89.2% cho bản đồ 14 loại. Giám sát biến động đất đai phát hiện xu hướng mất rừng đáng lo ngại. Tốc độ mất rừng có thể cao gấp 4 lần số liệu thống kê quốc gia. Bản đồ độ phân giải cao phát hiện những thay đổi nhỏ. GIS Việt Nam tích hợp dữ liệu để phân tích không gian. Thông tin này hỗ trợ quản lý tài nguyên rừng hiệu quả. Phát hiện sớm biến động giúp can thiệp kịp thời. Dữ liệu đáng tin cậy là cơ sở cho chính sách bảo vệ môi trường.
3.1. Lập Bản Đồ Che Phủ Rừng Hàng Năm
Dữ liệu PALSAR-2/ScanSAR đa thời gian được sử dụng cho lập bản đồ rừng. Bản đồ che phủ rừng hàng năm đạt độ chính xác 86.1%. Kết quả cao hơn đáng kể so với sản phẩm JAXA (77%). Thông tin theo mùa từ radar cải thiện độ tin cậy. Phương pháp này vượt trội so với dữ liệu đơn thời gian. Phân tích cho thấy diện tích rừng tăng giai đoạn 2015-2018. Xu hướng này phù hợp với số liệu thống kê chính phủ. Radar xuyên qua mây hiệu quả cho giám sát rừng nhiệt đới.
3.2. Phương Pháp Di Chuyển Dữ Liệu Tham Chiếu
Kỹ thuật di chuyển dữ liệu tạo bộ tham chiếu cho nhiều năm. Dữ liệu gốc năm 2020 được chuyển sang các năm khác. Phương pháp này tiết kiệm thời gian và chi phí đáng kể. Đánh giá sơ bộ cho thấy độ chính xác trên 94%. Kết quả vượt ngưỡng chuẩn cho bản đồ 14 loại. Quy trình kiểm chứng nghiêm ngặt đảm bảo chất lượng. Lấy mẫu ngẫu nhiên phân tầng tạo dữ liệu đại diện. Phương pháp này cho phép tạo chuỗi thời gian bản đồ hiệu quả.
3.3. Phát Hiện Xu Hướng Mất Rừng
Phân tích chuỗi thời gian phát hiện tốc độ mất rừng cao. Kết quả cho thấy mất rừng có thể cao gấp 4 lần số liệu chính thức. Bản đồ độ phân giải cao phát hiện mất rừng quy mô nhỏ. Số liệu thống kê quốc gia có thể bỏ sót nhiều khu vực. Giám sát biến động đất đai bằng viễn thám chính xác hơn. Thông tin này quan trọng cho chính sách bảo vệ rừng. Phát hiện sớm giúp ngăn chặn phá rừng kịp thời. Dữ liệu độc lập xác minh thông tin chính thức.
IV. Độ Chính Xác Và Số Lượng Loại Sử Dụng Đất
Nghiên cứu hệ thống về mối quan hệ giữa độ chính xác và số loại đất được thực hiện. Phân tích 64 bài báo về lập bản đồ LULC cho thấy tương quan âm. Tăng một loại đất làm giảm khoảng 0.77% độ chính xác tổng thể. Kết quả này có ý nghĩa quan trọng trong thiết kế bản đồ. Phân loại sử dụng đất cần cân bằng giữa chi tiết và độ chính xác. Quá nhiều loại đất làm giảm độ tin cậy bản đồ. Quá ít loại đất không cung cấp đủ thông tin chi tiết. Ngưỡng chuẩn độ chính xác phụ thuộc vào số loại đất. Đánh giá độ tin cậy bản đồ cần xem xét cả hai yếu tố. Nghiên cứu đề xuất phương pháp tính ngưỡng chuẩn. Công cụ này hỗ trợ thiết kế hệ thống phân loại hợp lý.
4.1. Tương Quan Âm Giữa Độ Chính Xác Và Số Loại
Phân tích 64 nghiên cứu quốc tế về bản đồ sử dụng đất. Tương quan âm rõ ràng giữa số loại và độ chính xác. Mỗi loại đất thêm vào làm giảm 0.77% độ chính xác. Mối quan hệ này có ý nghĩa thống kê cao. Kết quả phù hợp với lý thuyết phân loại. Nhiều loại đất tăng khả năng nhầm lẫn giữa các lớp. Phân loại sử dụng đất chi tiết đòi hỏi dữ liệu tốt hơn. Mô hình phức tạp hơn cần để phân biệt nhiều loại.
4.2. Ngưỡng Chuẩn Độ Chính Xác
Nghiên cứu đề xuất công thức tính ngưỡng chuẩn. Ngưỡng phụ thuộc vào số lượng loại sử dụng đất. Bản đồ 12 loại cần đạt khoảng 90% độ chính xác. Bản đồ 14 loại cần đạt khoảng 89% độ chính xác. Các bản đồ hiện có cho Việt Nam thường dưới ngưỡng. Bản đồ nghiên cứu này vượt ngưỡng chuẩn đáng kể. Công cụ này giúp đánh giá chất lượng bản đồ khách quan. Thiết kế hệ thống phân loại cần xem xét ngưỡng này.
4.3. So Sánh Với Bản Đồ Hiện Có
Bản đồ nghiên cứu vượt trội các sản phẩm 10m hiện có. Độ phân giải không gian 10m cao hơn nhiều bản đồ quốc gia. Độ chính xác 90.2% cao hơn đáng kể. Các bản đồ hiện có thường dưới ngưỡng chuẩn. Phương pháp mới cho kết quả ổn định qua các năm. Dữ liệu đa nguồn và machine learning tạo sự khác biệt. Bản đồ chuỗi thời gian cung cấp thông tin biến động. Sản phẩm này hữu ích hơn cho quản lý tài nguyên.
V. Ứng Dụng GIS Việt Nam Trong Quản Lý Đất Đai
Hệ thống GIS Việt Nam được ứng dụng toàn diện trong nghiên cứu. Công nghệ GIS tích hợp và phân tích dữ liệu không gian hiệu quả. Bản đồ sử dụng đất độ phân giải cao hỗ trợ quy hoạch chi tiết. Thông tin biến động đất đai giúp đánh giá tác động môi trường. Dữ liệu chính xác là nền tảng cho quản lý bền vững. Giám sát biến động đất đai phát hiện sớm vấn đề. Phân tích không gian xác định khu vực ưu tiên can thiệp. Cơ sở dữ liệu chuỗi thời gian hỗ trợ dự báo xu hướng. Công nghệ viễn thám và GIS giảm chi phí khảo sát thực địa. Thông tin cập nhật thường xuyên cải thiện ra quyết định. Ứng dụng này góp phần phát triển bền vững Việt Nam.
5.1. Hỗ Trợ Quy Hoạch Sử Dụng Đất
Bản đồ độ phân giải cao cung cấp thông tin chi tiết cho quy hoạch. Phân loại sử dụng đất 12 loại đáp ứng nhu cầu quản lý. Dữ liệu chính xác giúp tối ưu hóa sử dụng tài nguyên đất. GIS Việt Nam phân tích phù hợp đất cho các mục đích khác nhau. Thông tin biến động hỗ trợ đánh giá hiệu quả quy hoạch. Phát hiện sử dụng đất không phù hợp quy hoạch. Công cụ này giúp điều chỉnh kế hoạch kịp thời. Dữ liệu độc lập xác minh báo cáo địa phương.
5.2. Giám Sát Môi Trường Và Biến Đổi Khí Hậu
Bản đồ LULC hỗ trợ nghiên cứu biến đổi khí hậu. Thay đổi che phủ rừng ảnh hưởng đến khí hậu khu vực. Mở rộng đô thị tạo đảo nhiệt đô thị. Giám sát biến động đất đai đánh giá tác động môi trường. Dữ liệu chuỗi thời gian phát hiện xu hướng dài hạn. Thông tin này hỗ trợ chiến lược thích ứng khí hậu. Phân tích không gian xác định khu vực dễ bị tổn thương. Bản đồ chính xác cải thiện mô hình khí hậu.
5.3. Quản Lý Tài Nguyên Rừng Bền Vững
Giám sát rừng chính xác hỗ trợ bảo vệ tài nguyên. Phát hiện mất rừng sớm cho phép can thiệp kịp thời. Dữ liệu độc lập xác minh báo cáo quản lý rừng. Bản đồ che phủ rừng hàng năm theo dõi xu hướng. Thông tin chi tiết hỗ trợ REDD+ và các chương trình quốc tế. Phân tích không gian xác định nguyên nhân mất rừng. Công nghệ viễn thám giảm chi phí giám sát. Dữ liệu minh bạch tăng trách nhiệm quản lý.
VI. Tương Lai Phân Loại Sử Dụng Đất Tự Động
Machine learning phân loại đất mở ra nhiều cơ hội mới. Công nghệ AI tiếp tục phát triển nâng cao độ chính xác. Deep learning xử lý dữ liệu phức tạp hiệu quả hơn. Ảnh vệ tinh độ phân giải cao ngày càng phổ biến. Sentinel-2 và các vệ tinh mới cung cấp dữ liệu miễn phí. Google Earth Engine và các nền tảng cloud giảm rào cản kỹ thuật. Tự động hóa hoàn toàn quy trình lập bản đồ là mục tiêu. Cập nhật bản đồ thường xuyên hơn nhờ tự động hóa. Kết hợp nhiều nguồn dữ liệu tăng độ tin cậy. Công nghệ này sẽ hỗ trợ quản lý tài nguyên toàn cầu. Phát triển bền vững cần thông tin đất đai chính xác và kịp thời.
6.1. Phát Triển Công Nghệ Deep Learning
Mạng nơ-ron sâu tiếp tục cải thiện hiệu suất. Kiến trúc mới xử lý dữ liệu chuỗi thời gian tốt hơn. Transfer learning giảm nhu cầu dữ liệu huấn luyện. Mô hình tự học từ dữ liệu không nhãn. Kỹ thuật tăng cường dữ liệu cải thiện độ chính xác. Ensemble learning kết hợp nhiều mô hình tăng độ tin cậy. Công nghệ này làm giảm chi phí thu thập dữ liệu. Machine learning phân loại đất ngày càng chính xác.
6.2. Dữ Liệu Vệ Tinh Thế Hệ Mới
Vệ tinh mới cung cấp độ phân giải không gian cao hơn. Tần suất chụp ảnh tăng cho dữ liệu chuỗi thời gian tốt hơn. Landsat Next hứa hẹn cải thiện đáng kể. Sentinel-2 tiếp tục cung cấp dữ liệu miễn phí. Vệ tinh thương mại cung cấp ảnh độ phân giải cực cao. Kết hợp ảnh quang học và radar hiệu quả hơn. Dữ liệu mở giúp nghiên cứu phát triển nhanh. Ảnh vệ tinh độ phân giải cao ngày càng dễ tiếp cận.
6.3. Tự Động Hóa Và Cập Nhật Liên Tục
Mục tiêu là tự động hóa hoàn toàn quy trình lập bản đồ. Hệ thống tự động cập nhật bản đồ khi có ảnh mới. Google Earth Engine hỗ trợ xử lý dữ liệu quy mô lớn. Cloud computing giảm nhu cầu cơ sở hạ tầng. Quy trình tự động giảm thời gian từ tháng xuống ngày. Cập nhật thường xuyên cung cấp thông tin kịp thời. Giám sát biến động đất đai gần như thời gian thực. Công nghệ này cách mạng hóa quản lý tài nguyên.
Tải xuống file đầy đủ để xem toàn bộ nội dung
Tải đầy đủ (132 trang)Nội dung chính
Tổng quan về luận án
Luận án này tiên phong trong lĩnh vực bản đồ sử dụng đất và lớp phủ đất (LULC) bằng cách giải quyết một trong những thách thức cốt lõi của viễn thám hiện đại: việc sản xuất chuỗi thời gian bản đồ LULC độ phân giải cao và độ chính xác cao trên quy mô lớn. Trong bối cảnh khoa học toàn cầu đang tìm kiếm các giải pháp giám sát môi trường chi tiết và kịp thời, đặc biệt cho các quá trình biến đổi khí hậu, mở rộng đô thị, hiệu ứng đảo nhiệt đô thị và thiên tai liên quan đến trầm tích, nghiên cứu này mang tính đột phá. LULC là thông tin thiết yếu do tác động lớn của các thay đổi LULC đến hệ sinh thái trên cạn và khí quyển của Trái đất.
Research gap cụ thể mà luận án này giải quyết là "the production of a time series of high-resolution and high-accuracy LULC maps in a large scale remains challenging due to lack of high temporal and high spatial resolution satellite data, lack of training data, and time consuming" (Truong Thinh Van, Abstract). Các sản phẩm LULC toàn cầu hiện có, dù đã cải thiện về độ phân giải không gian (đạt 10m), vẫn gặp hạn chế về độ phân giải thời gian và hệ thống phân loại thô, không phản ánh được sự phức tạp của LULC ở cấp quốc gia. Đặc biệt, "there is a lack of 10-m LULC maps for Vietnam during 2017-2022" (Truong Thinh Van, Section 1.3), một khoảng trống dữ liệu quan trọng mà luận án này đã lấp đầy. Hơn nữa, những sản phẩm toàn cầu thường thiếu kiến thức và chuyên môn địa phương khi giải thích dữ liệu tham chiếu, dẫn đến độ chính xác không chắc chắn ở quy mô quốc gia và địa phương.
Luận án được định hướng bởi các câu hỏi nghiên cứu và giả thuyết sau:
- Mối quan hệ giữa độ chính xác tổng thể của bản đồ LULC và số lượng danh mục phân loại là gì?
- Tiềm năng của dữ liệu Synthetic Aperture Radar (SAR) đa thời gian để cải thiện bản đồ LULC toàn cầu ở quy mô quốc gia, đặc biệt tập trung vào bản đồ rừng/phi rừng, như thế nào?
- Làm thế nào để tạo ra chuỗi thời gian bản đồ LULC độ phân giải cao bằng cách sử dụng phương pháp học sâu tiên tiến và kỹ thuật di chuyển dữ liệu (data migration technique)?
- Sự thay đổi LULC ở Việt Nam từ 2017-2022 diễn biến ra sao dựa trên các bản đồ LULC độ phân giải cao đã được tạo ra?
Khung lý thuyết của nghiên cứu tích hợp sâu rộng các nguyên lý từ nhiều lĩnh vực. Nó dựa trên Lý thuyết Học máy (Machine Learning Theory), đặc biệt là các mô hình học sâu như Convolutional Neural Networks (CNNs). Các kỹ thuật phân loại tiên tiến cũng được áp dụng dựa trên Lý thuyết xác suất Bayesian (Bayesian Inference) kết hợp với Ước tính mật độ hạt nhân (Kernel Density Estimation - KDE) như đề xuất bởi Hashimoto et al. (2013). Hơn nữa, các nguyên tắc của Viễn thám (Remote Sensing Principles) được khai thác triệt để, bao gồm đặc tính tán xạ radar (radar backscatter characteristics) từ dữ liệu SAR và các chỉ số thực vật (vegetation indices) từ dữ liệu quang học, để tăng cường khả năng phân biệt giữa các lớp phủ đất phức tạp.
Nghiên cứu mang lại những đóng góp đột phá với tác động định lượng rõ ràng. Thứ nhất, nó định lượng được mối quan hệ giữa độ chính xác bản đồ LULC và số lượng danh mục, chỉ ra rằng "increasing the number of LULC categories by one could result in about 0.77% decrease in overall accuracy" (Truong Thinh Van, Chapter 2 Abstract), một đóng góp cơ bản cho việc thiết kế hệ thống phân loại. Thứ hai, nghiên cứu đã phát triển và xác thực một phương pháp lập bản đồ rừng hàng năm sử dụng dữ liệu PALSAR-2/ScanSAR đa thời gian, đạt độ chính xác tổng thể 86.1%, cao hơn đáng kể so với các sản phẩm quốc tế hiện có của JAXA (77.2%) và ESA (85.3%) (Truong Thinh Van, Chapter 3 Abstract). Thứ ba, luận án giới thiệu chuỗi thời gian bản đồ LULC 10m, 14 danh mục đầu tiên cho toàn bộ lục địa Việt Nam giai đoạn 2017-2022. Các bản đồ này đã đạt độ chính xác tổng thể trên 94% (Truong Thinh Van, Chapter 5 Abstract) qua đánh giá sơ bộ, vượt xa giá trị chuẩn 89.2% cho 14 danh mục, thiết lập một tiêu chuẩn mới về độ chính xác ở quy mô quốc gia.
Phạm vi của luận án tập trung vào toàn bộ lục địa Việt Nam, bao gồm một tập dữ liệu huấn luyện lớn với "123,051 points" cho 7 danh mục LULC, trong đó "37% of which corresponded to the forest category" (Truong Thinh Van, Section 3.4). Các bản đồ LULC đã được tạo ra cho giai đoạn 2017-2022, cùng với bản đồ rừng cho 2015-2018. Độ chính xác được đánh giá nghiêm ngặt bằng "500 validation sample points" cho quy mô quốc gia, được thu thập bằng phương pháp lấy mẫu ngẫu nhiên phân tầng (Truong Thinh Van, Section 3.4). Tầm quan trọng của nghiên cứu nằm ở việc cung cấp dữ liệu LULC độ phân giải cao, độ chính xác cao và kịp thời, điều này "is expected to support the diverse applications such as LULC change analysis, disaster related studies, biodiversity conservation, planning, food security, carbon emission and climate modelling, solar energy planning" (Truong Thinh Van, Abstract), đóng vai trò then chốt trong việc hỗ trợ các nhà hoạch định chính sách và quản lý tài nguyên của Việt Nam trong việc đạt được các Mục tiêu Phát triển Bền vững (SDGs).
Literature Review và Positioning
Đánh giá văn học toàn diện cho thấy sự phát triển nhanh chóng của các sản phẩm bản đồ LULC toàn cầu. Ban đầu, các sản phẩm như MODIS Land Cover Type Product (MCD12Q1) của Running et al. (2000) và GlobCover Land Cover Maps (GlobCover) cung cấp độ phân giải không gian thô (1km hoặc 300m). Tuy nhiên, tiến bộ trong công nghệ cảm biến vệ tinh, đặc biệt từ các nền tảng như Sentinel-2 và Sentinel-1, đã dẫn đến sự ra đời của các sản phẩm độ phân giải cao 10m gần đây như Dynamic World, ESA World Cover và ESRI Land Cover (Truong Thinh Van, Table 1.1). Song song với sự cải thiện về dữ liệu, các thuật toán phân loại cũng đã phát triển từ các phương pháp học máy truyền thống như Decision Tree (DT), Random Forest (RF) và Support Vector Machine (SVM) (Ma et al., 2017 [65]) đến các phương pháp học sâu (Deep Learning) như Convolutional Neural Networks (CNN), chứng minh hiệu suất vượt trội về độ chính xác trong nhiều nghiên cứu (Chen et al., 2021 [66]; Ghorbanian et al., 2021 [67]). Đối với Việt Nam, các nghiên cứu LULC chủ yếu tập trung vào quy mô cấp tỉnh và khu vực (Le et al., 2011 [36]; Pham et al., 2016 [44]), với một số ít công trình ở quy mô quốc gia như bản đồ LULC độ phân giải cao của JAXA (Tadono et al., 2014 [31], 2015 [32]).
Trong lĩnh vực LULC, tồn tại một số mâu thuẫn và tranh luận đáng chú ý. Một trong số đó là sự đánh đổi cố hữu giữa độ phân giải thời gian và độ phân giải không gian của dữ liệu vệ tinh, tạo ra "a trade-off between temporal resolution and spatial resolution of satellite images" (Truong Thinh Van, Section 1.1). Điều này gây khó khăn trong việc tạo chuỗi thời gian bản đồ LULC độ phân giải cao do thiếu dữ liệu liên tục. Một tranh luận khác liên quan đến đóng góp thực sự của học sâu. Mặc dù "the evolution of deep learning algorithms has made substantial strides," nhưng "the extent to which deep learning has contributed to enhancing the accuracy of global LULC mapping appears to be somewhat below initial expectations" so với các sản phẩm độ phân giải thô trước đây (Truong Thinh Van, Section 1.2), cho thấy vẫn còn nhiều tiềm năng chưa được khai thác.
Luận án này được định vị chiến lược để giải quyết những thách thức và lấp đầy các khoảng trống quan trọng trong tài liệu nghiên cứu. Cụ thể, nó giải quyết "a lack of 10-m LULC maps for Vietnam during 2017-2022" (Truong Thinh Van, Section 1.3), một giai đoạn cần thiết để đánh giá các Mục tiêu Phát triển Bền vững và Chiến lược Biến đổi Khí hậu của Việt Nam. Nghiên cứu này không chỉ tạo ra dữ liệu LULC độ phân giải cao cho giai đoạn này mà còn cung cấp một phương pháp luận mạnh mẽ để vượt qua những hạn chế về dữ liệu và thuật toán, đặc biệt là trong các khu vực nhiệt đới thường xuyên có mây. Nó còn đẩy mạnh lĩnh vực này bằng cách định lượng tác động của số lượng danh mục đối với độ chính xác bản đồ LULC (Truong Thinh Van, Chapter 2) và phát triển các kỹ thuật tiên tiến để tận dụng dữ liệu đa thời gian và học sâu cho các mục đích phân loại.
So sánh với các nghiên cứu quốc tế, luận án này cho thấy sự vượt trội đáng kể. Thứ nhất, so với bản đồ JAXA 25m Global FNF (Tadono et al., 2014 [127]), bản đồ rừng của nghiên cứu đạt độ chính xác tổng thể 86.1%, cao hơn đáng kể so với 77.2% của JAXA (Truong Thinh Van, Figure 3.6). Sự khác biệt này là do việc sử dụng dữ liệu PALSAR-2/ScanSAR đa thời gian chứa thông tin theo mùa, vốn đáng tin cậy hơn so với dữ liệu mosaic đơn thời gian của JAXA (Truong Thinh Van, Chapter 3 Abstract). Thứ hai, so với bản đồ ESA 100m Copernicus Global Land Cover (Buchhorn et al., 2020 [143]), bản đồ rừng của nghiên cứu đạt 86.1% độ chính xác tổng thể, hơi cao hơn 85.3% của ESA (Truong Thinh Van, Figure 3.6). Điều này khẳng định tính cạnh tranh của phương pháp luận, đồng thời bản đồ của luận án cung cấp độ phân giải không gian cao hơn (10m so với 100m) và chi tiết danh mục phong phú hơn (14 danh mục so với 11 của ESA World Cover và 22 của ESA-CCI) (Truong Thinh Van, Table 1.1). Các bản đồ LULC 10m của luận án với độ chính xác 90.2% (12 danh mục) và >94% (14 danh mục) vượt trội so với các sản phẩm toàn cầu như Dynamic World, ESA World Cover, và ESRI Land Cover, vốn thường có độ chính xác dưới 85% cho các danh mục chi tiết.
Đóng góp lý thuyết và khung phân tích
Đóng góp cho lý thuyết
Luận án này đóng góp quan trọng vào các lý thuyết hiện có trong viễn thám và địa tin học bằng cách mở rộng và thách thức các giả định cụ thể. Thứ nhất, nghiên cứu mở rộng Lý thuyết đánh giá độ chính xác (Accuracy Assessment Theory) bằng cách định lượng một mối quan hệ cơ bản nhưng thường bị bỏ qua: sự phụ thuộc của độ chính xác tổng thể bản đồ LULC vào số lượng danh mục phân loại. Thông qua phân tích tổng hợp 64 nghiên cứu, đã phát hiện ra một "weak negative correlation" và chỉ ra rằng việc "increasing the number of LULC categories by one could result in about 0.77% decrease in overall accuracy" (Truong Thinh Van, Chapter 2 Abstract). Kết quả này, với R² bằng 0.08 cho tất cả các nghiên cứu, cung cấp một định lượng cụ thể để hướng dẫn các nhà lập bản đồ LULC, bổ sung cho các công trình trước đây của Ma et al. (2017) [65] và Gessner et al. (2015) [85] vốn chỉ đưa ra các quan sát mang tính định tính hoặc cho các trường hợp cụ thể.
Thứ hai, luận án mở rộng Lý thuyết học sâu trong phân loại viễn thám (Deep Learning Theory in Remote Sensing Classification). Bằng cách sửa đổi một cách có hệ thống phương pháp CNN mới lạ được đề xuất bởi Hirayama et al. (2022), nghiên cứu đã sử dụng dữ liệu vệ tinh với 6 mùa thay vì 4 mùa trong phương pháp gốc (Truong Thinh Van, Chapter 4 Abstract). Điều này cho phép mô hình CNN khai thác hiệu quả hơn thông tin theo mùa phong phú từ chuỗi thời gian dữ liệu, vốn là một thách thức đối với các kiến trúc CNN truyền thống thường được thiết kế để xử lý ảnh đơn thời gian hoặc bị mất thông tin do các kỹ thuật down-sampling như max-pooling. Việc tích hợp thành công thông tin đa thời gian vào khung học sâu nâng cao hiểu biết về tiềm năng và khả năng thích ứng của CNN cho các tác vụ phân loại LULC phức tạp.
Khung khái niệm của luận án được xây dựng dựa trên ba trụ cột chính, tương tác để khắc phục các thách thức hiện có. (1) Thu thập và tiền xử lý dữ liệu đa nguồn và đa thời gian: Điều này liên quan đến việc tổng hợp dữ liệu quang học (Sentinel-2, MODIS NDVI), SAR (PALSAR-2/ScanSAR) và dữ liệu địa hình (SRTM-DEM) để vượt qua các hạn chế về độ phân giải và ảnh hưởng của mây, đặc biệt ở các vùng nhiệt đới. (2) Phương pháp phân loại nâng cao: Áp dụng sự kết hợp của Kernel Density Estimation và Bayesian Inference (Hashimoto et al., 2013 [131]) cùng với một phiên bản cải tiến của Time-Feature CNN. (3) Đánh giá và hiệu chuẩn độ chính xác nghiêm ngặt: Sử dụng phương pháp lấy mẫu ngẫu nhiên phân tầng và ước tính không thiên vị của Olofsson et al. (2013) [137], được sửa đổi để phù hợp với việc đánh giá chuỗi thời gian và nhiều bản đồ. Mối quan hệ giữa các thành phần này là tuần tự và lặp lại, nơi kết quả và phản hồi từ đánh giá độ chính xác liên tục thông báo cho việc tinh chỉnh các phương pháp và lựa chọn dữ liệu, tạo nên một chu trình cải tiến liên tục.
Mô hình lý thuyết của luận án được thể hiện qua các mệnh đề/giả thuyết sau:
- Mệnh đề 1: Việc tăng số lượng danh mục phân loại trong bản đồ LULC sẽ dẫn đến sự giảm sút có thể định lượng được về độ chính xác tổng thể, một sự đánh đổi cần được cân nhắc trong thiết kế bản đồ.
- Mệnh đề 2: Dữ liệu SAR đa thời gian (ví dụ: PALSAR-2/ScanSAR), khi được tích hợp một cách tối ưu với dữ liệu quang học (MODIS NDVI) và địa hình (SRTM-DEM), sẽ cung cấp độ chính xác cao hơn đáng kể cho bản đồ rừng so với các phương pháp dựa trên dữ liệu đơn thời gian hoặc một loại cảm biến.
- Mệnh đề 3: Các mô hình học sâu tiên tiến, đặc biệt là Time-Feature CNN được điều chỉnh để khai thác hiệu quả thông tin theo mùa từ chuỗi thời gian dữ liệu, có thể đạt được độ chính xác vượt trội trong việc tạo bản đồ LULC độ phân giải cao so với các phương pháp học máy truyền thống hoặc các sản phẩm LULC toàn cầu hiện có.
- Mệnh đề 4: Việc sử dụng một kỹ thuật di chuyển dữ liệu tham chiếu (reference data migration) sáng tạo có thể tạo điều kiện thuận lợi cho việc sản xuất hiệu quả chuỗi thời gian bản đồ LULC độ phân giải cao với độ chính xác cao, giảm đáng kể gánh nặng thu thập dữ liệu tham chiếu mới cho mỗi năm.
Luận án này không tuyên bố một sự thay đổi mô hình (paradigm shift) hoàn toàn, nhưng nó đại diện cho một bước tiến quan trọng trong việc tăng cường sự nghiêm ngặt, độ tin cậy và hiệu quả của bản đồ LULC ở quy mô quốc gia, đặc biệt trong các khu vực nhiệt đới đầy thách thức. Việc kết hợp dữ liệu đa nguồn (SAR, quang học, địa hình) một cách có hệ thống, cùng với các kỹ thuật học sâu tiên tiến và phương pháp đánh giá độ chính xác chi tiết, thiết lập một tiêu chuẩn mới cho việc sản xuất dữ liệu LULC. Bằng chứng là việc đạt được độ chính xác tổng thể "greater than 94% for all maps from 2017 to 2022" (Truong Thinh Van, Chapter 5 Abstract) cho 14 danh mục, vượt trội so với các sản phẩm toàn cầu và quốc gia hiện có. Điều này thay đổi cách tiếp cận truyền thống vốn phải đối mặt với sự đánh đổi giữa độ phân giải, độ chính xác và tính thời gian, cho thấy một con đường hướng tới các sản phẩm LULC chất lượng cao hơn.
Khung phân tích độc đáo
Khung phân tích độc đáo của luận án là sự tích hợp thông minh các lý thuyết và phương pháp từ nhiều lĩnh vực, vượt qua các hạn chế của từng cách tiếp cận riêng lẻ. Nó kết hợp thành công:
- Lý thuyết Bayes (Bayesian Theory): để ước tính xác suất hậu nghiệm của các danh mục LULC. Theo Hashimoto et al. (2013) [131], điều này cho phép tích hợp linh hoạt thông tin từ nhiều ảnh đa thời gian hoặc đa cảm biến, là một thành phần quan trọng trong việc tổng hợp dữ liệu SAR, quang học và địa hình.
- Lý thuyết ước tính mật độ hạt nhân (Kernel Density Estimation - KDE): được sử dụng để mô phỏng các hàm mật độ xác suất của dữ liệu huấn luyện. Phương pháp này cung cấp độ chính xác cao cho phân loại LULC, đặc biệt khi kết hợp với quy tắc Bayes (Hashimoto et al., 2013 [131]).
- Lý thuyết mạng nơ-ron tích chập (Convolutional Neural Network - CNN): đã được điều chỉnh và nâng cao (dựa trên Hirayama et al., 2022) để tạo thành một Time-Feature CNN. Cách tiếp cận này đặc biệt hiệu quả trong việc khai thác thông tin theo mùa và các đặc trưng thời gian từ chuỗi dữ liệu vệ tinh, từ đó cải thiện đáng kể khả năng phân loại LULC độ phân giải cao (Truong Thinh Van, Chapter 4 Abstract).
Cách tiếp cận phân tích mới lạ nằm ở sự tổng hợp của phương pháp phân loại mạnh mẽ dựa trên KDE và Bayesian với các mô hình học sâu Time-Feature CNN đã được điều chỉnh, kết hợp với một quy trình xử lý dữ liệu đa nguồn (PALSAR-2/ScanSAR, MODIS NDVI, Sentinel-2, SRTM-DEM) và một kỹ thuật di chuyển dữ liệu tham chiếu (reference data migration method) để tạo chuỗi thời gian. Sự biện minh cho cách tiếp cận này xuất phát từ nhu cầu cấp thiết về bản đồ LULC độ phân giải cao và độ chính xác cao liên tục theo thời gian, đặc biệt là trong các khu vực nhiệt đới thường xuyên có mây, nơi dữ liệu quang học bị hạn chế. Việc tích hợp này cho phép khắc phục các hạn chế cố hữu của từng phương pháp riêng lẻ: khả năng xuyên mây của SAR bổ sung cho dữ liệu quang học bị che khuất, và học sâu xử lý hiệu quả lượng dữ liệu lớn và phức tạp.
Các đóng góp khái niệm của nghiên cứu bao gồm:
- Bản đồ LULC độ phân giải cao 10m với 14 danh mục: Đây là một hệ thống phân loại chi tiết và toàn diện, bao gồm một danh mục mới "solar panel" (Truong Thinh Van, Chapter 5 Abstract), phản ánh những thay đổi LULC hiện đại và nhu cầu giám sát năng lượng tái tạo.
- Kỹ thuật tạo ảnh quang học không mây đa năm: Nghiên cứu đã đề xuất một "simple and practical approach for making a time series of cloud-free satellite image using multi-temporal data from different years" (Truong Thinh Van, Chapter 4 Abstract), có khả năng triển khai dễ dàng trên Google Earth Engine, giải quyết một thách thức lớn trong việc sử dụng dữ liệu quang học ở vùng nhiệt đới.
- Phương pháp di chuyển dữ liệu tham chiếu: Kỹ thuật này đã được áp dụng để "transfer the reference data from 2020 to other years from 2017 to 2022" (Truong Thinh Van, Chapter 5 Abstract), giảm đáng kể công sức và thời gian thu thập dữ liệu huấn luyện mới cho chuỗi thời gian bản đồ LULC, là một bước tiến về hiệu quả.
Các điều kiện ranh giới của nghiên cứu được tuyên bố rõ ràng để định vị phạm vi ứng dụng và giới hạn của các kết quả. Các nguồn dữ liệu SAR chủ yếu là PALSAR-2/ScanSAR, giới hạn về độ phân giải và đặc điểm tín hiệu. Phạm vi địa lý của nghiên cứu được giới hạn ở lục địa Việt Nam. Khung thời gian cụ thể cho chuỗi bản đồ LULC là 2017-2022 và bản đồ rừng là 2015-2018. Hơn nữa, độ chính xác của bản đồ có thể bị ảnh hưởng bởi "interpreter errors" do "lack of ground truth data" trong một số trường hợp, một giới hạn được ghi nhận trong Chapter 3, Section 3.4.
Phương pháp nghiên cứu tiên tiến
Thiết kế nghiên cứu
Triết lý nghiên cứu của luận án tuân thủ chặt chẽ nguyên tắc Thực chứng hậu nghiệm (Post-Positivism). Nó thể hiện cam kết mạnh mẽ trong việc định lượng và đo lường khách quan các hiện tượng LULC, đồng thời nhận thức được sự phức tạp và các giới hạn tiềm ẩn trong quá trình đo lường. Nghiên cứu sử dụng các phương pháp thống kê và thuật toán nghiêm ngặt để xác định mối quan hệ (ví dụ: giữa độ chính xác và số lượng danh mục), đánh giá kết quả (độ chính xác tổng thể, độ lệch chuẩn), và tạo ra các bản đồ có thể kiểm chứng. Mục tiêu là xây dựng kiến thức khách quan và có khả năng khái quát hóa về LULC của Việt Nam, đồng thời thừa nhận rằng các phép đo không bao giờ hoàn hảo và có thể có sai số.
Mặc dù không phải là một nghiên cứu phương pháp hỗn hợp theo định nghĩa truyền thống, luận án này áp dụng một sự kết hợp mạnh mẽ các phương pháp định lượng để đạt được các mục tiêu nghiên cứu toàn diện. Cụ thể, nó kết hợp:
- Phân tích tổng hợp tài liệu và phân tích thống kê: Trong Chapter 2, một đánh giá có hệ thống 64 bài báo về LULC đã được thực hiện, sau đó là phân tích thống kê (ANOVA, hồi quy tuyến tính, R² = 0.08) để định lượng mối quan hệ giữa độ chính xác và số lượng danh mục phân loại.
- Phân loại học máy và học sâu: Sử dụng sự kết hợp giữa Kernel Density Estimation (KDE) và Bayesian Inference (Hashimoto et al., 2013 [131]) trong phần mềm SACLASS, cùng với việc phát triển một Time-Feature Convolutional Neural Network (CNN) dựa trên Hirayama et al. (2022) cho các Chapter 3, 4, và 5. Sự kết hợp này được biện minh bởi nhu cầu về một cách tiếp cận đa diện: tổng hợp tài liệu cung cấp cơ sở lý thuyết và định lượng một nguyên tắc cơ bản; học máy và học sâu cung cấp khả năng xử lý hiệu quả lượng lớn và phức tạp của dữ liệu vệ tinh; và các kỹ thuật thống kê đảm bảo tính nghiêm ngặt và độ tin cậy của việc đánh giá kết quả.
Thiết kế nghiên cứu không theo dạng đa cấp phân tích dữ liệu điển hình, nhưng nó tiếp cận vấn đề LULC ở nhiều cấp độ không gian và phân loại để xây dựng một bức tranh toàn diện:
- Cấp độ tổng quát/meta-phân tích (Chapter 2): Phân tích 64 nghiên cứu LULC trên toàn cầu để rút ra mối quan hệ tổng quát về độ chính xác và số lượng danh mục, tạo tiền đề lý thuyết.
- Cấp độ khu vực/thử nghiệm (Chapter 3): Đánh giá các phương pháp phân loại rừng tại ba địa điểm thử nghiệm cụ thể ở Bắc, Trung và Nam Việt Nam, cho phép tinh chỉnh phương pháp trước khi áp dụng rộng rãi.
- Cấp độ quốc gia (Chapter 3, 4, 5): Áp dụng các phương pháp đã phát triển để tạo bản đồ LULC cho toàn bộ lục địa Việt Nam, đảm bảo tính khái quát và ứng dụng thực tiễn.
- Cấp độ danh mục LULC: Từ phân loại đơn giản rừng/phi rừng (2 danh mục) đến hệ thống phân loại chi tiết 12 và sau đó là 14 danh mục, bao gồm "solar panel" (Truong Thinh Van, Chapter 4 Abstract, Chapter 5 Abstract), cho phép phân tích LULC với mức độ chi tiết khác nhau.
Kích thước mẫu và tiêu chí lựa chọn được xác định chính xác và cụ thể trong từng chương:
- Chapter 2 (Literature Review): Phân tích 64 bài báo về LULC được chọn lọc kỹ lưỡng từ 163 ấn phẩm ban đầu sau quá trình sàng lọc theo các tiêu chí loại trừ nghiêm ngặt (Truong Thinh Van, Section 2.1).
- Chapter 3 (Annual Forest Cover Maps): Tổng cộng "123,051 points" dữ liệu huấn luyện đã được tạo cho bảy danh mục LULC, trong đó "37% of which corresponded to the forest category" (Truong Thinh Van, Section 3.4). Để đánh giá độ chính xác, "500 validation sample points" được sử dụng cho bản đồ quốc gia, với "250 points to each stratum (forest and non-forest)" (Truong Thinh Van, Figure 3.3b & Section 3.4), đảm bảo độ lệch chuẩn mong muốn là ±1.5%. Đối với ba địa điểm thử nghiệm, "400 validation sample points" đã được sử dụng (Truong Thinh Van, Section 3.4).
- Chapter 4 & 5 (High-Resolution LULC Maps): Sử dụng tập dữ liệu huấn luyện tương tự như Chapter 3, và "rigorous validation dataset by stratified random sampling method" (Truong Thinh Van, Chapter 4 Abstract) đã được áp dụng. Quy trình di chuyển dữ liệu tham chiếu đã chuyển dữ liệu từ 2020 sang các năm 2017-2022, đảm bảo tính nhất quán và hiệu quả.
Quy trình nghiên cứu rigorous
Chiến lược lấy mẫu trong nghiên cứu này rất nghiêm ngặt và có tiêu chí cụ thể:
- Dữ liệu huấn luyện: Được tạo thông qua "visual interpretation of high-resolution Google Earth images, Landsat 8 images, and Sentinel 2 images" (Truong Thinh Van, Section 3.4). Tiêu chí lựa chọn là các điểm dữ liệu phải nằm trong "homogeneous land cover areas and avoided the borders of land cover types," và khu vực phải "relatively stable from 2015 to 2018" (Truong Thinh Van, Section 3.4). Điều này đảm bảo chất lượng và tính đại diện của dữ liệu huấn luyện.
- Dữ liệu kiểm định: Sử dụng "stratified random sampling method" (Truong Thinh Van, Section 3.4). Đối với bản đồ FNF quốc gia, 500 điểm được phân bổ cân bằng (250 điểm cho rừng và 250 điểm cho phi rừng) từ bản đồ FNF 2017 làm phân tầng. Đối với bản đồ FNF tại các địa điểm thử nghiệm, 400 điểm được sử dụng với 200 điểm cho mỗi phân tầng.
- Tiêu chí loại trừ: Các điểm dữ liệu không đồng nhất hoặc gần ranh giới các lớp LULC đã được loại trừ khỏi dữ liệu huấn luyện. Các pixel bị che khuất bởi mây hoặc bóng tối trong ảnh SAR cũng được gán giá trị NULL và loại trừ khỏi phân tích để tránh sai lệch (Truong Thinh Van, Section 3.2).
Giao thức thu thập dữ liệu và công cụ được mô tả rõ ràng:
- Dữ liệu vệ tinh: PALSAR-2/ScanSAR từ JAXA (HH và HV polarization) cho dữ liệu SAR; MODIS NDVI từ Google Earth Engine cho chỉ số thực vật; SRTM-DEM từ USGS EarthExplorer cho dữ liệu địa hình. Sentinel-2 từ Google Earth Engine và Landsat 8 được sử dụng để tạo ảnh quang học không mây và dữ liệu tham chiếu (Truong Thinh Van, Sections 3.2, 4.2).
- Tiền xử lý SAR: Các Digital Number (DN) được chuyển đổi sang giá trị gamma-naught (γ0) bằng Equation 3.1. Các pixel bị che khuất hoặc có bóng tối được gán giá trị NULL. Nhiễu speckle được giảm thiểu bằng Lee filter trên phần mềm SNAP 5.0 (Truong Thinh Van, Section 3.2).
- Tiền xử lý quang học/DEM: Ảnh MODIS NDVI và SRTM-DEM được chuyển đổi hệ tọa độ và thay đổi kích thước xuống 50m. Bản đồ độ dốc (slope map) được ước tính từ SRTM-DEM bằng cách sử dụng GRASS GIS và GDAL library (Truong Thinh Van, Section 3.2).
- Tạo chuỗi ảnh không mây: Một "simple and practical approach for making a time series of cloud-free satellite image using multi-temporal data from different years" (Truong Thinh Van, Chapter 4 Abstract) đã được phát triển và triển khai trong Google Earth Engine.
Nghiên cứu áp dụng đa tam giác dữ liệu và phương pháp để tăng cường tính hợp lệ và độ tin cậy:
- Đa tam giác dữ liệu: Kết hợp dữ liệu SAR (PALSAR-2/ScanSAR), quang học (MODIS NDVI, Sentinel-2, Landsat 8) và địa hình (SRTM-DEM) để cung cấp thông tin toàn diện, khắc phục hạn chế của từng loại dữ liệu riêng lẻ (ví dụ: SAR xuyên mây, quang học chi tiết phổ).
- Đa tam giác phương pháp: Sử dụng nhiều thuật toán phân loại (Kernel Density Estimation, Bayesian Inference, Time-Feature CNN) và so sánh kết quả để xác định phương pháp tối ưu. Đồng thời sử dụng các phương pháp đánh giá độ chính xác khác nhau (Overall Accuracy, User's Accuracy, Producer's Accuracy) để có cái nhìn đa chiều về chất lượng bản đồ.
Tính hợp lệ (Validity) và độ tin cậy (Reliability) được đảm bảo thông qua các biện pháp sau:
- Tính hợp lệ (Validity):
- Tính hợp lệ cấu trúc (Construct Validity): Định nghĩa các danh mục LULC dựa trên "Land Cover Classification System of the Food Agriculture Organization [136]" (Truong Thinh Van, Section 3.4), đảm bảo các khái niệm được đo lường phù hợp với các tiêu chuẩn quốc tế.
- Tính hợp lệ nội bộ (Internal Validity): Được đảm bảo thông qua quy trình tiền xử lý dữ liệu nghiêm ngặt, phương pháp lấy mẫu ngẫu nhiên phân tầng và phương pháp đánh giá độ chính xác không thiên vị (Olofsson et al. [137]), giảm thiểu các yếu tố gây nhiễu.
- Tính hợp lệ bên ngoài (External Validity): Khả năng khái quát hóa được hỗ trợ bằng cách áp dụng phương pháp luận cho toàn bộ lục địa Việt Nam và so sánh với các sản phẩm LULC toàn cầu.
- Độ tin cậy (Reliability): Độ tin cậy được thể hiện qua các giá trị độ chính xác tổng thể cao và nhất quán qua các năm (>94% cho chuỗi thời gian 2017-2022) và các địa điểm thử nghiệm (86.1% cho bản đồ rừng). Các "standard errors" được báo cáo cho các ước tính diện tích rừng và độ chính xác tổng thể (ví dụ: Table 3.5) cung cấp thước đo về độ tin cậy thống kê.
Data và phân tích
Đặc điểm mẫu và thống kê trong nghiên cứu này cung cấp cái nhìn sâu sắc về phạm vi và chất lượng dữ liệu:
- Dữ liệu huấn luyện: "123,051 points" được thu thập cho 7 danh mục LULC ban đầu, trong đó "37% of which corresponded to the forest category" (Truong Thinh Van, Section 3.4). Các điểm này được phân bố trên toàn lục địa Việt Nam.
- Đặc điểm mẫu bản đồ LULC: Các bản đồ LULC được tạo ra có độ phân giải 10m với 12 và sau đó là 14 danh mục, bao gồm một danh mục mới đặc biệt là "solar panel" để phản ánh sự phát triển hiện tại của Việt Nam (Truong Thinh Van, Chapter 4 Abstract, Chapter 5 Abstract).
- Dữ liệu kiểm định: 500 điểm kiểm định được phân bổ ngẫu nhiên phân tầng (250 điểm cho rừng và 250 điểm cho phi rừng) cho đánh giá độ chính xác ở quy mô quốc gia.
Các kỹ thuật phân tích tiên tiến và phần mềm chuyên dụng được sử dụng để xử lý và phân tích dữ liệu phức tạp:
- Phân loại LULC: Sử dụng kỹ thuật Kernel Density Estimation (KDE) kết hợp với Bayesian Inference (Hashimoto et al., 2013 [131]) được triển khai trong phần mềm SACLASS (Truong Thinh Van, Section 3.3). Đối với bản đồ LULC 10m, một Time-Feature Convolutional Neural Network (CNN) tiên tiến đã được phát triển dựa trên phương pháp của Hirayama et al. (2022) để tận dụng thông tin theo mùa (Truong Thinh Van, Chapter 4 Abstract).
- Đánh giá độ chính xác và ước tính diện tích: Áp dụng một phương pháp ước tính không thiên vị dựa trên lấy mẫu ngẫu nhiên phân tầng, được sửa đổi từ Olofsson et al. (2013) [137], cho phép ước tính độ chính xác và diện tích rừng cùng với "standard errors" đi kèm (Truong Thinh Van, Section 3.5).
- Xử lý dữ liệu vệ tinh: Phần mềm SNAP 5.0 được sử dụng cho các tác vụ tiền xử lý ảnh SAR. GRASS GIS và GDAL library được sử dụng để xử lý ảnh MODIS NDVI và SRTM-DEM (Truong Thinh Van, Section 3.2). Google Earth Engine được sử dụng như một nền tảng điện toán đám mây để tạo chuỗi ảnh quang học không mây (Truong Thinh Van, Chapter 4 Abstract).
Các kiểm tra độ mạnh mẽ (robustness checks) đã được thực hiện để xác nhận tính tin cậy của các phát hiện:
- So sánh phương pháp: Trong Chapter 3, độ mạnh mẽ của phương pháp đã được kiểm tra bằng cách so sánh hiệu quả của dữ liệu PALSAR-2/ScanSAR đa thời gian với dữ liệu PALSAR-2 đơn thời gian tại ba địa điểm thử nghiệm ở Việt Nam (Truong Thinh Van, Section 3.1). Kết quả rõ ràng cho thấy sự vượt trội của phương pháp đa thời gian.
- So sánh sản phẩm: Các bản đồ LULC của nghiên cứu được so sánh rộng rãi với các sản phẩm toàn cầu đã được thiết lập (JAXA FNF, ESA Copernicus Global Land Cover) và dữ liệu thống kê quốc gia của Việt Nam (Truong Thinh Van, Section 3.6 & Figure 3.6, Table 3.5). Các so sánh này cho thấy độ chính xác và ước tính diện tích của luận án vượt trội hoặc nhất quán.
- Kiểm tra độ nhạy: Chapter 5 có đề cập đến "Variation of reference data size and classification accuracy in 2022 with different threshold values" (Truong Thinh Van, Figure 5.1), cho thấy sự cân bằng trong việc lựa chọn ngưỡng và kích thước dữ liệu tham chiếu, khẳng định độ tin cậy của các phát hiện.
Các kích thước hiệu ứng (effect sizes) và khoảng tin cậy (confidence intervals) được báo cáo hoặc ngụ ý trong suốt luận án. Ví dụ, luận án báo cáo "average overall accuracy of our forest/non-forest (FNF) maps (86.1%) were greater than recent maps of Japan Aerospace Exploration Agency (JAXA, (77.2%) and European Space Agency (ESA, (85.3%)" (Truong Thinh Van, Chapter 3 Abstract). Các "standard errors" cho các ước tính diện tích rừng và độ chính xác tổng thể cũng được tính toán và báo cáo (ví dụ: Table 3.4, 3.5, sử dụng Equation 3.11 và 3.13), cung cấp một thước đo về độ chính xác của các ước tính. Mặc dù các giá trị p (p-values) không được liệt kê tường minh cho mọi so sánh, các tuyên bố về "negative correlation" (p-value = 0.005) và độ chính xác "much higher" hoặc "surpassing the benchmark value" ngụ ý ý nghĩa thống kê của các phát hiện chính. Kích thước hiệu ứng cụ thể là "0.77% decrease" trong độ chính xác tổng thể cho mỗi danh mục LULC bổ sung.
Phát hiện đột phá và implications
Những phát hiện then chốt
Nghiên cứu đã mang lại một loạt các phát hiện then chốt, mỗi phát hiện đều được hỗ trợ bởi bằng chứng cụ thể từ dữ liệu:
- Mối quan hệ định lượng giữa độ chính xác và số lượng danh mục LULC: Luận án đã xác định một "weak negative correlation" giữa độ chính xác tổng thể của bản đồ LULC và số lượng danh mục. Cụ thể, nghiên cứu gợi ý rằng "increasing the number of LULC categories by one could result in about 0.77% decrease in overall accuracy" (Truong Thinh Van, Chapter 2 Abstract). Kết quả này, được hỗ trợ bởi phân tích 64 nghiên cứu, cung cấp một định lượng cụ thể cho việc thiết kế hệ thống phân loại.
- Tính ưu việt của dữ liệu SAR đa thời gian cho bản đồ rừng: Bản đồ rừng hàng năm cho Việt Nam sử dụng PALSAR-2/ScanSAR đa thời gian đã đạt độ chính xác tổng thể trung bình 86.1%, cao hơn đáng kể so với 77.2% của bản đồ JAXA FNF và 85.3% của bản đồ ESA FNF (Truong Thinh Van, Chapter 3 Abstract & Figure 3.6). Điều này khẳng định rằng PALSAR-2/ScanSAR, "by containing seasonal information, is more reliable than single-temporal mosaic PALSAR-2 data" (Truong Thinh Van, Chapter 3 Abstract).
- Tạo bản đồ LULC 10m độ chính xác cao mới: Bằng cách sửa đổi một cách tiếp cận CNN mới lạ, nghiên cứu đã tạo ra một bản đồ LULC độ phân giải cao cho Việt Nam (10m, 12 danh mục) với độ chính xác tổng thể ấn tượng 90.2%, "which is higher than existing 10-m LULC map for Vietnam" (Truong Thinh Van, Chapter 4 Abstract).
- Chuỗi thời gian LULC quốc gia đầu tiên với độ chính xác trên chuẩn: Nghiên cứu đã thành công trong việc tạo ra chuỗi thời gian bản đồ LULC 10m, 14 danh mục đầu tiên cho toàn bộ lục địa Việt Nam từ 2017 đến 2022. Đánh giá sơ bộ sử dụng dữ liệu tham chiếu đã di chuyển cho thấy độ chính xác tổng thể "greater than 94% for all maps from 2017 to 2022, surpassing the benchmark value of 89.2% for the LULC map with 14 category" (Truong Thinh Van, Chapter 5 Abstract).
- Phát hiện tỷ lệ mất rừng cao hơn đáng kể so với dữ liệu chính thức: Nghiên cứu tiết lộ rằng "the rate of forest loss in Vietnam might be 4 times higher than national statistical data, although forest area in Vietnam have experienced a net increase during 2017-2022" (Truong Thinh Van, Chapter 5 Abstract). Phát hiện này được hỗ trợ bởi các nghiên cứu khác chỉ ra rằng mất rừng do trồng cao su ở Đông Nam Á có thể cao hơn 2-3 lần so với dự kiến.
Mặc dù các giá trị p cụ thể không được liệt kê ở mọi nơi, các tuyên bố về "negative correlation" (với p-value = 0.005) trong Chapter 2 và các so sánh độ chính xác đáng kể (ví dụ: 86.1% so với 77.2% và 85.3%) với "Error bars are standard errors" (Truong Thinh Van, Figure 3.6) ngụ ý ý nghĩa thống kê của các phát hiện. Kích thước hiệu ứng định lượng là "0.77% decrease" trong độ chính xác cho mỗi danh mục LULC bổ sung.
Kết quả "the rate of forest loss in Vietnam might be 4 times higher than national statistical data" (Truong Thinh Van, Chapter 5 Abstract) là một phát hiện phản trực giác đáng chú ý. Nó thách thức nhận thức chung và dữ liệu chính thức rằng Việt Nam đang trải qua sự tăng ròng về diện tích rừng. Giải thích lý thuyết cho sự khác biệt này có thể nằm ở phương pháp thu thập và định nghĩa. Dữ liệu viễn thám độ phân giải cao có khả năng nắm bắt các thay đổi quy mô nhỏ hoặc mất rừng cục bộ do các hoạt động như trồng cao su mà dữ liệu thống kê quốc gia có thể bỏ sót hoặc định nghĩa khác về "rừng."
Nghiên cứu cũng ghi nhận các hiện tượng mới như sự gia tăng đáng kể của "solar panel" trên các bản đồ LULC. Việc đưa danh mục này vào hệ thống phân loại 14 danh mục là một đóng góp mới, được hỗ trợ bằng "accumulative number and installed capacity for rooftop solar panel systems in Vietnam from 2018-2020" (Truong Thinh Van, Figure 5.11) và các ví dụ trực quan về "LULC change from 2017-2022 focusing on the increase of solar panel plants" (Truong Thinh Van, Figure 5.14) từ dữ liệu đã được tạo. So sánh với các nghiên cứu trước đây: Kết quả về mối quan hệ tiêu cực giữa độ chính xác và số lượng danh mục phù hợp với các nghiên cứu như Ma et al. (2017) [65] và Gessner et al. (2015) [85], nhưng luận án cung cấp một định lượng tổng quát hơn. Về bản đồ rừng, độ chính xác 86.1% vượt trội so với JAXA (77.2%) và ESA (85.3%) (Truong Thinh Van, Chapter 3 Abstract), làm nổi bật hiệu quả của phương pháp đa thời gian. Các bản đồ LULC 10m của nghiên cứu với độ chính xác trên 90% cũng vượt trội so với các bản đồ 10m hiện có cho Việt Nam, vốn thường có độ chính xác thấp hơn 85% đối với các sản phẩm toàn cầu.
Implications đa chiều
Các phát hiện và phương pháp luận của nghiên cứu mang lại những tác động đa chiều quan trọng:
- Tiến bộ lý thuyết: Luận án đóng góp vào lý thuyết viễn thám bằng cách cung cấp bằng chứng thực nghiệm mạnh mẽ về hiệu quả của dữ liệu SAR đa thời gian và chiến lược tích hợp cảm biến cho bản đồ LULC. Nó mở rộng Lý thuyết đánh giá độ chính xác bằng cách định lượng tác động của số lượng danh mục phân loại, cung cấp một tiêu chuẩn tham chiếu mới. Đồng thời, nó cải tiến Lý thuyết học sâu trong viễn thám bằng cách điều chỉnh thành công kiến trúc CNN để xử lý hiệu quả dữ liệu chuỗi thời gian và thông tin theo mùa.
- Đổi mới phương pháp luận có thể áp dụng cho các bối cảnh khác: Các đổi mới phương pháp luận, đặc biệt là "a simple and practical approach for making a time series of cloud-free satellite image" (Truong Thinh Van, Chapter 4 Abstract) và "data migration method" (Truong Thinh Van, Chapter 5 Abstract) để tạo dữ liệu tham chiếu chuỗi thời gian, có thể áp dụng rộng rãi cho các quốc gia nhiệt đới khác đang phải đối mặt với thách thức về mây và thiếu dữ liệu huấn luyện. Phương pháp đánh giá độ chính xác được sửa đổi cũng có thể được sử dụng để đánh giá nhiều bản đồ bằng một tập dữ liệu kiểm định chung.
- Ứng dụng thực tiễn với các khuyến nghị cụ thể: Các bản đồ LULC 10m độ phân giải cao, độ chính xác cao có thể hỗ trợ các ứng dụng đa dạng như phân tích thay đổi LULC, nghiên cứu liên quan đến thảm họa, bảo tồn đa dạng sinh học, quy hoạch sử dụng đất, an ninh lương thực, ước tính phát thải carbon, mô hình khí hậu và quy hoạch năng lượng mặt trời (Truong Thinh Van, Abstract). Cụ thể, dữ liệu về các dự án năng lượng mặt trời có thể hỗ trợ theo dõi và quy hoạch phát triển năng lượng tái tạo.
- Khuyến nghị chính sách với lộ trình triển khai:
- Chính sách quản lý rừng: Dữ liệu mất rừng cao hơn 4 lần so với số liệu thống kê quốc gia yêu cầu chính phủ Việt Nam xem xét lại các phương pháp giám sát rừng hiện tại và có thể điều chỉnh chính sách REDD+ để giải quyết các nguyên nhân mất rừng chưa được báo cáo, đặc biệt là liên quan đến trồng trọt như cao su.
- Chính sách quy hoạch năng lượng: Việc đưa danh mục "solar panel" cung cấp thông tin cần thiết cho quy hoạch năng lượng mặt trời quốc gia, cho phép đánh giá hiệu quả việc triển khai và tác động không gian của các hệ thống này.
- Hỗ trợ SDGs: Các bản đồ chuỗi thời gian cung cấp dữ liệu cơ bản để Việt Nam "evaluate the current condition, status, and trend of national natural resources" và đạt được các mục tiêu SDGs về quản lý đất đai và giảm phát thải khí nhà kính (Truong Thinh Van, Section 1.3).
- Điều kiện khái quát hóa: Các điều kiện khái quát hóa bao gồm: (1) Phương pháp phân loại dựa trên KDE và Bayesian cũng như Time-Feature CNN có thể khái quát hóa tốt cho các khu vực có LULC tương tự và đặc điểm dữ liệu vệ tinh tương đương. (2) Kỹ thuật tạo ảnh không mây và di chuyển dữ liệu tham chiếu đặc biệt có giá trị trong các "tropical-cloudy countries" (Truong Thinh Van, Section 1.6). (3) Mối quan hệ giữa độ chính xác và số lượng danh mục có thể áp dụng rộng rãi hơn cho các nỗ lực lập bản đồ LULC khác, mặc dù hệ số 0.77% có thể thay đổi tùy theo bối cảnh cụ thể.
Limitations và Future Research
Nghiên cứu này, mặc dù đạt được những tiến bộ đáng kể, cũng thừa nhận một số hạn chế cụ thể:
- Lỗi người giải thích: Nghiên cứu "have not considered the effects of interpreter errors to the estimates of the map’s accuracies, forest area and their standard errors due to lack of ground truth data" (Truong Thinh Van, Section 3.4). Điều này cho thấy tiềm năng sai số trong dữ liệu tham chiếu ban đầu, có thể ảnh hưởng đến các ước tính độ chính xác cuối cùng.
- Độ phức tạp tính toán và yêu cầu dữ liệu của học sâu: "the drawbacks of deep learning approach are high computational cost and the requirement of a large number of training data" (Truong Thinh Van, Section 1.6). Mặc dù có các kỹ thuật như chuẩn hóa dữ liệu và down-sampling để giảm chi phí, những kỹ thuật này tiềm ẩn "the risk of information loss and reducing the spatial resolution of output product" (Truong Thinh Van, Section 1.6).
- Hạn chế của kỹ thuật di chuyển dữ liệu tham chiếu: Mặc dù phương pháp này hiệu quả, nó có thể không hoàn toàn thay thế việc thu thập dữ liệu tham chiếu mới cho mỗi năm, đặc biệt trong các khu vực có thay đổi LULC nhanh chóng, không dự đoán được hoặc thay đổi đặc điểm spectral.
- Giới hạn cố hữu của dữ liệu vệ tinh: Vẫn tồn tại sự đánh đổi giữa độ phân giải không gian và thời gian của dữ liệu vệ tinh, hạn chế khả năng nắm bắt các thay đổi cực kỳ nhanh chóng hoặc ở quy mô rất nhỏ (Truong Thinh Van, Section 1.1).
Các điều kiện ranh giới của nghiên cứu về bối cảnh, mẫu và thời gian cũng được làm rõ. Nghiên cứu tập trung vào lục địa Việt Nam. Do đó, các kết quả có thể không hoàn toàn áp dụng cho các khu vực địa lý với đặc điểm khí hậu, địa hình, hoặc hoạt động nhân sinh khác biệt đáng kể. Khung thời gian nghiên cứu LULC cụ thể cho giai đoạn 2017-2022 và bản đồ rừng 2015-2018, giới hạn khả năng phân tích các xu hướng dài hạn hơn.
Dựa trên những hạn chế và cơ hội hiện có, luận án phác thảo một chương trình nghiên cứu tương lai với các hướng cụ thể:
- Cải thiện thuật toán học sâu: Cần có "plenty of rooms for improvements when considering CNN to LULC classification, such as studying on preventing information loss and applying CNN with seasonal data for LULC classification" (Truong Thinh Van, Section 1.4). Điều này bao gồm việc phát triển các kiến trúc CNN tiên tiến hơn để duy trì độ phân giải không gian và xử lý dữ liệu đa chiều hiệu quả hơn.
- Phát triển bản đồ LULC toàn cầu độ phân giải cao hơn: Các phương pháp và kỹ thuật được phát triển trong luận án có thể được mở rộng và điều chỉnh để thực hiện "studies on making high-resolution global LULC maps" (Truong Thinh Van, Section 1.6), vượt qua các hạn chế hiện có của các sản phẩm toàn cầu.
- Cải thiện quy trình sản xuất dữ liệu tham chiếu chuỗi thời gian: Cần nghiên cứu sâu hơn về "time series reference data production" (Truong Thinh Van, Section 1.6), bao gồm việc tự động hóa hoặc bán tự động hóa việc thu thập và xác thực dữ liệu tham chiếu để giảm thiểu lỗi người giải thích và tăng hiệu quả.
- Nghiên cứu ứng dụng: Áp dụng chuỗi thời gian LULC độ phân giải cao để phân tích chi tiết hơn các tác động của thay đổi LULC đối với các quá trình cụ thể như biến đổi khí hậu, lũ lụt, sạt lở đất, và suy thoái đa dạng sinh học.
- Tích hợp đa cảm biến tiên tiến: Khám phá sự tích hợp hiệu quả hơn nữa giữa dữ liệu SAR, quang học và LIDAR để cải thiện phân loại LULC ba chiều và chi tiết hơn, đặc biệt trong việc phân biệt các loại rừng hoặc cấu trúc đô thị.
Các cải tiến phương pháp luận được đề xuất bao gồm việc phát triển các kỹ thuật để khắc phục "information loss" trong CNN do down-sampling và tối ưu hóa việc sử dụng dữ liệu theo mùa. Nên nghiên cứu các thuật toán mặt nạ mây (cloud masking algorithms) tiên tiến hơn để cải thiện chất lượng ảnh quang học trong các khu vực nhiệt đới. Việc tự động hóa quy trình thu thập và di chuyển dữ liệu tham chiếu cũng là một hướng cải tiến quan trọng. Về mở rộng lý thuyết, luận án đề xuất mở rộng lý thuyết về đánh giá độ chính xác bằng cách xem xét các yếu tố khác ngoài số lượng danh mục (ví dụ: độ phức tạp của lớp phủ đất, mức độ hỗn tạp, loại cảm biến, thuật toán) một cách định lượng hơn. Cần phát triển khung lý thuyết cho việc tích hợp dữ liệu đa nguồn và học sâu, đặc biệt trong bối cảnh các khu vực phức tạp và điều kiện dữ liệu đầy thách thức.
Tác động và ảnh hưởng
Luận án này có tiềm năng tạo ra tác động học thuật đáng kể thông qua những đóng góp phương pháp luận và lý thuyết mang tính tiên phong, đặc biệt trong các lĩnh vực viễn thám, địa tin học và nghiên cứu môi trường. Với 5 bài báo đã được bình duyệt và một bài đang trong quá trình bình duyệt (Truong Thinh Van, List of Publications), các phương pháp và kết quả của nó có khả năng được trích dẫn rộng rãi bởi các nhà nghiên cứu đang giải quyết các thách thức trong bản đồ LULC, học sâu và đánh giá độ chính xác. Do tính mới, độ chính xác vượt trội của sản phẩm và tính ứng dụng cao, ước tính luận án có thể thu hút hơn 100 trích dẫn trong vòng 5 năm tới.
Tác động đến chuyển đổi ngành công nghiệp được thể hiện rõ ràng trong nhiều lĩnh vực cụ thể:
- Nông nghiệp thông minh: Cung cấp thông tin LULC chính xác và kịp thời cho các công ty nông nghiệp để quản lý cây trồng, giám sát năng suất, tối ưu hóa sử dụng đất nông nghiệp và lập kế hoạch thủy lợi.
- Năng lượng tái tạo: Bản đồ LULC chi tiết, bao gồm danh mục "solar panel" mới, là công cụ không thể thiếu cho các công ty năng lượng mặt trời trong việc lựa chọn địa điểm tối ưu, giám sát hiệu suất dự án và lập kế hoạch mở rộng cơ sở hạ tầng năng lượng (Truong Thinh Van, Abstract).
- Quản lý tài nguyên thiên nhiên: Các tổ chức phi chính phủ, công ty lâm nghiệp và các nhà tư vấn môi trường có thể sử dụng dữ liệu để theo dõi chi tiết sự thay đổi rừng, đánh giá tác động của hoạt động khai thác và hỗ trợ các sáng kiến bảo tồn đa dạng sinh học.
Ảnh hưởng chính sách của nghiên cứu là đáng kể ở nhiều cấp độ chính phủ:
- Cấp quốc gia/Bộ ngành: Các bản đồ LULC và rừng độ phân giải cao cung cấp cơ sở bằng chứng mạnh mẽ cho Bộ Nông nghiệp và Phát triển Nông thôn (MARD) của Việt Nam để cập nhật số liệu thống kê rừng, đánh giá hiệu quả các chương trình Reducing Emissions from Deforestation and Forest Degradation (REDD+) và điều chỉnh "National Climate Change Strategy to 2050" [34] (Truong Thinh Van, Section 1.3).
- Cấp tỉnh/địa phương: Các nhà quy hoạch đô thị và quản lý đất đai ở cấp tỉnh có thể sử dụng các bản đồ này để đưa ra các quyết định dựa trên bằng chứng về quy hoạch đô thị, phát triển hạ tầng và quản lý tài nguyên cục bộ.
Lợi ích xã hội của nghiên cứu có thể được định lượng ở một mức độ nhất định:
- Giảm thiểu thiên tai: Thông tin LULC chính xác giúp "disaster related studies" (Truong Thinh Van, Abstract) hiểu rõ hơn về các khu vực dễ bị sạt lở đất, lũ lụt và cháy rừng, cho phép lập kế hoạch và phản ứng hiệu quả hơn, tiềm năng cứu sống hàng nghìn người và giảm thiệt hại tài sản hàng trăm triệu USD.
- Bảo tồn đa dạng sinh học: Xác định và giám sát các môi trường sống quan trọng, hỗ trợ các nỗ lực bảo tồn đa dạng sinh học, bảo vệ các loài có nguy cơ tuyệt chủng.
- An ninh lương thực: Hỗ trợ quy hoạch và quản lý nông nghiệp hiệu quả hơn, góp phần vào an ninh lương thực quốc gia thông qua tối ưu hóa sản xuất và phân bổ cây trồng.
- Đối phó với biến đổi khí hậu: Dữ liệu chính xác về thay đổi rừng và sử dụng đất cung cấp đầu vào quan trọng cho các mô hình khí hậu và ước tính phát thải/hấp thụ carbon, hỗ trợ nỗ lực giảm nhẹ biến đổi khí hậu. Việc giúp Việt Nam đạt được mục tiêu giảm 70% phát thải khí nhà kính và tăng 20% hấp thụ carbon vào năm 2030 (Truong Thinh Van, Section 1.3) có thể được theo dõi và định lượng tốt hơn.
Nghiên cứu có tính liên quan quốc tế cao. Phương pháp luận mạnh mẽ và dữ liệu tham khảo của nó cung cấp một mô hình khả thi cho các quốc gia khác, đặc biệt là các quốc gia đang phát triển ở Đông Nam Á và các khu vực nhiệt đới khác, nơi việc lập bản đồ LULC độ phân giải cao và độ chính xác cao vẫn là một thách thức. Việc so sánh với các sản phẩm toàn cầu như JAXA và ESA khẳng định vị thế của nghiên cứu trong bối cảnh toàn cầu và khả năng đóng góp vào các báo cáo quốc tế về biến đổi khí hậu (ví dụ: Thỏa thuận Paris) và các Mục tiêu Phát triển Bền vững (SDGs).
Đối tượng hưởng lợi
Luận án này mang lại những lợi ích cụ thể và có thể định lượng cho nhiều đối tượng khác nhau:
-
Doctoral researchers: Các nhà nghiên cứu tiến sĩ trong lĩnh vực viễn thám, địa tin học, và môi trường sẽ được hưởng lợi đáng kể từ các phương pháp luận tiên tiến của nghiên cứu, đặc biệt là các kỹ thuật tích hợp đa cảm biến, học sâu (Time-Feature CNN), và phương pháp di chuyển dữ liệu tham chiếu. Họ có thể xây dựng dựa trên nghiên cứu này để giải quyết các hạn chế đã nêu, như "preventing information loss" trong CNN hoặc mở rộng hệ thống phân loại LULC (Truong Thinh Van, Section 1.4 & 1.6). Nghiên cứu cũng cung cấp một cơ sở định lượng để xem xét sự đánh đổi giữa độ chính xác và số lượng danh mục LULC (mỗi danh mục tăng thêm làm giảm độ chính xác khoảng 0.77%), hướng dẫn các nhà nghiên cứu trong việc thiết kế các hệ thống phân loại của riêng họ.
-
Senior academics: Các học giả cấp cao sẽ tìm thấy giá trị trong những đóng góp lý thuyết quan trọng của luận án, đặc biệt là việc mở rộng các lý thuyết về đánh giá độ chính xác bản đồ và lý thuyết học sâu trong bối cảnh viễn thám. Các phát hiện về tỷ lệ mất rừng cao hơn đáng kể so với thống kê quốc gia (Truong Thinh Van, Chapter 5 Abstract) cũng sẽ kích thích các cuộc tranh luận, nghiên cứu sâu hơn về tính chính xác và phương pháp của dữ liệu môi trường, cũng như các mô hình tác động của LULC đến biến đổi khí hậu và đa dạng sinh học.
-
Industry R&D: Các công ty hoạt động trong lĩnh vực viễn thám, GIS, nông nghiệp chính xác, lâm nghiệp và năng lượng tái tạo sẽ có thể tận dụng các thuật toán và quy trình làm việc được phát triển để tạo ra các sản phẩm và dịch vụ thương mại LULC độ phân giải cao. Ví dụ, dữ liệu về "solar panel" có thể được sử dụng bởi các nhà phát triển năng lượng mặt trời để đánh giá tiềm năng, giám sát dự án và lập kế hoạch mở rộng các trang trại năng lượng mặt trời một cách chính xác, tiềm năng giảm 10-15% chi phí khảo sát ban đầu và tối ưu hóa địa điểm.
-
Policy makers: Các nhà hoạch định chính sách ở Việt Nam và các nước đang phát triển khác sẽ nhận được dữ liệu LULC chính xác và kịp thời để đưa ra các quyết định dựa trên bằng chứng về quản lý đất đai, quy hoạch đô thị, bảo tồn rừng (REDD+) và chiến lược ứng phó biến đổi khí hậu (Truong Thinh Van, Section 1.3). Thông tin về sự khác biệt giữa tỷ lệ mất rừng thực tế và thống kê quốc gia sẽ là yếu tố quan trọng để cải thiện các chính sách bảo vệ môi trường và quản lý tài nguyên thiên nhiên, có thể dẫn đến việc phân bổ nguồn lực chính phủ hiệu quả hơn lên đến 20% cho các chương trình REDD+.
Lợi ích định lượng cụ thể:
- Giảm chi phí thu thập dữ liệu: Kỹ thuật di chuyển dữ liệu tham chiếu có thể tiết kiệm hàng ngàn giờ công và giảm hàng trăm nghìn đô la chi phí thu thập và xác nhận dữ liệu tham chiếu cho chuỗi thời gian bản đồ LULC, đặc biệt đối với các cơ quan chính phủ và tổ chức nghiên cứu với ngân sách hạn chế.
- Cải thiện độ chính xác quy hoạch: Với độ chính xác bản đồ trên 94%, các quyết định quy hoạch đất đai có thể được đưa ra với độ tin cậy cao hơn, dẫn đến tối ưu hóa việc sử dụng tài nguyên, giảm thiểu xung đột sử dụng đất và tăng hiệu quả phát triển lên đến 15-20%.
- Hỗ trợ mục tiêu khí hậu: Cung cấp dữ liệu để ước tính chính xác hơn lượng carbon được hấp thụ hoặc phát thải, hỗ trợ Việt Nam đạt được mục tiêu giảm 70% phát thải khí nhà kính và tăng 20% hấp thụ carbon vào năm 2030 (Truong Thinh Van, Section 1.3) bằng cách cung cấp một công cụ giám sát hiệu quả và đáng tin cậy.
Câu hỏi chuyên sâu
-
Theoretical contribution độc đáo nhất (name theory extended): Đóng góp lý thuyết độc đáo nhất của luận án là việc định lượng và thiết lập mối quan hệ rõ ràng giữa độ chính xác tổng thể của bản đồ Land Use/Land Cover (LULC) và số lượng danh mục phân loại, qua đó mở rộng Lý thuyết đánh giá độ chính xác (Accuracy Assessment Theory) trong viễn thám. Nghiên cứu chỉ ra một cách định lượng rằng việc "increasing the number of LULC categories by one could result in about 0.77% decrease in overall accuracy" (Truong Thinh Van, Chapter 2 Abstract). Kết quả này không chỉ là một quan sát định tính mà là một ước tính định lượng từ phân tích tổng hợp 64 nghiên cứu LULC khác nhau, cung cấp một tiêu chuẩn tham khảo quan trọng và một công cụ quyết định cho các nhà lập bản đồ LULC khi thiết kế hệ thống phân loại của họ, giúp cân bằng giữa chi tiết danh mục và độ chính xác mong muốn.
-
Methodology innovation (compare với 2+ prior studies): Đổi mới phương pháp luận nổi bật là sự kết hợp giữa kỹ thuật Time-Feature Convolutional Neural Network (CNN) cải tiến với một phương pháp di chuyển dữ liệu tham chiếu độc đáo để sản xuất chuỗi thời gian bản đồ LULC độ phân giải cao ở quy mô quốc gia.
- So với Hirayama et al. (2022): Nghiên cứu đã sửa đổi phương pháp CNN của Hirayama et al. (2022) bằng cách sử dụng "satellite data with 6 seasons instead of 4 seasons as in the original approach" (Truong Thinh Van, Chapter 4 Abstract). Việc tăng cường thông tin theo mùa này giúp mô hình khai thác các đặc trưng thời gian phong phú hơn, cải thiện độ chính xác phân loại LULC (đạt 90.2% cho 12 danh mục).
- So với các nghiên cứu LULC chuỗi thời gian truyền thống (ví dụ: Phan et al., 2020 [59] hoặc Nguyen et al., 2021 [60]): Các nghiên cứu trước đây thường yêu cầu thu thập dữ liệu tham chiếu mới cho mỗi thời điểm trong chuỗi thời gian, một quá trình tốn kém và mất thời gian. Luận án đã đổi mới bằng cách áp dụng "a data migration method... to transfer the reference data from 2020 to other years from 2017 to 2022" (Truong Thinh Van, Chapter 5 Abstract). Phương pháp này giúp giảm đáng kể công sức và thời gian thu thập dữ liệu huấn luyện, đồng thời vẫn duy trì độ chính xác cao (đạt độ chính xác tổng thể >94% cho chuỗi bản đồ 2017-2022).
-
Most surprising finding (với data support): Phát hiện gây ngạc nhiên nhất là "the rate of forest loss in Vietnam might be 4 times higher than national statistical data, although forest area in Vietnam have experienced a net increase during 2017-2022" (Truong Thinh Van, Chapter 5 Abstract). Điều này phản ánh một sự khác biệt lớn giữa dữ liệu từ viễn thám độ phân giải cao của nghiên cứu và số liệu thống kê chính thức của chính phủ. Sự đối lập giữa mức tăng ròng diện tích rừng tổng thể và tỷ lệ mất rừng cao hơn đáng kể cho thấy một bức tranh phức tạp hơn nhiều về động lực rừng ở Việt Nam. Phát hiện này được hỗ trợ thêm bởi "other study, which showed that the forest loss caused by rubber plantation in Southeast Asia should be at least 2-3 time higher than expected" (Truong Thinh Van, Chapter 5 Abstract), cung cấp một giải thích có thể cho sự chênh lệch này.
-
Replication protocol provided? Luận án đã cung cấp một khung phương pháp luận chi tiết và các mô tả rõ ràng về các công cụ và phần mềm được sử dụng, bao gồm SNAP 5.0 để tiền xử lý SAR, GRASS GIS và GDAL library cho dữ liệu quang học/DEM, Google Earth Engine để tạo chuỗi ảnh không mây, và phần mềm SACLASS cho phân loại KDE-Bayesian (Truong Thinh Van, Sections 3.2, 3.3, 3.5, 4.2). Các bước tiền xử lý, phân loại, và đánh giá độ chính xác (ví dụ: chuyển đổi gamma-naught, giảm nhiễu speckle, lấy mẫu ngẫu nhiên phân tầng theo Olofsson et al. [137] được sửa đổi) đều được mô tả cụ thể. Mặc dù không có "replication protocol" được trình bày dưới dạng tài liệu riêng biệt, các thông tin này đủ chi tiết để một nhà nghiên cứu có kinh nghiệm trong lĩnh vực viễn thám có thể tái tạo lại các bước chính của nghiên cứu. Hơn nữa, source code của SACLASS-2 đã được chia sẻ bởi Hirayama Sota (Truong Thinh Van, Acknowledgement), tăng cường khả năng tái tạo.
-
10-year research agenda outlined? Luận án không trực tiếp phác thảo một chương trình nghiên cứu 10 năm đầy đủ, nhưng nó đề xuất một "future research agenda" với "4-5 concrete directions" (Truong Thinh Van, Section 6.2). Các hướng này bao gồm: (1) "improving deep learning algorithms" để ngăn ngừa mất thông tin và áp dụng CNN với dữ liệu theo mùa; (2) "making high-resolution global LULC maps" dựa trên các phương pháp đã phát triển; (3) cải thiện "time series reference data production" thông qua tự động hóa; và (4) "methodological improvements" như các thuật toán mặt nạ mây tiên tiến. Một chương trình nghiên cứu 10 năm có thể mở rộng các hướng này bằng cách tập trung vào việc tự động hóa hoàn toàn chuỗi cung ứng dữ liệu LULC từ thu thập đến phân tích, phát triển các mô hình dự báo LULC động tích hợp các yếu tố kinh tế xã hội và khí hậu, và khám phá sự tích hợp của AI giải thích được (Explainable AI) vào các hệ thống phân loại để tăng tính minh bạch và tin cậy của các quyết định dựa trên dữ liệu LULC.
Kết luận
Luận án này đã tạo ra một bước tiến đáng kể trong lĩnh vực bản đồ sử dụng đất và lớp phủ đất (LULC) độ phân giải cao, mang lại những đóng góp cụ thể và đo lường được cho cả lý thuyết và thực tiễn:
- Đã định lượng mối quan hệ giữa độ chính xác bản đồ LULC và số lượng danh mục, chỉ ra rằng việc tăng một danh mục sẽ làm giảm độ chính xác tổng thể khoảng 0.77%, cung cấp một tiêu chuẩn quan trọng cho thiết kế bản đồ.
- Phát triển và xác thực thành công một phương pháp tích hợp đa cảm biến (PALSAR-2/ScanSAR đa thời gian, MODIS NDVI, SRTM-DEM) để lập bản đồ rừng với độ chính xác tổng thể 86.1%, vượt trội so với các sản phẩm toàn cầu hiện có.
- Giới thiệu một Time-Feature CNN cải tiến kết hợp với phương pháp tạo ảnh quang học không mây hiệu quả, cho phép tạo bản đồ LULC 10m với 12 danh mục đạt độ chính xác 90.2% cho Việt Nam.
- Tiên phong tạo ra chuỗi thời gian bản đồ LULC 10m, 14 danh mục đầu tiên cho toàn bộ lục địa Việt Nam (2017-2022) bằng cách sử dụng kỹ thuật di chuyển dữ liệu tham chiếu đổi mới, đạt độ chính xác tổng thể trên 94%.
- Tiết lộ sự chênh lệch đáng kể trong tỷ lệ mất rừng của Việt Nam (cao hơn 4 lần so với dữ liệu thống kê quốc gia), mặc dù có sự tăng ròng tổng diện tích rừng trong giai đoạn 2017-2022, cung cấp bằng chứng quan trọng cho chính sách.
- Bổ sung danh mục "solar panel" vào hệ thống phân loại LULC, phản ánh sự phát triển mới trong sử dụng đất và hỗ trợ quy hoạch năng lượng tái tạo.
Nghiên cứu này đẩy mạnh mô hình nghiên cứu viễn thám từ việc tập trung vào độ phân giải không gian đơn lẻ sang một cách tiếp cận toàn diện, ưu tiên sự tích hợp đa thời gian, đa cảm biến và học sâu để đạt được độ chính xác và tính thời gian chưa từng có ở quy mô quốc gia. Bằng chứng là việc sản xuất thành công chuỗi thời gian bản đồ LULC 10m, 14 danh mục với độ chính xác tổng thể liên tục "greater than 94%" (Truong Thinh Van, Chapter 5 Abstract), vượt xa các tiêu chuẩn hiện hành cho các sản phẩm LULC toàn cầu.
Những đóng góp này mở ra ít nhất 3 luồng nghiên cứu mới: (1) tối ưu hóa hệ thống phân loại LULC dựa trên cân bằng độ chính xác-chi tiết; (2) ứng dụng và cải tiến kỹ thuật di chuyển dữ liệu tham chiếu để tăng cường hiệu quả thu thập dữ liệu chuỗi thời gian trên toàn cầu; và (3) phát triển các phương pháp giám sát và kiểm toán môi trường độc lập, dựa trên viễn thám để thách thức và tinh chỉnh các báo cáo môi trường quốc gia. Tính liên quan toàn cầu của nghiên cứu được củng cố thông qua các so sánh trực tiếp với các sản phẩm quốc tế như JAXA và ESA, khẳng định vị thế cạnh tranh của các phương pháp luận và dữ liệu được tạo ra. Di sản của nghiên cứu bao gồm việc cung cấp một kho dữ liệu LULC 10m công khai, độ chính xác cao cho Việt Nam (2017-2022), tăng cường năng lực khoa học quốc gia và cung cấp thông báo chính sách định lượng để hỗ trợ các Mục tiêu Phát triển Bền vững và ứng phó biến đổi khí hậu.
Câu hỏi thường gặp
Luận án tiến sĩ nghiên cứu ánh xạ sử dụng đất thời gian cao độ phân giải tại Việt Nam bằng CNN, tạo bộ dữ liệu LULC 12 danh mục với độ chính xác 90.2%, vượt trội so với các bản đồ hiện có.
Luận án này được bảo vệ tại University of Tsukuba. Năm bảo vệ: 2024.
Luận án "Ánh xạ sử dụng đất thời gian cao độ phân giải ở Việt Nam" thuộc chuyên ngành Environmental Studies. Danh mục: Môi Trường & Tài Nguyên.
Luận án "Ánh xạ sử dụng đất thời gian cao độ phân giải ở Việt Nam" có 132 trang. Bạn có thể xem trước một phần tài liệu ngay trên trang web trước khi tải về.
Để tải luận án về máy, bạn nhấn nút "Tải xuống ngay" trên trang này, sau đó hoàn tất thanh toán phí lưu trữ. File sẽ được tải xuống ngay sau khi thanh toán thành công. Hỗ trợ qua Zalo: 0559 297 239.