Cải thiện mô hình ước tính PM2.5 từ dữ liệu đa nguồn - Phạm Văn Hà

Trường ĐH

Vietnam National University, Hanoi University of Engineering and Technology

Chuyên ngành

Information Systems

Tác giả

Ẩn danh

Thể loại

Luận án

Năm xuất bản

Số trang

183

Thời gian đọc

28 phút

Lượt xem

0

Lượt tải

0

Phí lưu trữ

50 Point

Tóm tắt nội dung

I. Tổng quan về mô hình ước tính PM2

Bụi mịn PM2.5 là hạt có đường kính nhỏ hơn 2.5 micromet. Loại bụi này thâm nhập sâu vào phổi. Gây hại nghiêm trọng cho sức khỏe con người. Việc ước tính chính xác nồng độ PM2.5 trở nên cấp thiết. Các mô hình dự báo ô nhiễm không khí phát triển mạnh mẽ. Hai hướng tiếp cận chính là mô hình số và mô hình thống kê. Mô hình số sử dụng các phương trình vật lý hóa học. Mô hình thống kê dựa trên học máy machine learning và dữ liệu quan sát. Nghiên cứu này cải thiện cả hai phương pháp. Mục tiêu nâng cao độ chính xác dự báo chất lượng không khí. Tích hợp dữ liệu đa nguồn mang lại kết quả vượt trội.

1.1. Thách thức trong ước tính bụi mịn PM2.5

Chất lượng không khí biến động phức tạp theo không gian và thời gian. Dữ liệu quan trắc mặt đất có mật độ thưa thớt. Các trạm đo phân bố không đều trên lãnh thổ. Dữ liệu vệ tinh có độ phân giải không gian thấp. Mô hình số WRF-Chem đòi hỏi tài nguyên tính toán lớn. Các thông số đầu vào chứa nhiều bất định. Mô hình thống kê phụ thuộc vào chất lượng dữ liệu huấn luyện. Việc kết hợp nhiều nguồn dữ liệu gặp khó khăn về đồng bộ hóa.

1.2. Giải pháp tích hợp dữ liệu đa nguồn

Nghiên cứu đề xuất phương pháp tích hợp đa nguồn dữ liệu. Kết hợp dữ liệu vệ tinh AOD từ MODIS và CALIOP. Sử dụng dữ liệu quan trắc mặt đất từ các trạm đo. Áp dụng dữ liệu khí tượng từ WRF-Chem. Tích hợp thông tin điểm nóng cháy rừng. Phương pháp deep learning xử lý dữ liệu đa chiều. Mạng nơ-ron nhân tạo học các mối quan hệ phi tuyến. Kỹ thuật random forest đánh giá tầm quan trọng biến số.

1.3. Đóng góp khoa học của nghiên cứu

Luận án cải thiện quy trình ước tính PM2.5 bằng mô hình số. Tối ưu hóa các thông số WRF-Chem cho khu vực Đông Nam Á. Phát triển phương pháp mới kết hợp dữ liệu đa độ phân giải. Nâng cao hiệu suất mô hình dự báo ô nhiễm không khí. Kết quả nghiên cứu được công bố trên các tạp chí quốc tế uy tín. Ứng dụng thực tiễn trong cảnh báo chất lượng không khí. Cung cấp công cụ hỗ trợ ra quyết định cho cơ quan quản lý.

II. Cải thiện mô hình số WRF Chem cho PM2

WRF-Chem là mô hình dự báo hóa học khí quyển tiên tiến. Mô hình mô phỏng quá trình vận chuyển và phản ứng hóa học. Nghiên cứu tối ưu hóa cấu hình WRF-Chem cho Việt Nam. Phân tích ảnh hưởng của gió mùa đến nồng độ PM2.5. Đánh giá tác động của điểm nóng cháy rừng. Kết quả cho thấy sự biến động theo mùa rõ rệt. Gió mùa đông bắc mang ô nhiễm từ Trung Quốc. Cháy rừng ở Đông Nam Á làm tăng đột biến PM2.5. Mô hình được hiệu chỉnh cải thiện độ chính xác đáng kể.

2.1. Phân tích theo mùa và gió mùa

Nồng độ PM2.5 biến đổi mạnh theo mùa tại Hà Nội. Mùa đông có nồng độ cao nhất do gió mùa đông bắc. Mùa hè nồng độ thấp hơn nhờ mưa rửa trôi. Gió mùa tây nam mang không khí sạch từ biển. Nghiên cứu phân tích dữ liệu nhiều năm liên tục. Xác định các yếu tố khí tượng ảnh hưởng chính. Nhiệt độ nghịch đảo gây tích tụ ô nhiễm. Tốc độ gió thấp làm giảm khả năng khuếch tán.

2.2. Đánh giá tác động điểm nóng cháy

Cháy rừng và đốt rơm rạ tạo điểm nóng phát thải. Dữ liệu MODIS và VIIRS phát hiện điểm nóng. Các điểm nóng tập trung ở Myanmar, Lào, Thái Lan. Khói bụi di chuyển theo hướng gió đến Việt Nam. Tháng 3-4 là thời kỳ cháy rừng cao điểm. Nồng độ PM2.5 tăng 2-3 lần so với ngày thường. Mô hình WRF-Chem tích hợp dữ liệu điểm nóng. Cải thiện khả năng dự báo các đợt ô nhiễm nghiêm trọng.

2.3. Tối ưu hóa thông số mô hình

Nghiên cứu thử nghiệm nhiều sơ đồ tham số hóa khác nhau. Lựa chọn sơ đồ vi vật lý và bức xạ phù hợp. Điều chỉnh độ phân giải lưới tính toán. Tối ưu hóa cơ chế hóa học MOZART-MOSAIC. Hiệu chỉnh nguồn phát thải từ EDGAR và ECLIPSE. Kết quả cho hệ số tương quan R tăng từ 0.65 lên 0.82. Sai số trung bình giảm 25% so với cấu hình mặc định.

III. Phương pháp học máy cho ước tính PM2

Mô hình thống kê sử dụng học máy machine learning hiệu quả. Random forest xử lý tốt dữ liệu phi tuyến và thiếu hụt. Mạng nơ-ron nhân tạo học các mối quan hệ phức tạp. Deep learning khai thác thông tin từ dữ liệu đa chiều. Nghiên cứu phát triển phương pháp data fusion mới. Kết hợp AOD vệ tinh với dữ liệu quan trắc mặt đất. Sử dụng các biến khí tượng làm đầu vào bổ sung. Kỹ thuật cross-validation đảm bảo tính tổng quát. Kết quả vượt trội so với các phương pháp truyền thống.

3.1. Tích hợp dữ liệu AOD vệ tinh

AOD (Aerosol Optical Depth) đo độ đục khí quyển. Dữ liệu MODIS có độ phủ không gian rộng. CALIOP cung cấp thông tin profin theo độ cao. AOD tương quan chặt chẽ với nồng độ PM2.5. Nghiên cứu xây dựng mô hình hồi quy phi tuyến. Kết hợp AOD với độ cao lớp biên khí quyển. Tích hợp độ ẩm tương đối và nhiệt độ. Độ chính xác ước tính đạt R² = 0.78.

3.2. Ứng dụng random forest và deep learning

Random forest xây dựng rừng cây quyết định. Mỗi cây học trên tập con dữ liệu ngẫu nhiên. Kết quả tổng hợp giảm overfitting hiệu quả. Deep learning sử dụng mạng nơ-ron nhiều lớp ẩn. Tự động trích xuất đặc trưng từ dữ liệu thô. Xử lý tốt dữ liệu có số chiều cao. Kỹ thuật dropout và regularization tăng khả năng tổng quát. So sánh cho thấy deep learning vượt trội khi có đủ dữ liệu.

3.3. Phương pháp data fusion đa độ phân giải

Dữ liệu vệ tinh có độ phân giải không gian 1-10km. Dữ liệu quan trắc mặt đất là điểm rời rạc. Nghiên cứu đề xuất phương pháp downscaling thông minh. Sử dụng biến phụ trợ độ phân giải cao. Áp dụng kỹ thuật kriging kết hợp machine learning. Tạo bản đồ PM2.5 độ phân giải 1km. Độ chính xác kiểm chứng đạt RMSE < 15 μg/m³.

IV. Kết quả thực nghiệm và đánh giá hiệu suất

Nghiên cứu triển khai thực nghiệm tại khu vực Hà Nội. Thu thập dữ liệu từ 2015 đến 2020 liên tục. Sử dụng dữ liệu từ 10 trạm quan trắc chất lượng không khí. Kết hợp với dữ liệu vệ tinh MODIS và CALIPSO. Mô hình WRF-Chem được cấu hình cho miền Đông Nam Á. Các mô hình machine learning được huấn luyện và kiểm chứng. Kết quả cho thấy cải thiện đáng kể so với baseline. Phương pháp đề xuất đạt độ chính xác cao nhất. Ứng dụng thực tiễn trong hệ thống cảnh báo sớm.

4.1. Thiết lập thí nghiệm và thu thập dữ liệu

Khu vực nghiên cứu bao gồm Hà Nội và vùng phụ cận. Dữ liệu PM2.5 từ mạng lưới quan trắc quốc gia. Dữ liệu AOD tải từ NASA LAADS DAAC. Dữ liệu khí tượng từ ECMWF ERA5. Dữ liệu điểm nóng từ FIRMS NASA. Tổng cộng 180,000 mẫu dữ liệu được thu thập. Chia tập huấn luyện 70%, kiểm định 15%, kiểm tra 15%. Xử lý dữ liệu thiếu bằng phương pháp nội suy thông minh.

4.2. So sánh hiệu suất các phương pháp

Đánh giá 5 phương pháp: WRF-Chem gốc, WRF-Chem tối ưu, Random Forest, ANN, Deep Learning. WRF-Chem gốc có R = 0.65, RMSE = 28.5 μg/m³. WRF-Chem tối ưu cải thiện lên R = 0.82, RMSE = 18.2 μg/m³. Random Forest đạt R = 0.85, RMSE = 15.8 μg/m³. Deep Learning cho kết quả tốt nhất R = 0.89, RMSE = 13.2 μg/m³. Phương pháp tích hợp đa nguồn vượt trội rõ rệt.

4.3. Ứng dụng thực tiễn và khuyến nghị

Mô hình được tích hợp vào hệ thống cảnh báo chất lượng không khí. Cung cấp dự báo PM2.5 với độ tin cậy cao. Hỗ trợ cơ quan quản lý đưa ra cảnh báo kịp thời. Người dân có thông tin để bảo vệ sức khỏe. Khuyến nghị mở rộng mạng lưới quan trắc. Đầu tư nâng cấp hạ tầng tính toán. Phát triển ứng dụng di động thân thiện người dùng. Tăng cường hợp tác quốc tế chia sẻ dữ liệu.

V. Tích hợp dữ liệu vệ tinh và quan trắc mặt đất

Dữ liệu vệ tinh cung cấp phủ không gian rộng lớn. Quan trắc mặt đất cho độ chính xác cao tại điểm đo. Kết hợp hai nguồn tận dụng ưu điểm của cả hai. Dữ liệu MODIS có tần suất cập nhật hàng ngày. CALIOP cung cấp thông tin cấu trúc thẳng đứng. Dữ liệu quan trắc mặt đất hiệu chỉnh kết quả vệ tinh. Phương pháp data fusion giảm thiểu sai số hệ thống. Tạo sản phẩm PM2.5 liên tục không gian và thời gian. Độ phân giải cao phục vụ nghiên cứu chi tiết.

5.1. Xử lý và đồng bộ dữ liệu đa nguồn

Dữ liệu từ các nguồn có định dạng và độ phân giải khác nhau. Cần chuẩn hóa về hệ tọa độ và thời gian thống nhất. Áp dụng kỹ thuật resampling cho dữ liệu vệ tinh. Nội suy không gian cho dữ liệu quan trắc điểm. Xử lý giá trị ngoại lai và dữ liệu nhiễu. Kiểm tra chất lượng dữ liệu bằng phương pháp thống kê. Lưu trữ dữ liệu trong cơ sở dữ liệu không gian. Đảm bảo tính nhất quán và khả năng truy vấn nhanh.

5.2. Kỹ thuật hiệu chỉnh dữ liệu vệ tinh

Dữ liệu AOD vệ tinh chứa sai số hệ thống. Sử dụng dữ liệu AERONET làm chuẩn hiệu chỉnh. Xây dựng mô hình hồi quy tuyến tính địa phương. Áp dụng phương pháp machine learning cho hiệu chỉnh phi tuyến. Xem xét ảnh hưởng của địa hình và thời tiết. Hiệu chỉnh theo mùa và loại bề mặt. Kết quả giảm sai số trung bình 30%. Độ tương quan với quan trắc mặt đất tăng đáng kể.

5.3. Tạo bản đồ PM2.5 độ phân giải cao

Sử dụng dữ liệu đã tích hợp để tạo bản đồ liên tục. Áp dụng kỹ thuật geostatistical kriging kết hợp ML. Tích hợp biến phụ trợ như độ cao, mật độ dân số. Xem xét ảnh hưởng của nguồn phát thải giao thông. Tạo bản đồ PM2.5 độ phân giải 1km x 1km. Cập nhật hàng ngày cho toàn vùng nghiên cứu. Cung cấp ước tính không chắc chắn cho mỗi điểm ảnh. Phục vụ nghiên cứu phơi nhiễm và dịch tễ học.

VI. Hướng phát triển và ứng dụng trong tương lai

Nghiên cứu mở ra nhiều hướng phát triển tiềm năng. Tích hợp thêm dữ liệu từ vệ tinh thế hệ mới. Sentinel-5P cung cấp dữ liệu chất lượng không khí độ phân giải cao. Phát triển mô hình dự báo thời gian thực. Ứng dụng trí tuệ nhân tạo AI tiên tiến hơn. Mở rộng nghiên cứu cho các chất ô nhiễm khác. Xây dựng hệ thống cảnh báo sớm toàn diện. Hỗ trợ nghiên cứu tác động sức khỏe cộng đồng. Đóng góp vào chính sách quản lý môi trường bền vững.

6.1. Tích hợp công nghệ vệ tinh thế hệ mới

Sentinel-5P cung cấp dữ liệu NO2, SO2, CO độ phân giải cao. TROPOMI có độ phân giải không gian 5.5x3.5 km. Kết hợp nhiều loại vệ tinh tăng tần suất quan sát. Sử dụng dữ liệu radar SAR phát hiện nguồn phát thải. Áp dụng kỹ thuật xử lý ảnh đa phổ tiên tiến. Tích hợp dữ liệu từ vệ tinh địa tĩnh cho cập nhật liên tục. Phát triển thuật toán tự động phát hiện sự kiện ô nhiễm.

6.2. Phát triển hệ thống dự báo thời gian thực

Xây dựng hệ thống dự báo PM2.5 24-72 giờ tới. Tích hợp dữ liệu dự báo thời tiết số trị. Sử dụng mô hình ensemble kết hợp nhiều phương pháp. Cập nhật mô hình liên tục với dữ liệu mới. Áp dụng kỹ thuật data assimilation hiện đại. Cung cấp dự báo với khoảng tin cậy. Phát triển API cho ứng dụng bên thứ ba. Tích hợp vào hệ thống cảnh báo thiên tai quốc gia.

6.3. Mở rộng ứng dụng cho sức khỏe cộng đồng

Nghiên cứu mối liên hệ PM2.5 với bệnh hô hấp. Đánh giá phơi nhiễm dài hạn cho các nhóm dân cư. Xây dựng bản đồ nguy cơ sức khỏe theo khu vực. Hỗ trợ nghiên cứu dịch tễ học môi trường. Cung cấp dữ liệu cho đánh giá tác động sức khỏe. Phát triển ứng dụng di động khuyến nghị hoạt động ngoài trời. Tích hợp với hệ thống y tế dự phòng. Đóng góp vào chính sách bảo vệ sức khỏe cộng đồng.

Xem trước tài liệu
Tải đầy đủ để xem toàn bộ nội dung
Improvement of pm2 5 estimation model using multi source and multi resolution data

Tải xuống file đầy đủ để xem toàn bộ nội dung

Tải đầy đủ (183 trang)

Từ khóa và chủ đề nghiên cứu


Câu hỏi thường gặp

Luận án liên quan

Chia sẻ tài liệu: Facebook Twitter