Nâng cao độ chính xác trong việc phát hiện các khu vực có mưa ở miền Trung Việt Nam bằng phương pháp học máy
Từ khóa:
Phân loại lượng mưa; Học máy; LightGBM; Random Forest; Himawari-8; ERA-5.Tóm tắt
Nghiên cứu này ứng dụng các phương pháp học máy, bao gồm Light Gradient Boosting Machine (LGBM), XGBoost (XGB), và Random Forest (RF), kết hợp với dữ liệu đa nguồn dữ liệu vệ tinh Himawari-8, dữ liệu quan trắc mưa từ trạm đo mưa, và dữ liệu phụ trợ bao gồm tái phân tích ERA-5 và mô hình độ cao số ASTER (DEM), nhằm nâng cao độ chính xác trong phân loại mưa tại khu vực miền Trung Việt Nam. Các sản phẩm hiện có trong khu vực, bao gồm IMERG Final Run, IMERG Early, GSMaP_MVK_Gauge, PERSIANN_CCS, FY-4A và ảnh rađa, được sử dụng để đánh giá hiệu quả của phương pháp phân loại được đề xuất. Kết quả cho thấy mô hình phân loại mưa đề xuất sử dụng phương pháp LGBM vượt trội hơn so với các phương pháp khác. Kết quả cho thấy, sản phẩm phân loại mưa đề xuất đạt giá trị cao nhất đối theo các chỉ số đánh giá bao gồm: Xác suất phát hiện (POD), Chỉ số thành công (CSI), Chỉ số đe dọa công bằng (ETS) và Chỉ số kỹ năng Heidke (HSS). So với sản phẩm tham chiếu có hiệu suất cao nhất (GSMaP_MVK_Gauge), sản phẩm phân loại mưa đề xuất cho thấy mức cải thiện đáng kể khi tăng 20.0% về CSI, 16,67% về ETS, 38,89% về POD và 13,04% về HSS. Những kết quả này cho thấy tiềm năng của các mô hình học máy, đặc biệt là LGBM, trong việc nâng cao độ chính xác phát hiện mưa tại các khu vực có địa hình phức tạp, biến động khí hậu lớn và điều kiện thời tiết khắc nghiệt, qua đó cung cấp cơ sở quan trọng để cải thiện các hệ thống dự báo thời tiết.