ارزیابی مدل های جنگل تصادفی و ماشین بردار پشتیبان در تهیه نقشه حساسیت زمین لغزش (مطالعه موردی: حوضه تجن، استان مازندران) (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
تهیه نقشه حساسیت زمین لغزش با استفاده از یادگیری ماشین ابزاری مفید برای مدیریت زمین در مناطق مستعد به این پدیده است. هدف این مطالعه، تهیه نقشه حساسیت زمین لغزش در حوضه تجن با یادگیری ماشین است. بدین منظور 21 عامل مؤثر در وقوع زمین لغزش در چهار طبقه عوامل زمین شناسی، اقلیمی و محیطی، توپوگرافی و هیدرولوژیکی شناسایی و رستر آنها در نرم افزارهای ENVI 5.6، SAGA GIS و ArcGIS تهیه شد. با بازدیدهای میدانی موقعیت 155 زمین لغزش ثبت و در ArcGIS به لایه نقطه ای تبدیل شدند. کلیه عوامل با فرمت ASCII و لایه نقطه ای (لایه آموزشی) وارد نرم افزار R شدند. برای آموزش مدل های ماشین بردار پشتیبان (SVM) و جنگل تصادفی (RF)، 70 درصد از داده ها (109 واقعه) و برای آزمون 30 درصد (46 واقعه) استفاده شد. ارزیابی مدل RF با منحنی ROC نشان داد که نمره های 972/0 و 949/0 در مراحل آموزش و آزمون را کسب کرده است. اطلاعات مدل RF نشان می دهد که مؤثرترین عوامل شامل جهت شیب، فاصله از آبراهه، فاصله از جاده، درجه شیب و شاخص موقعیت توپوگرافی هستند. نتایج مدل SVM نشان داد که پتانسیل طبقه حساسیت زیاد در حوضه بیشتر از RF است و نمرات AUC به ترتیب 906/0 و 831/0 به دست آمد. نتایج مدل SVM نشان داد که پتانسیل طبقه حساسیت زیاد در حوضه نسبت به پیش بینی مدل RF بیشتر شده است. مؤثرترین عوامل در مدل SVM شامل طبقات ارتفاعی، بارندگی، جهت شیب، فاصله از آبراهه و فاصله از جاده می باشند. مدل SVM در مقایسه با مدل RF عملکردی ضعیفی در پیش بینی نقشه حساسیت زمین لغزش دارد. نتایج دسته بندی سطح خطر در مدل RF، بترتیب خیلی زیاد (19/10%)، زیاد (17/4%)، متوسط (76/10%)، کم (62/15%) و خیلی کم (26/59%) از مساحت حوضه است. در مدل SVM نیز بترتیب سهم طبقات خیلی زیاد 51/5%، زیاد 58/15%، متوسط 33/5%، کم 47/4% و خیلی کم 09/69% محاسبه شده است.Evaluation of Random Forest and Support Vector Machine Models in Landslide Risk Mapping (Case study: Tajan Basin, Mazandaran Province)
The development of landslide susceptibility maps using machine learning is an effective tool for managing land in vulnerable regions. This study generates a landslide susceptibility map for the Tajan watershed using machine learning techniques. Twenty-one factors influencing landslides were identified and categorized into geological, climatic, environmental, topographical, and hydrological factors. Raster data was prepared using ENVI 5.6, SAGA GIS, and ArcGIS software. Field surveys documented 155 landslide locations, converted to point layers in ArcGIS. This data, along with the training layer, was imported into R software in ASCII format. For model training, Support Vector Machine (SVM) and Random Forest (RF) algorithms were applied, using 70% of the data (109 samples) for training and the remaining 30% (46 samples) for testing. Evaluation of the RF model using the ROC curve showed high predictive accuracy, with scores of 0.972 for training and 0.949 for testing. Analysis of the RF model identified key factors influencing landslides, including aspect, distance from streams and roads, slope, and the Topographic Position Index. The SVM model results indicated a greater proportion of high-susceptibility areas in the watershed than the RF model. AUC values for the SVM model were slightly lower, at 0.906 for training and 0.831 for testing. The SVM model highlighted elevation classes, rainfall, aspect, and distance from streams and roads as significant factors but underperformed compared to the RF model in mapping landslide susceptibility. Risk classification with the RF model showed that 10.19% of the area is very high risk, 4.17% high risk, 10.76% moderate risk, 15.62% low risk, and 59.26% very low risk. Conversely, the SVM model predicted smaller very high-risk areas at 5.51%, high risk at 15.58%, moderate risk at 5.33%, low risk at 4.47%, and very low risk at 69.09%.