1دانشجوی دکتری، گروه مهندسی عمران، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران
2استادیار، گروه مهندسی عمران، واحد رودهن، دانشگاه آزاد اسلامی، رودهن، ایران
3استادیار، گروه مهندسی عمران، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران
چکیده
پدیده سیل یکی از مخاطرات پرتکراری است که در ایران خسارات مالی و تلفات جانی زیادی را در دهه گذشته به بار آورده است. در این پژوهش، با استفاده از دادههای موقعیت مکانی سیل و بهکارگیری مدلهای یادگیری ماشینی و دادهکاوی جنگل تصادفی و وزن شواهد و ترکیب آنها به پیشبینی مکانی مناطق مستعد سیل پرداخته شده است. عوامل ارتفاع، شیب زمین، کاربری اراضی، تراکم زهکشی و فاصله از آبراهه، شاخص رطوبت توپوگرافی، شاخص موقعیت توپوگرافی، شاخص ناهمواری توپوگرافی، شاخص توان جریان، شاخص حملونقل رسوب و نوع خاک استفاده شد. دادههای سیل بهصورت تصادفی به دو گروه آموزش (70 درصد) و اعتبارسنجی (30 درصد) تقسیم شدند. دقت پیشبینی با استفاده از روش منحنی مشخصه عملکرد (ROC) مورد بررسی قرار گرفت. بر اساس نتایج مدل جنگل تصادفی دارای دقت 904/0، وزن شواهد دارای دقت 886/0 و مدل ترکیبی جنگل تصادفی-وزن شواهد دارای دقت 978/0 بودند. بر اساس مدل ترکیبی جنگل تصادفی و وزن شواهد بهعنوان مدل برتر، 49/20 درصد سطح حوزه دارای پتانسیل متوسط رو به بالا هستند. بر اساس مدل جنگل تصادفی عوامل تراکم زهکشی، فاصله از آبراهه، ارتفاع و کاربری اراضی مهمترین عوامل مؤثر بر پتانسیل سیل بودند.
1Ph.D Student, Department of Civil Engineering, Central Tehran branch, Islamic Azad University, Tehran, Iran
2Assistant Professor, Department of Civil Engineering, Roudehen Branch, Islamic Azad University, Roudehen, Iran
3Assistant Professor, Department of Civil Engineering, Central Tehran branch, Islamic Azad University, Tehran, Iran
چکیده [English]
The flood phenomenon is one of the recurring risks that has caused financial losses and casualties in Iran in the last decade. In this research, using spatial location of floods and applying machine learning and data mining models include random forest, evidence weight and random forest-evidence weight, the spatial prediction of flood prone areas has been studied. Environmental factors are selected to predict the location, which can be elevation, slope, land use, drainage density and distance from stream, TWI, TPI, TRI, SPI, STI and soil type. Spatial data of flood events were randomly divided into two groups of training and validation, which had 70% of data and 30% of validation. The prediction accuracy of each map was evaluated using the performance characteristic curve (ROC) method. Results: Among the standalone machine learning models, the random forest model had an accuracy of 0.904, weight of evidence models had an accuracy of 0.872 and the random forest-evidence weight (RF-WOE) was 0.978. Based on the combined model of random forest and the weight of evidence as the superior model, 20.49% of the basin area has medium to high potential. According to the random forest model, drainage density, distance from stream, elevation and land use were the most important factors affecting flood potential.