Оценка эффективности мультисезонных моделей машинного обучения для оперативного распознавания озимых культур на больших территориях
Плотников Д.Е., Бойматов Ю.Ш., Ёлкина Е.С., Щербенко Е.В., Плотникова А.С.
// Современные проблемы дистанционного зондирования Земли из космоса, 2024. Т. 21. № 5. С. 116-129.
Оценивались возможности ансамблевых методов машинного обучения Random Forest и XGBoost (англ. eXtreme Gradient Boosting) для распознавания озимых культур на больших территориях при обучении на мультисезонных наборах данных за пять последовательных лет. В рамках исследования были проведены два эксперимента: по сравнению эффективности мультисезонных моделей указанных архитектур и по сравнению мультисезонной модели и серии односезонных моделей оптимальной архитектуры. Оценка результатов экспериментов проводилась для региона исследования, охватывающего более 94 % посевных площадей озимых Российской Федерации, на основе сравнения с данными Росстата и опорными картами, полученными методом экспансии обучающей выборки, с использованием метрики RMSE (англ. root mean squared error) и коэффициента детерминации R 2, а также метрики F-score по классу «озимые». В первом эксперименте была продемонстрирована перспективность мультисезонных моделей, причём мультисезонная модель Random Forest показала себя эффективнее и стабильнее, чем XGBoost, улучшение RMSE по сравнению с опорными картами составило в среднем 28 тыс. га и наблюдалось для любого из пяти сезонов; относительное улучшение составило 15 % в среднем, достигая 35 %. Результаты второго эксперимента по сравнению пяти сезонных моделей и мультисезонной модели Random Forest также указали на эффективность мультисезонной модели: суммарное за пять сезонов значение RMSE мультисезонной модели в 1,32–2,02 раз меньше, чем для односезонных моделей, а среднее значение F-score для любой односезонной модели находится в диапазоне 0,75–0,79, в то время как для мультисезонной модели достигает значения 0,84.
Ссылка на текст:
http://d33.infospace.ru/jr_d33/2024v21n5/116-129.pdf