Архив
Том 22, 2025
Том 21, 2024
Том 20, 2023
Том 19, 2022
Том 18, 2021
Том 17, 2020
Том 16, 2019 г.
Том 15, 2018 г.
Том 14, 2017 г.
Том 13, 2016 г.
Том 12, 2015 г.
Том 11, 2014 г.
Том 10, 2013 г.
Том 9, 2012 г.
Том 8, 2011 г.
Том 7, 2010 г.
Выпуск 6, 2009 г.
Выпуск 5, 2008 г.
Выпуск 4, 2007 г.
Выпуск 3, 2006 г.
Выпуск 2, 2005 г.
Выпуск 1, 2004 г.
Поиск
Найти:
Подписка/отписка
на рассылку новостей
Ваш e-mail:
ISSN 2070-7401 (Print), ISSN 2411-0280 (Online)
Современные проблемы дистанционного зондирования Земли из космоса
физические основы, методы и технологии мониторинга окружающей среды, потенциально опасных явлений
и объектов

  

Современные проблемы дистанционного зондирования Земли из космоса. 2025. Т. 22. № 4. С. 64-75

Выбор информативных индикаторов и метода построения регрессии для оценки бонитета лесов по спутниковым данным дистанционного зондирования

С.А. Хвостиков 1 , С.А. Барталев 1 , В.А. Егоров 1 , Е.А. Стыценко 1 
1 Институт космических исследований РАН, Москва, Россия
Одобрена к печати: 05.06.2025
DOI: 10.21046/2070-7401-2025-22-4-64-75
Развитие методов машинного обучения привело к появлению множества подходов к оценке характеристик растительного покрова на основе данных дистанционного зондирования. Проведённый анализ позволил выбрать оптимальный метод машинного обучения и набор информативных спутниковых индикаторов для решения задачи оценки в масштабах страны продуктивности лесов, в качестве характеристики которой в настоящем исследовании был принят показатель бонитета. Большой объём опорной выборки, состоящей из более чем 28 млн пикселей карты с известным классом бонитета лесов, и исходный набор из 669 полученных по спутниковым изображениям признаков привели к необходимости выбора наиболее значимых из них. Анализ различных методов оценки значимости признаков показал, что для поставленной задачи лучшие результаты демонстрируют методы на основе случайной перестановки признака на входе построенной регрессии. Применение указанных методов позволило сократить исходный набор из 669 признаков до 100 наиболее информативных из них с незначительной потерей точности. С использованием сокращённого набора признаков выполнен анализ нескольких методов машинного обучения, и сделан вывод об оптимальности подхода на основе градиентного бустинга в реализации LightGBM. Комбинация сокращённого набора признаков и метода градиентного бустинга использовалась для построения карты классов бонитета лесов страны. Оценка точности полученных результатов на основе отложенной части выборки показала высокий коэффициент детерминации, равный 0,87, среднеквадратическая ошибка составила 0,5 класса бонитета. Сопоставление полученной карты бонитета лесов с наземными данными показало более чем 80%-й уровень их совпадения.
Ключевые слова: леса, бонитет, дистанционное зондирование, оценка значимости признаков, градиентный бустинг
Полный текст

Список литературы:

  1. Барталев С. А., Хвостиков С. А. FORS-MachLearn. Свидетельство о гос. регистрации программы для ЭВМ № 2023666251 Рег. 27.07.2023.
  2. Барталев С. А., Егоров В. А., Жарко В. О., Лупян Е. А., Плотников Д. Е., Хвостиков С. А., Шабанов Н. В. Спутниковое картографирование растительного покрова России. М.: ИКИ РАН, 2016. 208 с.
  3. Ворушилов И. И., Барталев С. А., Егоров В. А. Оценка динамики запаса стволовой древесины нарушенных территорий России // Материалы 20-й Международной конф. «Современные проблемы дистанционного зондирования Земли из космоса». М.: ИКИ РАН, 2022. С. 290. DOI: 10.21046/20DZZconf-2022a.
  4. Лупян Е. А., Прошин А. А., Бурцев М. А. и др. Опыт эксплуатации и развития центра коллективного пользования системами архивации, обработки и анализа спутниковых данных (ЦКП «ИКИ-Мониторинг») // Современные проблемы дистанционного зондирования Земли из космоса. 2019. Т. 16. № 3. С. 151–170. DOI: 10.21046/2070-7401-2019-16-3-151-170.
  5. Лупян Е. А., Прошин А. А., Бурцев М. А. и др. Система «Вега-Science»: особенности построения, основные возможности и опыт использования // Современные проблемы дистанционного зондирования Земли из космоса. 2021. Т. 18. № 6. С. 9–31. DOI: 10.21046/2070-7401-2021-18-6-9-31.
  6. Миклашевич Т. С., Барталев С. А., Плотников Д. Е. Интерполяционный алгоритм восстановления длинных временных рядов данных спутниковых наблюдений растительного покрова // Современные проблемы дистанционного зондирования Земли из космоса. 2019. Т. 16. № 6. С. 143–154. DOI: 10.21046/2070-7401-2019-16-6-143-154.
  7. Сочилова Е. Н., Сурков Н. В., Ершов Д. В. и др. Картографирование классов бонитета лесов Приморского края на основе спутниковых изображений и данных о характеристиках рельефа // Современные проблемы дистанционного зондирования Земли из космоса. 2018. Т. 15. № 5. С. 96–109. DOI: 10.21046/2070-7401-2018-15-5-96-109.
  8. Ховратович Т. С. Показатели горизонтальной структуры лесов и их дистанционная оценка на основе оптических спутниковых данных (лекция) // Материалы 20-й Международной конф. «Современные проблемы дистанционного зондирования Земли из космоса». М.: ИКИ РАН, 2022. С. 505. DOI: 10.21046/20DZZconf-2022a.
  9. Швиденко А. З., Щепащенко Д. Г., Нильссон С., Булуй Ю. И. Таблицы и модели хода роста и продуктивности насаждений основных лесообразующих пород Северной Евразии (нормативно-справочные материалы), 2-е изд., доп. М.: Федер. агентство лесного хоз-ва, 2008. 886 с.
  10. Belitz K., Stackelberg P. E. Evaluation of six methods for correcting bias in estimates from ensemble tree machine learning regression models // Environmental Modelling and Software. 2021. V. 139. Article 105006. DOI: 10.1016/j.envsoft.2021.105006.
  11. Bjelanovic I., Comeau P., White B. High resolution site index prediction in boreal forests using topographic and wet areas mapping attributes // Forests. 2018. V. 9. No. 3. Article 113. DOI: 10.3390/f9030113.
  12. Chen T., Guestrin C. XGBoost: A scalable tree boosting system // Proc. 22nd ACM SIGKDD Intern. Conf. Knowledge Discovery and Data Mining. San Francisco, California, USA: ACM, 2016. P. 785–794. DOI: 10.1145/2939672.293978.
  13. Erickson N., Mueller J., Shirkov A. et al. Autogluon-tabular: Robust and accurate AutoML for structured data // https://arxiv.org/. arXiv:2003.06505. 2020. 28 p. DOI: 10.48550/arXiv.2003.06505.
  14. Hansen M. C., Potapov P. V., Moore R. et al. High-resolution global maps of 21st-century forest cover change // Science. 2013. V. 342. No. 6160. P. 850–853. DOI: 10.1126/science.1244693.
  15. Hooker G., Mentch L., Zhou S. Unrestricted permutation forces extrapolation: variable importance requires at least one more model, or there is no free variable importance // Statistics and Computing. 2021. V. 31. Article 82. 16 p. DOI: 10.1007/s11222-021-10057-z.
  16. Huuva I., Wallerman J., Fransson J. E. S., Persson H. J. Prediction of site index and age using time series of TanDEM-X phase heights // Remote Sensing. 2023. V. 15. No. 17. Article 4195. DOI: 10.3390/rs15174195.
  17. Ke G., Meng Q., Finley T., Wang T., Chen W., Ma W., Ye Q., Liu T.-Y. LightGBM: A highly efficient gradient boosting decision tree // Advances in neural information processing systems 30: 31th Conf. Neural Information Processing Systems (NIPS 2017). 2017. V. 30. P. 3149–3157.
  18. Khatami R., Mountrakis G., Stehman S. V. A meta-analysis of remote sensing research on supervised pixel-based land-cover image classification processes: General guidelines for practitioners and future research // Remote Sensing of Environment. 2016. V. 177. P. 89–100. DOI: 10.1016/j.rse.2016.02.028.
  19. LeDell E., Poirier S. H2O AutoML: Scalable automatic machine learning // Proc. AutoML Workshop at ICML. ICML, 2020. 16 p.
  20. Maxwell A. E., Warner T. A., Fang F. Implementation of machine-learning classification in remote sensing: an applied review // Intern. J. Remote Sensing. 2018. V. 39. No. 9. P. 2784–2817. DOI: 10.1080/01431161.2018.1433343.
  21. Pedregosa F., Varoquaux G., Gramfort A., Michel V., Thirion B., Grisel O, Blondel M., Prettenhofer P., Weiss R., Dubourg V., Vanderplas J., Passos A., Cournapeau D., Brucher M., Perrot M., Duchesnay É. Scikit-learn: Machine learning in Python // J. Machine Learning Research. 2011. V. 12. P. 2825–2830.
  22. Penner M., Woods M., Bilyk A. Assessing site productivity via remote sensing — age-independent site index estimation in even-aged forests // Forests. 2023. V. 14. No. 8. Article 1541. DOI: 10.3390/f14081541.
  23. Sheykhmousa M., Mahdianpari M., Ghanbari H. et al. Support vector machine versus random forest for remote sensing image classification: A meta-analysis and systematic review // IEEE J. Selected Topics in Applied Earth Observations and Remote Sensing. 2020. V. 13. P. 6308–6325. DOI: 10.1109/JSTARS.2020.3026724.
  24. Strobl C., Boulesteix A. L., Zeileis A., Hothorn T. Bias in random forest variable importance measures: Illustrations, sources and a solution // BMC Bioinformatics. 2007. V. 8. No. 1. Article 25. DOI: 10.1186/1471-2105-8-25.
  25. Tachikawa T., Hato M., Kaku M., Iwasaki A. Characteristics of ASTER GDEM version 2 // 2011 IEEE Intern. Geoscience and Remote Sensing Symposium. Vancouver, BC, Canada: IEEE, 2011. P. 3657–3660. DOI: 10.1109/IGARSS.2011.6050017.
  26. Wang C., Wu Q., Weimer M., Zhu E. FLAML: A fast and lightweight AutoML library // Proc. Machine Learning and Systems 3 (MLSys 2021). 2021. V. 3. P. 434–447.
  27. Wright M. N., Ziegler A. ranger: A fast implementation of random forests for high dimensional data in C++ and R // J. Statistical Software. 2017. V. 77. Iss. 1. P. 1–17. DOI: 10.18637/jss.v077.i01.