euro-pravda.org.ua

Знайдено спосіб покращити геопросторове моделювання.

Методи геопросторового моделювання стали важним інструментом екологічного моніторингу — за їхньою допомогою управляють ризиками для навколишнього середовища та відстежують загрози стихійних лих. Все більше застосування в геопросторових дослідженнях знаходить машинне навчання. Дослідники публікують безліч статей, в яких повідомляють про вдосконалення моделей, вирішення фундаментальних задач і нові підходи, зокрема в природничих науках. Проте часто такі публікації страждають від методологічних помилок, в основному через обмеження, властиві машинному навчанню. Група вчених з Сколтеху та Інституту AIRI провела аналіз наукової літератури, виявивши типові проблеми та запропоновані рішення.
Обнаружен метод для повышения качества геопространственного моделирования.

Результати роботи представлені в статті-огляді, опублікованій в журналі Nature Communications.

«Ми визначили, що серед ключових труднощів — несбалансованість і нерівномірність даних, просторовий автокореляційний зв'язок, упередження в даних, помилки прогнозів та складнощі в оцінці невизначеності моделей. Хоча ці проблеми відомі, існуючі підходи часто ігнорують їх, обмежуючись стандартними процедурами навчання та валідації моделей машинного навчання», — розповіла перший автор роботи Діана Колдасбаєва, аспірантка Сколтеха за програмою «Обчислювальні системи та аналіз даних у науці та техніці».

«Для усунення цих обмежень необхідна розробка методів, які враховують унікальні особливості екологічних даних та просторово-часових процесів. У статті представлений єдиний підхід до вирішення таких задач, що включає інструменти та техніки для підвищення точності моделей, а також рекомендації щодо покращення оцінки їх якості. Ми сподіваємося, що наші результати допоможуть у виборі напрямків досліджень науковцям з різних країн», — поділився співавтор роботи Олексій Зайцев, старший викладач Центру штучного інтелекту Сколтеха.

Автори також визначили ключові напрямки розвитку геопросторових досліджень з урахуванням специфіки екологічних даних і представили власну добірку передових інструментів, ресурсів та проектів, які використовують можливості геопросторових технологій для вирішення екологічних проблем. Дослідники розмістили її у відкритому доступі на GitHub і запрошують колег користуватися джерелом і доповнювати його.

«У дослідженні ми визначили нові набори даних, моделі та підходи для забезпечення якості роботи, необхідного для впровадження в галузі прикладних наукових розробок і вирішення проблеми інтерпретованості прогнозів, основаних на даних. Наприклад, вкрай важливо створювати добре організовані бази даних. Більш якісні дані природно призводять до зменшення спотворень, пов'язаних з дисбалансом і автокореляцією. Ми очікуємо появи самообучення для геопросторового картографування в екологічних дослідженнях, подібно до того, що ми вже бачили в мовному моделюванні та комп'ютерному зорі», — прокоментував роботу Євгеній Бурнаєв, директор Центру штучного інтелекту в Сколтехі та керівник наукової групи «Навчальний інтелект» в Інституті AIRI.