В статье, опубликованной в «Вестнике СГУГиТ», изложены оптимальные параметры для обучения модели, чтобы обеспечить максимальную точность.
Для задач, связанных со строительством и приватизацией, необходим регулярный мониторинг территорий. Обычно это осуществляется классическим способом: сотрудники выезжают на место и проводят визуальный осмотр. Такой подход требует много времени и сталкивается с нехваткой персонала. Ученые из МФТИ и Кубанского государственного технологического университета предложили автоматизировать этот процесс.
Авторы исследования приводят в пример реализацию закона о «гаражной амнистии» в Краснодаре. Согласно этому закону, граждане могут легализовать свои гаражи и получить в собственность земельные участки под ними. В настоящее время в департаменте муниципальной собственности находится 7000 заявлений, и люди ждут согласования документов от шести до 16 месяцев, в то время как регламент предполагает один месяц.
Ускорить процесс может съемка территории с помощью лазерного локатора (лидара). Для распознавания объектов исследователи предложили использовать нейронную сеть PointNext, разработанную на основе PointNet++. Это программа с открытым исходным кодом, предназначенная для работы с облаками точек лазерного отражения. Ее применяют для сегментации, классификации и идентификации трехмерных объектов.
«Обычно нейросети применяют для распознавания объектов на фото или видео, а PointNext работает с облаком точек лазерного отражения. Поэтому мы решили использовать именно её», — объяснил Сергей Самарин, аспирант Физтех-школы радиотехники и компьютерных технологий МФТИ.
Лидар сканирует территорию с помощью лазерных импульсов и, по времени их возвращения, определяет расстояние до объекта. В результате получается массив точек, который передается в нейросеть.
Однако для получения качественного результата нейросеть необходимо обучить. Для этого применяются эталонные наборы данных. В данном случае ученые использовали систему Terra_Maker, разработанную в Кубанском государственном университете. С её помощью был сгенерирован массив точек лазерного отражения участка размером 1000 на 1000 метров, где расположено более 500 объектов недвижимости. Общее количество точек превысило 4,7 миллиона, и все они были размечены на пять классов: земля, крыши зданий, низкая растительность, средняя растительность, высокая растительность.
Для оценки качества работы модели используются различные метрики, в первую очередь точность (accuracy), показывающая долю правильных ответов. Хорошая точность стремится к 100 процентам (но не равна им). Чтобы достичь максимальной точности, необходимо правильно настроить параметры работы нейросети. Именно эту задачу решали авторы исследования. Они перенастроили PointNext специально для этой цели и начали обучение.
Проведено 12 экспериментов, в ходе которых было определено оптимальное количество точек для одного обучающего образца, размер сетки и количество эпох (периодов, когда через алгоритм проходит весь набор данных). В исследовании применялась функция потерь CrossEntropy loss, оптимизатор Adam optimizer и экспоненциальное уменьшение скорости обучения (Step Decay).
Результаты работы нейросети представлены в виде трехмерных графиков с точками, окрашенными в определенные цвета. Например, крыша здания имеет сиреневый цвет, а высокая растительность — красный.
Наиболее точный результат был достигнут при 2500 точках в одном обучающем образце и сетке размером 25 метров. В процессе обучения была выявлена закономерность: чем меньше сторона сетки и меньше точек в облаке, тем выше точность. Если добавить в датасет информацию о цвете, точность несколько снижается, но незначительно. В целом, чем меньше параметров, тем более эффективно предсказывает модель. Наилучшая точность, полученная в эксперименте, составила 0,9998. Этот результат, близкий к единице, свидетельствует о высоком качестве набора данных, с которым работала нейросеть. С реальным датасетом, содержащим искажения и шумы, точность будет ниже.
Следующим шагом ученые планируют использовать воздушное лазерное сканирование на реальных объектах с последующей обработкой данных нейросетью.
«Вместо того чтобы тратить целый день на обход земельных участков, мы запускаем беспилотник с лидаром, проводим съемку, очищаем данные от шумов и отправляем их в нейросеть. Она сегментирует и классифицирует данные так, что мы можем определить, где на территории находятся здания, например, гараж», — поделился планами Сергей Самарин.
Эта работа важна не только для реализации закона о «гаражной амнистии», но и для выявления незаконного строительства, а также контроля за соблюдением норм при строительстве, например, этажности и отступов от границ земельных участков.