У статті, опублікованій у «Віснику СГУГіТ», представлені найкращі параметри для навчання моделі з метою забезпечення максимальної точності.
Для завдань будівництва та приватизації необхідний регулярний моніторинг територій. Зазвичай його проводять класичним методом. Співробітники виїжджають на місце та здійснюють візуальний огляд. Це займає багато часу, а також відчувається нестача персоналу. Вчені з МФТІ та Кубанського державного технологічного університету запропонували автоматизувати цей процес.
Автори роботи наводять приклад реалізації закону про «гаражну амністію» у Краснодарі. Згідно з цим законом, громадяни можуть легалізувати свої гаражі та придбати земельні ділянки під ними. Наразі в роботі департаменту муніципальної власності знаходиться 7000 заяв, люди очікують узгодження документів від шести до 16 місяців, тоді як регламент передбачає на все місяць.
Прискорити процес допоможе зйомка території лазерним локатором (лідаром). Для розпізнавання об'єктів дослідники запропонували використовувати нейронну мережу PointNext, розроблену на основі PointNet++. Це програма з відкритим кодом, написана для роботи з хмарами точок лазерного відбиття. Її використовують для сегментації, класифікації та ідентифікації тривимірних об'єктів.
«Зазвичай нейромережі використовують для розпізнавання об'єктів на фото або відео, а PointNext працює з хмарою точок лазерного відбиття. Тому ми вирішили її використати», — пояснив Сергій Самарін, аспірант Фізтех-школи радіотехніки та комп'ютерних технологій МФТІ.
Лідар сканує територію лазерними імпульсами, за часом їх повернення він визначає відстань до об'єкта. В результаті виходить масив точок. Саме його і передають у нейромережу.
Але щоб вона видала якісний результат, її потрібно навчити. Для цього використовують еталонні набори даних. У даному випадку вчені скористалися системою Terra_Maker, розробленою в Кубанському державному університеті. З її допомогою згенерували масив точок лазерного відбиття ділянки розміром 1000 на 1000 метрів, на якій розташовано понад 500 об'єктів нерухомості. Загальна кількість точок — понад 4,7 мільйонів. Усі вони були розмічені на п’ять класів: земля, дахи будівель, низька рослинність, середня рослинність, висока рослинність.
Для оцінки якості роботи моделі використовують різні метрики, в першу чергу точність (accuracy), яка показує частку вірних відповідей. Хороша точність наближається до 100 відсотків (але не дорівнює їм). Щоб отримати максимальну точність, потрібно правильно підібрати параметри роботи нейромережі. Саме цю задачу вирішували автори дослідження. Вони перенастроїли спеціально під неї PointNext і приступили до навчання.
Потрібно було провести 12 експериментів, в результаті яких визначили оптимальну кількість точок для одного навчального зразка, розмір сітки та кількість епох (коли через алгоритм проходить весь набір даних). У дослідженні застосовували функцію втрат CrossEntropy loss, оптимізатор Adam optimizer, експоненціальне зменшення швидкості навчання (Step Decay).
Результати роботи нейромережі представлені у вигляді тривимірних графіків з точками, пофарбованими у певний колір. Дах будівлі, наприклад, має фіолетовий колір, висока рослинність — червоний.
Найбільш точний результат отримали при 2500 точках в одному навчальному зразку та сітці 25 метрів. У процесі навчання виявили закономірність — чим менший розмір сітки та менше точок у хмарі, тим вища точність. Якщо додати до датасету інформацію про колір, то точність дещо знижується, але не суттєво. Загалом, чим менше параметрів, тим ефективніше моделі передбачають. Найкраща точність, отримана в експерименті — 0,9998. Такий результат, близький до одиниці, свідчить про ідеальний набір даних, з якими працювала нейромережа. З реальним датасетом, де є спотворення та шуми, точність буде нижчою.
Наступним кроком вчені планують залучити повітряне лазерне сканування на реальних об'єктах з подальшою камеральною обробкою даних нейромережею.
«Замість того, щоб витрачати цілий день на обхід земельних ділянок, ми запускаємо безпілотник з лідаром, робимо зйомку. Очищаємо дані від шумів і відправляємо в нейромережу. Вона сегментує та класифікує дані так, що ми розуміємо, де на території є будівлі, наприклад, гараж», — поділився планами Сергій Самарін.
Ця робота важлива не тільки для реалізації закону про «гаражну амністію», але також для виявлення незаконного будівництва, контролю за порушеннями під час будівництва, наприклад, дотримання поверховості, відступів від меж земельних ділянок.