Дослідники представили свою роботу в жовтні на міжнародній конференції з обробки зображень ICIP 2024 в Абу-Дабі (ОАЕ).
Зі збільшенням обсягу даних виникає потреба в більш надійних нейромережах, здатних не лише класифікувати нові об'єкти, але й розпізнавати технічні перешкоди, які неминуче виникають під час отримання зображення. Сукупність усієї невідомої інформації називають даними поза розподілом (ДПР). Людський фактор при виявленні ДПР може призвести до небажаних наслідків. Творці алгоритму вирішили цю задачу за допомогою різноманітності ансамблевої моделі, що знизила кореляцію між входами та підвищила загальну точність системи.
Ансамблева нейромережа SDDE складається з кількох моделей, які навчаються на підмножинах окремо взятих баз даних, що дозволяє кожній з них зосереджуватися на унікальних характеристиках зображень. Це досягається за рахунок диверсифікації карт уваги кожної моделі — концепту, що дозволяє зрозуміти, куди дивиться нейромережа. В результаті зростає різноманітність ансамблю, і нейромережа визначає об'єкти на зображеннях з мінімальною похибкою. Для оцінки ефективності нейромережі дослідники провели випробування на кількох базах даних: CIFAR10, CIFAR100 та ImageNet-1K. Ансамблева нейромережа SDDE продемонструвала найкращі результати в порівнянні з подібними алгоритмами, такими як Negative Correlation Learning та Adaptive Diversity Promoting.
«Однією з найважливіших задач при розробці моделей машинного навчання є відповідність реальної ймовірності тій, яку видає нейромережа. Тобто нейромережа впевнена настільки, наскільки їй легко передбачити ціль для цього зразка. Зазвичай мережі абсолютно не сумніваються у своїх прогнозах. У рамках даного дослідження ми запропонували новий метод диверсифікації ансамблів, заснований на логітах — тобто, значеннях, які нейромережа видає перед тим, як перетворити їх у ймовірності.
Це нововведення дозволило підвищити точність “думки” нейромережі при виявленні даних поза розподілом, що критично для застосування моделей у реальних умовах. Наприклад, в режимі автономного водіння необхідно безпомилково визначати об'єкти на дорозі, щоб запобігати аваріям. У медичній діагностиці ж потрібна обширна база даних для правильної постановки діагнозу. Некалібровані моделі можуть бути надмірно впевненими у своїх неправильних припущеннях. У нашої нейромережі відсутня надмірна впевненість, що дозволяє їй більш адекватно оцінювати свої розрахунки», — розповів студент третього курсу Інституту комп'ютерних наук НІТУ МІСІС Максим Жданов.
Для кращого виявлення перешкод-артефактів дослідники використали підхід Outlier Exposure, який полягає в навчанні моделі на спеціальних наборах даних, що містять приклади ДПР. Раніше вчені Університету МІСІС та НІУ ВШЕ вже представили нову нейромережу LAPUSKA, яка справляється з покращенням якості зображень у два рази швидше в порівнянні з аналогічними продуктами.