Наукова група з T-Bank AI Research суттєво оптимізувала алгоритм байєсівського персоналізованого ранжування (БПР) — один з ключових компонентів рекомендаторних систем сучасних соціальних мереж та онлайн-магазинів. Саме на його основі реалізовані практично всі новинні стрічки в соціальних мережах, а також рекомендації користувачам під час онлайн-шопінгу.
Цей алгоритм аналізує безліч змінних та їх ймовірнісних залежностей, щоб вловити, які саме дії людини в соціальній мережі (або потенційного покупця в магазині) найчастіше ймовірно пов'язані з його вибором того, на яку саме новину, пост або товар він хоче клікнути. БПР надзвичайно популярний через відносно помірні вимоги до ресурсів при достатньо високій ефективності.
Автори нової роботи представили її на ключовій Всесвітній конференції з рекомендаторних систем ACM RecSys, яка проходила з 14 по 18 жовтня в Барі (Італія). Текст прийнято до публікації в збірнику робіт конференції Reproducibility track of the ACM RecSys і доступний на сервері препринтів Корнелльського університету. Дослідники вирішили проаналізувати, в яких саме випадках БПР виконує свої завдання гірше або краще, ніж зазвичай.
В результаті вченим вдалося показати, що практична реалізація БПР часто буває досить різною і в ряді випадків, як мінімум, не оптимальною. Початкова наукова робота про БПР, що вийшла 15 років тому, хоча й отримала майже сім тисяч цитувань в інших наукових статтях, схоже, не завжди достатньо ретельно вивчалася тими, хто брався за її реалізацію. За оцінками дослідників, остаточне зниження ефективності алгоритму в реалізації може досягати 50% від максимальної, теоретично можливої, ефективності.
Автори не обмежились цим висновком. Вони також створили свою модель БПР і ретельно налаштували її гіперпараметри (так називають параметри, що налаштовуються до запуску моделі і незмінні в процесі її роботи). Потім протестували її ефективність на завданнях з реального світу. Результати виявилися вищими, ніж у інших реалізацій моделі.
Наприклад, продуктивність у точних рекомендаціях виявилася на 50% вищою, ніж у моделі з популярного опенсорс-фреймворка RecBole. Крім того, вона була на 10% вищою, ніж у моделі Mult-VAE. Зазначимо, що Mult-VAE — модель для рекомендаторних систем, основана на нейронних мережах (розробка лабораторії Netflix), і вважається одним з лідерів у галузі, якщо не беззаперечним лідером.
Порівняння ефективності для всіх моделей відбувалося за одним сценарієм на одному й тому ж наборі даних — так званому Наборі з мільйона пісень. Критерієм точності роботи моделі було те, наскільки точно перші зроблені нею 100 рекомендацій співпали з інтересами користувача, який проходив через модель.
Оскільки робота дослідників з науково-дослідної лабораторії T-Bank AI Research тепер у відкритому доступі (і є на GitHub), її можуть застосовувати розробники по всьому світу для оптимізації найрізноманітніших рекомендаторних систем. Це дозволить покупцям швидше знаходити необхідні їм товари в інтернет-магазинах, а користувачам соціальних мереж — отримувати більш осмислену видачу в стрічках новин та підписках. Як не раз зазначав Naked Science, проблеми з такими стрічками давно стали буквально бичем для безлічі сучасних людей.