Робот Гэри рекомендует
В ИТ-команде НИУ ВШЭ на одного робота больше. Вслед за Айзеком, в чьи обязанности входит автоматизированный учет публикаций сотрудников университета, помогать пользователям портала будет робот Гэри. Так разработчики назвали первую ML модель (модель с элементами машинного обучения), которая рекомендует пользователям новости исходя из их поведенческих метрик.
Имя досталось роботу в честь Гэри Селдона, умеющего предсказывать будущее персонажа писателя-фантаста Айзека Азимова. Нобелевский лауреат по экономике Пол Кругман однажды признался, что пришел в науку, вдохновленный историей Гэри, ученого, тонко знающего тайные пружины общества и благодаря этому имеющего возможность делать абсолютно точные предсказания.
Это гибридная модель с применением алгоритма матричной факторизации. Она учитывает текущие взаимодействия пользователя с новостями, на основе матрицы взаимодействия находит такой же паттерн поведения и ранжирует новости по весам. Модель определяет, что может быть интересно пользователю, основываясь на его истории просмотров, а именно дочитываний новостей, и сравнивает с другими пользователями, которые смотрели те же новости, плюсует рейтинги и выдает рекомендации.
Результаты предикта можно увидеть под каждой новостью в основной ленте новостей портала. Старый блок рекомендованных новостей также остался на месте, но теперь он располагается под списком, рекомендованным искусственным интеллектом.
Первые тесты показали, что модель рекомендует новости, по крайней мере, не хуже, чем традиционные алгоритмы. Теперь, когда сервис опубликован, сбор статистики будет продолжен. По мере получения обратной связи модель будет корректироваться и дообучаться, чтобы превзойти своих «ламповых» предшественников, обещает директор по порталу Дмитрий Коптюбенко.
Команда портала видит в модели своего рода «пробу пера» перед тем, как начать разрабатывать более серьезные модели. Конечная цель – научиться подбирать для пользователей, интересующихся тем или иным общедоступным контентом на портале, персонализированные образовательные продукты, будь то программа бакалавриата или дополнительного образования. Важно, что при этом не собираются персональные данные пользователей.