• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Применение моделей машинного обучения для рекомендации списка академических источников

ФИО студента: Захаров Сергей Дмитриевич

Руководитель: Кантонистова Елена Олеговна

Кампус/факультет: Факультет компьютерных наук

Программа: Машинное обучение и высоконагруженные системы (Магистратура)

Год защиты: 2024

Данная работа посвящена разработке системы для автоматизации процесса поиска и отбора академических источников с помощью методов машинного обучения. Не секрет, что в современном научном мире объем научных публикаций быстро растет, что создает большие трудности для исследователей с точки зрения поиска и отбора релевантных источников. Благодаря применению новых технологий машинного обучения для обработки естественного языка, возможно значительно ускорить и упростить этот процесс, давая исследователям больше ресурсов для работы. Основной задачей разрабатываемой системы является выдача пользователю списка релевантных научных источников в соответствии с указанным им названием его работы и краткого описания. Работа основана на данных из открытого датасета arXiv, дополненного информацией с Semantic Scholar. В работе применялись модели BERT, CatBoost и Word2Vec, каждая из которых была в той или иной степени доработана для выполняемой задачи. Применение таких моделей позволит эффективно анализировать и обрабатывать большие объемы научных работ, обеспечивая релевантность получаемых рекомендаций. Разработанная система значительно упростит процесс поиска научной литературы, повышая качество проводимых исследований и экономя время исследователей.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ