• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Улучшение процесса поиска текстов для задач генерации

ФИО студента: Беляев Артём Русланович

Руководитель: Самоненко Илья Юрьевич

Кампус/факультет: Факультет компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Год защиты: 2024

В последние годы наблюдается активное развитие LLM-моделей, таких как GPT-4, LLama и Gemini. Эти модели демонстрируют выдающиеся способности в генерации полез- ных текстов, однако они также сталкиваются с проблемой галлюционирования — генерации текстов, не соответствующих действительности. Для решения этой проблемы применяется RAG-система, которая позволяет LLM ге- нерировать ответы на основе полезной информации, найденной другой моделью — retrieval- моделью. В данной работе был разработан и исследован новый метод обучения retrieval- моделей на русскоязычном корпусе текстов. В результате была создана модель, демонстрирующая более высокое качество по срав- нению с аналогами от OpenAI и классическим алгоритмом BM25. Кроме того, проведённые исследования процесса обучения такой модели позволили получить более глубокое понима- ние механизмов обучения LLM и способствуют дальнейшим открытиям в этой области.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ