• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Влияние выбора формата демонстраций для контекстуального обучения больших языковых моделей

ФИО студента: Вольф Елена Александровна

Руководитель: Хузиева Алина Эдуардовна

Кампус/факультет: Факультет компьютерных наук

Программа: Современные компьютерные науки (Магистратура)

Год защиты: 2024

В последние годы большие языковые модели (Large Language Models, LLM) получили широкое распространение и применяются для многих классов задач. В частности, этому поспособствовало их способность решать новые задачи, опираясь на несколько предоставленных примеров. Такой метод получил название ``контекстуального обучения'' (in-context learning) или ``обучения на малом числе примеров'' (few-shot learning). Однако исследователи и пользователи часто упускают один из важных аспектов — формат, в котором примеры демонстрируются модели. В данной работе было изучено влияние формата демонстраций в контекстуальном обучении на точность классификации. Проанализированы 23 больших языковых модели, размером от 770 миллионов до 70 миллиардов параметров, на 4 датасетах, часто используемых для измерения качества новых методов подбора примеров для контекстуального обучения. В работе показано, что неоптимальный выбор шаблона может ухудшать точность до уровня случайного угадывания, и, как следствие, принятый на данный момент способ измерения качества может приводить к неверной интерпретации результатов. Предложен механизм снижения нестабильности результатов — ``ансамбль шаблонов'', агрегирующий предсказания с несколькими шаблонами, — и продемонстрирована его эффективность.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ