• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

"Пробинг" больших языковых моделей в задаче генерации описания молекулы

ФИО студента: Ганеева Вероника Александровна

Руководитель: Игнатов Дмитрий Игоревич

Кампус/факультет: Факультет гуманитарных наук

Программа: Компьютерная лингвистика (Магистратура)

Год защиты: 2024

В последнее время задачи для больших языковых моделей далеко не ограничиваются обработкой естественных языков. Такие модели также используются в био- и хемоинформатике в связи с их способностью запоминать длинный контекст, что удобно для последовательностей: цепочка генома, молекула и белок могут быть представлены в виде длинной строки текста – фактически, это запись на искусственном языке. Именно по этой причине большие языковые модели успешно используются для совершенно разных задач, далеких от первоначальной цели их создания в задаче обработки естественного языка: от генерации описания молекулы до предсказания результата взаимодействия двух веществ. На первый взгляд, большие языковые модели справляются с этими задачами хорошо, однако насколько модель «знает» химический язык? Способна ли она соотнести две разных записи, относящихся к одной молекуле? Восстанавливает ли она структуры молекул где-то в скрытых слоях? В этой работе мы предлагаем возможные методы для проверки того, способна ли модель восстанавливать какие-либо структуры во внутренних слоях и ориентироваться в большей степени на химические признаки, чем на текстовые

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ