• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Ускорение генерации архитектуры трансформер за счет использования контекстуальной разреженности

ФИО студента: Айтхаджаев Каримжан -

Руководитель: Вознесенская Тамара Васильевна

Кампус/факультет: Факультет компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Год защиты: 2024

Контекстуальная разреженность — это метод, при котором используется факт того, что только часть параметров модели активируется в ответ на конкретные входные данные. Это предлагает перспективный путь для снижения вычислительных затрат при сохранении высокого уровня производительности. Это исследование посвящено контекстуальной разреженности в китайских языковых моделях большого масштаба (LLM), и как это может повысить эффективность производительности без ухудшения качества генерации. Поскольку разреженность активации — это недавно открытый подход к ускорению вывода, было проведено недостаточное исследование охвата этого метода для различных LLM. Цель состоит в том, чтобы выявить, как разреженность можно стратегически использовать для повышения эффективности вывода в существующих предварительно обученных LLM. Наши результаты показывают преимущества этого метода и его применимость в китайских LLM. Также, было проведено дальнейшее исследование перспективных подходов для ускорения процесса генерации и внедрения этих моделей для их развертывания на периферийных устройствах.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ