• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Управление распределением блоков по серверам для децентрализованного инференса LLM модели в системе Petals

ФИО студента: Борисов Никита Сергеевич

Руководитель: Бабенко Максим Александрович

Кампус/факультет: Факультет компьютерных наук

Программа: Современные компьютерные науки (Магистратура)

Оценка: 8

Год защиты: 2024

В современном мире огромной популярностью пользуются большие языковые модели (LLM), которые часто имеют более 100 миллиардов параметров. Сегодня все желающие могут бесплатно загрузить предварительно обученные модели такого масштаба, однако для использования подобных моделей требуется высокотехнологичное и дорогое оборудование, недоступное многим исследователям. Одним из способов решения этой проблемы является PETALS - система для коллаборативной работы с большими NLP моделями, которая объединяет ресурсы нескольких участников в один пул. Одним из основных сценариев использования системы является инференс (вывод) обученной модели для получения предсказаний пользователями. В текущей реализации PETALS стратегия аллокации блоков, которые будет обслуживать сервер, оптимизирует вычислительную пропускную способность на каждом слое модели. Этот подход хорошо показывает себя для обучения, но не для инференса. В этой работе было проведено исследование задачи распределения блоков, оптимизирующий время клиентских запросов на инференс обученной модели. С помощью рассмотренных алгоритмов получилось ускорить вывод большой языковой модели до 1.8 раз, по сравнению с базовой стратегией в тестовом симуляторе.

Текст работы (работа добавлена 27 мая 2024 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ