• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Разработка алгоритмов построения пайплайнов машинного обучения методами обработки естественного языка основанными на данныхAlgorithms development for building machine learning pipelines using data–driven natural language processing

Руководитель:
Устюжанин Андрей Евгеньевич (др. работы под рук-вом)
Диссертация принята к предварительному рассмотрению:
11/28/2024
Дисс. совет:
Совет по компьютерным наукам
В диссертации рассматривается задача автоматического синтеза конвейеров машинного обучения (МО) из текстовых описаний задач на естественном языке, что является важным шагом в демократизации МО. Представлен фреймворк Linguacodus, который с использованием больших языковых моделей (БЯМ) генерирует компилируемый код из описаний задач, превосходя существующие решения по ключевым метрикам. Создан крупномасштабный корпус Code4ML, включающий 2,5 млн фрагментов кода, который в версии 2.0 дополнен методами планирования задач с использованием БЯМ, что позволило увеличить объем данных на 1,5 раза и улучшить их релевантность. Разработаны методы семантической классификации кода с применением предложенного дерева таксономии и автоматической генерации текстовых описаний задач на основе кода. Работа имеет значительную практическую ценность для автоматизации МО, предоставляя инструменты для снижения барьеров входа как для специалистов, так и для неспециалистов, и открывая перспективы для исследований и промышленного внедрения.

Публикации, в которых излагаются основные результаты диссертации



См. на ту же тему

Моделирование репродуктивного поведения россиян в периоды шоков 2000-2023 годовКандидатская диссертация

Соискатель: Горский Дмитрий Ильич
Руководитель: Вакуленко Елена Сергеевна

Приложение машинного обучения к теоретико-игровым задачам: аукционы и марковские игрыКандидатская диссертация

Соискатель: Иванов Дмитрий Игоревич
Руководитель: Нестеров Александр Сергеевич
Дата защиты: 12/27/2024

Применение глубоких генеративных моделей для задач прогнозирования в машинном обученииКандидатская диссертация

Соискатель: Баранчук Дмитрий Александрович
Руководитель: Бабенко Артем Валерьевич
Дата защиты: 12/24/2024