Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Применение глубоких нейросетевых моделей, учитывающих структурную лингвистическую информацию, в прикладных задачах анализа текстовых данныхApplication of Deep Learning Models Using Structural Linguistic Information in Applied NLP Tasks

Диссертация принята к предварительному рассмотрению:
27.03.2025
Дисс. совет:
Совет по компьютерным наукам
Диссертация исследует методы интеграции лингвистических структур, в частности, дискурсивных, в современные модели обработки естественного языка (SOTA), такие как рекурсивные нейронные сети и Трансформеры. Представлены новые архитектуры RSTRecNN и DSNDM, эффективно кодирующие дискурсивные деревья. Эти модели демонстрируют высокие результаты в задачах анализа аргументации, тональности текстов, проверки фактов и ранжирования в вопросно-ответных системах. Для задачи генерации текста (NLG) предложен подход к оценке качества дискурсивной структуры, выявивший недостатки существующих моделей. Представлены методы с использованием планирования, улучшающие дискурсивную структуру при генерации как в повествовательных текстах, так и в диалогах. Также предложена модификация архитектуры BART, учитывающая больше типов лингвистической информации, что повышает качество генерации и интерпретируемость результатов. В работе также представлена демонстрационная система, решающая задачу обсуждения научных статей, не имеющая открытых аналогов. Наконец, предложена модификация Трансформера, интегрирующая дискурсивные признаки, которая превосходит существующие подходы в детекции манипулятивного контента. В ходе исследования были собраны и опубликованы в открытом доступе несколько новых наборов данных. В целом, работа подчеркивает важность учета лингвистической информации для повышения качества современных моделей обработки естественного языка и открывает перспективные направления для их дальнейшего развития в различных NLP-задачах.

Публикации, в которых излагаются основные результаты диссертации

Chernyavskiy A., Ilvovsky D. Recursive Neural Text Classification using Discourse Tree Structure for Argumentation Mining and Sentiment Analysis Tasks (смотреть на сайте журнала)
Chernyavskiy A. Improving Text Generation via Neural Discourse Planning (смотреть на сайте журнала)


См. на ту же тему

Метафора как средство конструирования дискурса о детстве в современной англоязычной культуреКандидатская диссертация

Соискатель: Коршунова Александра Ивановна
Руководитель: Нагорная Александра Викторовна

Моделирование влияния сентимента на биржевые характеристики криптоактивовКандидатская диссертация

Соискатель: Бакланова Валерия Сергеевна
Руководитель: Теплова Тамара Викторовна

Моделирование репродуктивного поведения россиян в периоды шоков 2000-2023 годовКандидатская диссертация

Соискатель: Горский Дмитрий Ильич
Руководитель: Вакуленко Елена Сергеевна
Дата защиты: 11.06.2025