Выявление релевантных дискурсивных признаков для решения задач анализа текстовых данныхInformative discourse feature selection for analysis of textual data
Соискатель:
Руководитель:
Члены комитета:
Бурцев Михаил Сергеевич (АНО «Институт искусственного интеллекта», кандидат физико-математических наук, председатель комитета), Митков Руслан (Вулверхэмптонский университет, PhD, член комитета), Сидоров Григорий Олегович (Национальный политехнический институт (Мехико), кандидат филологических наук, член комитета), Тутубалина Елена Викторовна (Sber AI (Институт искусственного интеллекта), кандидат физико-математических наук, член комитета), Шелманов Артем Олегович (Автономная некоммерческая организация «Институт искусственного интеллекта», кандидат технических наук, член комитета)
Диссертация принята к предварительному рассмотрению:
7/8/2022
Диссертация принята к защите:
9/2/2022 (Протокол №15)
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
9/26/2022
В настоящее время область обработки естественного языка напрямую связана с большими предобученными языковыми моделями, работающими на базе архитектуры Трансформер, которые превзошли все существующие до этого методы решения задач обработки естественного языка. Однако, подобные результаты связаны, в первую очередь, с хорошей обобщающей способностью этих моделей, обученных на больших корпусах текстов на естественном языке, а не с их пониманием лингвистической информации. Исследования показывают, что обеспечение моделей дополнительными знаниями о языке, которыми обладают лингвисты, может улучшить качество решения ряда сложных задач обработки естественного языка, например, позволит более точно находить ответы на вопросы в тексте, генерировать более разнообразный и логически-связанный текст. В данной работе исследуется возможность добавления информации о дискурсивной структуре текста в предобученную языковую модель BERT за счет обучения модели на новой модифицированной задаче маскированного языкового моделирования, а также за счет добавления в модель дискурсивно-обусловленного механизма внимания. Также в диссертации предлагается новый подход для интерпретации результатов работы языковых моделей посредством анализа дискурсивной структуры текста. Проведенные экспериментальные исследования показали, что дискурсивно-обогащенные модели превосходят стандартные модели при решении задач оценки аргументированности текстов, понимания прочитанного текста, а также извлечения текстовых обоснований для объяснения результатов работы моделей.
Диссертация [*.pdf, 3.21 Мб] (дата размещения 7/11/2022)
Резюме [*.pdf, 955.94 Кб] (дата размещения 7/11/2022)
Summary [*.pdf, 965.46 Кб] (дата размещения 7/11/2022)
Публикации, в которых излагаются основные результаты диссертации
Отзывы
Отзыв научного руководителя
- Отзыв научного руководителя (дата размещения 7/8/2022)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата наук (протокол № 2 от 26.09.2022). Решением диссертационного совета (протокол № 18 от 12.10.2022) присуждена ученая степень кандидата компьютерных наук.
Ключевые слова: