Методы оценивания языковых моделей в задачах понимания естественного языкаLanguage model evaluation in natural language understanding
Соискатель:
Руководители
Шаврина Татьяна Олеговна (др. работы под рук-вом); Воронцов Константин Вячеславович (др. работы под рук-вом)
Члены комитета:
Гращенков Павел Валерьевич (МГУ, д.фил.н., председатель комитета), Алимова Ильсеяр Салимовна (КФУ, к.т.н., член комитета), Гончарова Елизавета Фёдоровна (НИУ ВШЭ, к.комп.н., член комитета), Сметанин Сергей Игоревич (Snap Inc., к.комп.н., член комитета), Чиркова Надежда Александровна (Naver Labs Europe, к.комп.н., член комитета)
Диссертация принята к предварительному рассмотрению:
7/27/2023
Диссертация принята к защите:
9/18/2023
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
10/12/2023
В связи с бурным развитием языкового моделирования и языковых моделей на основе архитектуры «Трансформер», особую актуальность приобретают вопросы, связанные с оценкой языковых моделей и того, насколько хорошо они понимают естественный язык. Возникает необходимость в разработке методов количественного оценивания языковых моделей, а также в разработке систем тестов и инструментов, с помощью которой можно оценивать те или иные аспекты языкового моделирования и сравнивать модели между собой. В данном исследовании предложен метод оценивания устойчивости языковых моделей в задаче распознавания причинно-следственных связей. В работе разработана методология для мультиязычного оценивания моделей на пяти языках и проведено оригинальное исследование стабильности мультиязычной модели BERT в задаче распознавания причинно-следственных связей. Помимо этого, в рамках создания первого русскоязычного набора тестов на понимание естественного языка в работе представлен фреймворк для оценивания языковых моделей на данном наборе тестов, с помощью которого проведено оригинальное исследование по оцениванию ряда предобученных моделей архитектуры BERT для русского языка.
Диссертация [*.pdf, 20.69 Мб] (дата размещения 7/27/2023)
Резюме [*.pdf, 865.79 Кб] (дата размещения 7/27/2023)
Summary [*.pdf, 752.14 Кб] (дата размещения 7/27/2023)
Публикации, в которых излагаются основные результаты диссертации
Konodyuk, N. , Tikhonova, M. Continuous Prompt Tuning for Russian: How to Learn Prompts Efficiently with RuGPT3? (смотреть на сайте журнала)
Tikhonova, M., Shavrina, T., Using Generative Pretrained Transformer-3 Models for Russian News Clustering and Title Generation tasksPisarevskaya, D., Shliazhko, O. (смотреть на сайте журнала)
Fenogenova, A. , Tikhonova, M. , Mikhailov, V. , ... Malykh, V. , Artemova, E. Russian SuperGLUE 1.1: Revising the Lessons not Learned by Russian NLP-models (смотреть на сайте журнала)
Shavrina, T. , Fenogenova, A. , Emelyanov, A. , ... Chertok, A. , Evlampiev, A. RussianSuperGLUE: A Russian language understanding evaluation benchmark (смотреть на сайте журнала)
Tikhonova, M., Mikhailov, V., Pisarevskaya, D., Malykh, V. , Shavrina, T. Ad astra or astray: Exploring linguistic knowledge of multilingual BERT through NLI task (смотреть на сайте журнала)
Отзывы
Отзыв научного руководителя
- Воронцов Константин Вячеславович (дата размещения 7/27/2023)
- Шаврина Татьяна Олеговна (дата размещения 7/27/2023)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата наук (протокол №2 от 12.10.2023). Решением диссертационного совета (протокол №13 от 30.10.2023) присуждена ученая степень кандидата компьютерных наук.
См. на ту же тему
Интерпретация представления знаний в нейросетевых моделях автоматической обработки естественного языкаКандидатская диссертация
Соискатель: Сериков Олег Алексеевич
Руководитель: Бонч-Осмоловская Анастасия Александровна
Дата защиты: 6/19/2024
Эталонное тестирование языковых моделей на задачах понимания естественного языкаКандидатская диссертация
Соискатель: Михайлов Владислав Николаевич
Руководитель: Артемова Екатерина Леонидовна
Дата защиты: 8/25/2023