Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Диссертации, представленные на защиту и подготовленные в НИУ ВШЭ

Сортировка:по дате защитыпо имени научного руководителяпо имени соискателя

Показаны работы: 1 - 1 из 1

Лингвистическая интерпретация и оценка векторных моделей слов русского языкаКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Шаврина Татьяна Олеговна
Дисс. совет:
Совет по филологии
Дата защиты:
13.05.2022
Предлагаемая диссертация посвящена разработке методик лингвистической интерпретации и оценки векторных моделей слов для русского языка. Векторные модели слов и текстов являются базовой компонентой современных механизмов автоматического анализа текста и задействованы в широком ряде задач, как прикладных, так и теоретических, в частности, в задаче статистического моделирования языка. В качестве основного инструмента оценки качества такого моделирования языка и общей интеллектуальности моделей выступают корпуса языковых тестов. Корпуса являются самым доступным способом обучения векторных моделей и одновременно обладают высокой вариативностью, необходимой для формулировки интеллектуальных задач. В работе приводится обзор актуальной методологии обучения и тестирования интеллектуальных систем, в которых векторные модели слов и текстов являются объектами исследований. Впервые представляется набор корпусов и инструментов оценки для русскоязычных векторных моделей слов и текстов. Набор корпусов формирует т.н. бенчмарк, то есть позволяет выстроить общий рейтинг качества векторных моделей для русского языка одновременно на множестве задач. К настоящему времени с помощью представляемого бенчмарка было оценено 1530 моделей. Для каждой из них проведена оценка качества выполнения интеллектуальных задач и подверженности различным типам ошибок, а также устойчивости модели к разнообразным языковым явлениям.
Диссертация [*.pdf, 3.44 Мб] (дата размещения 2.03.2022)
Резюме [*.pdf, 436.97 Кб] (дата размещения 2.03.2022)
Summary [*.pdf, 371.60 Кб] (дата размещения 2.03.2022)
  • Сбросить фильтры