• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Компьютерная обработка якутских текстов с переключением кода на русский

ФИО студента: Бажуков Максим Олегович

Руководитель: Бадрызлова Юлия Геннадьевна

Кампус/факультет: Факультет гуманитарных наук

Программа: Компьютерная лингвистика (Магистратура)

Оценка: 8

Год защиты: 2024

В настоящее время ведутся активные исследования по созданию передовых моделей NLP для языков с ограниченными ресурсами. Якутский, тюркский язык на Северо-Востоке России, таковым не кажется: число говорящих на нем составляет полмиллиона, есть литература использование в Интернете. Несмотря на это, якутский слабо охвачен исследованиями в области NLP: нет больших текстовых наборов данных, нет обученных базовых моделей. Мы пытаемся внести вклад, создав набор данных веб-текстов и обучив 2 модели на основе BERT. Модели также обучены классифицировать языки в текстах с переключением кода между якутским и русским языками, что полезно для будущих исследований.

Текст работы (работа добавлена 7 июня 2024 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ