• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Методы генерации литературного текста и их апробация (на материале русского рассказа)

ФИО студента: Макаров Валентин Алексеевич

Руководитель: Шерстинова Татьяна Юрьевна

Кампус/факультет: Санкт-Петербургская школа гуманитарных наук и искусств

Программа: Филология (Бакалавриат)

Оценка: 8

Год защиты: 2024

На текущем этапе развития языковых технологий за короткий срок можно сгенерировать текст, похожий на тот, что был написан человеком. Цель данной работы - посмотреть, как языковые модели справляются с задачей генерации художественного текста в жанре рассказа. В этом исследовании рассматриваются два метода генерации рассказов: использование готовых моделей архитектуры GPT: GPT-3.5 в чат-боте ChatGPT и ruGPT-3.5 в чат-боте GigaChat, а также дообучение модели ruGPT-3-Small на корпусе из рассказов и повестей авторов и на корпусе русского рассказа. Полученные результаты анализируются с использованием комбинированного подхода, при котором исследуются некоторые количественные характеристики текстов, например, средняя длина предложений, а также то, как сгенерированные рассказы оцениваются людьми. Результаты исследования показывают, что в настоящий момент в большинстве случаев еще можно определить, был ли текст сгенерирован.

Текст работы (работа добавлена 26 мая 2024 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ