Магистратура
2021/2022





Проектно-исследовательский семинар
Статус:
Курс обязательный (Компьютерная лингвистика)
Направление:
45.04.03. Фундаментальная и прикладная лингвистика
Кто читает:
Школа лингвистики
Где читается:
Факультет гуманитарных наук
Когда читается:
2-й курс, 1-3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Бонч-Осмоловская Анастасия Александровна,
Ляшевская Ольга Николаевна,
Поздняков Иван Сергеевич,
Сахарова Нина Евгеньевна,
Толдова Светлана Юрьевна
Прогр. обучения:
Компьютерная лингвистика
Язык:
русский
Кредиты:
6
Контактные часы:
42
Программа дисциплины
Аннотация
Целями освоения дисциплины «Проектирование лингвистических ресурсов и систем» являются формирование навыков по созданию лингвистических компонентов обработки текстов, формирование навыков работы в команде, формулирования и решения поставленных задач, методологически корректного построения экспериментов и исследований. Для освоения учебной дисциплины, студенты должны владеть следующими знаниями и компетенциями: • Владеть основными методами компьютерной лингвистики • Владеть технологиями и алгоритмами из курсов “Программирование”, “Машинное обучение”, “Компьютерная лингвистика”.
Цель освоения дисциплины
- Научить студентов основным принципам разработки и создания лингвистических корпусов и ресурсов; преимуществам и недостаткам формальных моделей, лежащих в основе различных модулей автоматической обработки текста; необходимым этапам морфологического анализа и проблемам, возникающим при моделировании каждого из этапов; • основным алгоритмам, используемым для построения автоматического синтаксического анализа; наиболее известным доступным для свободного использования компонентам автоматического анализа, в том числе синтаксическим и морфологическим парсерам, системам распознавания именованных сущностей (NER); принципам оценки качества таких систем.
- формирование навыков по созданию лингвистических компонентов обработки текстов
- Научить студентов проводить оценку качества систем автоматического морфологического, синтаксического и семантического анализа; использовать соответствующие модули в различных приложениях; участвовать в разработке отдельных модулей в системах автоматического анализа текстов, самостоятельно разрабатывать лингвистические ресурсы. Основные положения дисциплины должны быть использованы в дальнейшей профессиональной деятельности (дисциплина ведется на выпускном курсе).
- формирование навыков работы в команде
- умение формулировать и решать поставленные задачи
- умение методологически корректно выстраивать эксперименты и исследования
Планируемые результаты обучения
- выбор проекта, постановка задач
- знает принципы и требования к ведению проектной работы
- знакомство с литературой по теме
- пилотное исследование, разработка технического задания
- умеет критически оценивать результаты
- умеет разбираться в документации
- умеет собирать и размечать данные, обучать модель, программировать алгоритмы
- умеет тестировать алгоритмы и моделей, ставить и реализовывать задачи по улучшению алгоритмов и моделей
- знает классифицикацию одномерных сигналов, модели речевого тракта, кластеризацию акустических векторов, нейросетевые технологии обработки звучащей речи.
- знает основные методы и подходы к машинному переводу
Содержание учебной дисциплины
- Введение в проблематику проектной работы
- Введение в машинный перевод
- Проектная работа 1
- Введение в речевые технологии
- Проектная работа 2
- Проектная работа 3
Элементы контроля
- ЭкзаменПересдача может происходить не позднее, чем через две недели после оценивания, без снижения баллов. На пересдаче студенту не предоставляется возможность получить дополнительный балл для компенсации оценки за текущий контроль.
- Самостоятельная работа
- Аудиторная работа
- домашняя работа
- проект
- аудиторная работа
Промежуточная аттестация
- 2020/2021 учебный год 4 модуль0.4 * Самостоятельная работа + 0.4 * Аудиторная работа + 0.2 * Экзамен
- 2021/2022 учебный год 3 модуль0.4 * домашняя работа + 0.2 * проект + 0.4 * аудиторная работа
Список литературы
Рекомендуемая основная литература
- The Handbook of Computational Linguistics and Natural Language Processing [Электронный ресурс] / ed. by Alexander Clark, Chris Fox, Shalom Lappin; DB ebrary. – Chichester: John Wiley & Sons, 2013. – 203 p. – Режим доступа: https://ebookcentral.proquest.com/lib/hselibrary-ebooks/reader.action?docID=4035461&query=computational+linguistics
- Методы и алгоритмы обработки данных : учеб. пособие / А.А. Григорьев. — М. : ИНФРА-М, 2017. — 256 с. + Доп. материалы [Электронный ресурс; Режим доступа http://www.znanium.com]. — (Высшее образование: Бакалавриат). — www.dx.doi.org/10.12737/22119. - Режим доступа: http://znanium.com/catalog/product/545998
Рекомендуемая дополнительная литература
- The Handbook of Natural Language Processing [Электронный ресурс] / edited by Robert Dale, Hermann Moisl, Harold Somers; DB ebrary. – New York: Marcel Dekker, Inc., 2010. – XIX, 996 p. – режим доступа: https://ebookcentral.proquest.com/lib/hselibrary-ebooks/reader.action?docID=216282&query=natural+language+processing+with
- Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход / Б.Ю. Лемешко, С.Б. Лемешко, С.Н. Постовалов и др. - М.: НИЦ ИНФРА-М, 2015. - 890 с.: 60x90 1/16 ISBN 978-5-16-103267-1 (online) - Режим доступа: http://znanium.com/catalog/product/515227