Магистратура
2022/2023
Обработка естественного языка
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Курс по выбору (Машинное обучение и анализ данных)
Направление:
01.04.02. Прикладная математика и информатика
Кто читает:
Департамент информатики
Когда читается:
1-й курс, 3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Кольцов Сергей Николаевич
Прогр. обучения:
Машинное обучение и анализ данных
Язык:
русский
Кредиты:
3
Контактные часы:
28
Программа дисциплины
Аннотация
Является дисциплиной по выбору. Данная дисциплина направлена на овладение навыками машинной обработки естественного языка. Понимание сложных фраз на любом языке - один из необходимых компонентов развития искусственного интеллекта. В курсе будут рассмотрены как классические лингвистические подходы к задачам NLP (анализу предложений, машинному переводу и т.д.), так и современные методы, основанные на глубинном обучении. Для освоения дисциплины студентам необходимы знания, полученные в результате изучения дисциплины «Глубинное обучение».
Цель освоения дисциплины
- Формирование у студентов теоретических знаний и практических навыков по основам машинной обработки естественного языка.
Планируемые результаты обучения
- Знает основные алгоритмы NLP
- Умеет извлекать именованные сущности и определять тональность текста
- Имеет навыки применения математического аппарата и алгоритмов морфологического анализа и машинного перевода
Содержание учебной дисциплины
- Раздел 1. Морфологический анализ
- Раздел 2. Синтаксический анализ
- Раздел 3. Извлечение информации
Элементы контроля
- Домашнее задание №1Домашнее задание №1 выдается студентам в одном варианте и состоит из 3 задач. Срок выполнения домашнего задания - 4 недели. Форма представления обучающимися домашнего задания - реализованный на любом языке программирования алгоритм.
- Домашнее задание №2Домашнее задание №2 выдается студентам в одном варианте и состоит из 3 задач. Срок выполнения домашнего задания - 4 недели. Форма представления обучающимися домашнего задания - реализованный на любом языке программирования алгоритм.
- Домашнее задание №3Домашнее задание №3 выдается студентам в одном варианте и состоит из 3 задач. Срок выполнения домашнего задания - 4 недели. Форма представления обучающимися домашнего задания - реализованный на любом языке программирования алгоритм.
- Устный экзаменУстный экзамен проводится в форме ответов на вопросы экзаменационного билета. Экзаменационный билет содержит два вопроса из перечня вопросов к экзамену. Возможны дополнительные вопросы, в случае если экзаменуемый в недостаточной степени подробно ответил на вопросы билета. На подготовку ответа выделяется 2,5 часа.
Промежуточная аттестация
- 2022/2023 учебный год 3 модульПреподаватель учитывает оценку за текущий контроль (домашние задания). Онакопленная = (Од/з1 + Од/з2 + Од/з3) / 3 Результирующая оценка за дисциплину рассчитывается следующим образом: ОРезультирующая = 0,79Онакопленная + 0,21Оэкзамен
Список литературы
Рекомендуемая основная литература
- Mariani, J. (2009). Language and Speech Processing. London, UK: Wiley-ISTE. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=310778
Рекомендуемая дополнительная литература
- Biemann, C. (2012). Structure Discovery in Natural Language. Berlin: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1299312