Магистратура
2021/2022
Анализ текстов. Генеративные модели
Статус:
Курс обязательный (Финансовые технологии и анализ данных)
Направление:
01.04.02. Прикладная математика и информатика
Где читается:
Факультет компьютерных наук
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Прогр. обучения:
Финансовые технологии и анализ данных
Язык:
английский
Кредиты:
5
Контактные часы:
56
Course Syllabus
Abstract
Данная дисциплина ставит своей целью изучение основных задач и методов обработки и анализа текстов, а также освоение программных систем и инструментов, в которых реализованы данные методы. Эти базовые знания и навыки необходимы в профессиональной деятельности специалистов по анализу данных и машинного обучения.
Course Contents
- Введение
- Методы сбора и хранения данных
- Частотный анализ текстов
- Морфологический анализ и разрешение неоднозначности
- Синтаксический анализ. Универсальные зависимости
- Выделение ключевых слов и словосочетаний
- Векторная модель
- Классификация текстов
- Языковые модели
- Классификация последовательностей
- Суммаризация текстов, вопросно-ответные системы
- Исправление опечаток
- Обработка речи, речевые технологии
- Информационный поиск
- Мультимодальная обработка текстов
Assessment Elements
- Домашняя работа
- Самостоятельная работа
- Экзамен
- Домашняя работа
- Самостоятельная работа
- Экзамен
Interim Assessment
- 2021/2022 2nd module0.49 * Домашняя работа + 0.21 * Самостоятельная работа + 0.3 * Экзамен
Bibliography
Recommended Core Bibliography
- Indurkhya N., Damerau F. J. Handbook of natural language processing. – Chapman and Hall/CRC, 2010. – 704 pp.
- The Handbook of Computational Linguistics and Natural Language Processing [Электронный ресурс] / ed. by Alexander Clark, Chris Fox, Shalom Lappin; DB ebrary. – Chichester: John Wiley & Sons, 2013. – 203 p. – Режим доступа: https://ebookcentral.proquest.com/lib/hselibrary-ebooks/reader.action?docID=4035461&query=computational+linguistics
Recommended Additional Bibliography
- Perkins, J. Python Text Processing with NLTK 2.0 Cookbook: Use Python NLTK Suite of Libraries to Maximize Your Natural Language Processing Capabilities [Электронный ресурс] / Jacob Perkins; DB ebrary. – Birmingham: Packt Publishing Ltd, 2010. – 336 p.