Master
2021/2022
Text Analysis. Generative Models
Type:
Compulsory course (Financial Technologies and Data Analysis)
Area of studies:
Applied Mathematics and Informatics
Delivered by:
Big Data and Information Retrieval School
Where:
Faculty of Computer Science
When:
2 year, 1, 2 module
Mode of studies:
offline
Open to:
students of one campus
Master’s programme:
Финансовые технологии и анализ данных
Language:
English
ECTS credits:
5
Contact hours:
56
Course Syllabus
Abstract
Данная дисциплина ставит своей целью изучение основных задач и методов обработки и анализа текстов, а также освоение программных систем и инструментов, в которых реализованы данные методы. Эти базовые знания и навыки необходимы в профессиональной деятельности специалистов по анализу данных и машинного обучения.
Course Contents
- Введение
- Методы сбора и хранения данных
- Частотный анализ текстов
- Морфологический анализ и разрешение неоднозначности
- Синтаксический анализ. Универсальные зависимости
- Выделение ключевых слов и словосочетаний
- Векторная модель
- Классификация текстов
- Языковые модели
- Классификация последовательностей
- Суммаризация текстов, вопросно-ответные системы
- Исправление опечаток
- Обработка речи, речевые технологии
- Информационный поиск
- Мультимодальная обработка текстов
Assessment Elements
- Домашняя работа
- Самостоятельная работа
- Экзамен
- Домашняя работа
- Самостоятельная работа
- Экзамен
Interim Assessment
- 2021/2022 2nd module0.49 * Домашняя работа + 0.21 * Самостоятельная работа + 0.3 * Экзамен
Bibliography
Recommended Core Bibliography
- Indurkhya N., Damerau F. J. Handbook of natural language processing. – Chapman and Hall/CRC, 2010. – 704 pp.
- The Handbook of Computational Linguistics and Natural Language Processing [Электронный ресурс] / ed. by Alexander Clark, Chris Fox, Shalom Lappin; DB ebrary. – Chichester: John Wiley & Sons, 2013. – 203 p. – Режим доступа: https://ebookcentral.proquest.com/lib/hselibrary-ebooks/reader.action?docID=4035461&query=computational+linguistics
Recommended Additional Bibliography
- Perkins, J. Python Text Processing with NLTK 2.0 Cookbook: Use Python NLTK Suite of Libraries to Maximize Your Natural Language Processing Capabilities [Электронный ресурс] / Jacob Perkins; DB ebrary. – Birmingham: Packt Publishing Ltd, 2010. – 336 p.