2024/2025
Анализ текстов. Генеративные модели
Статус:
Маго-лего
Когда читается:
1, 2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
6
Контактные часы:
56
Программа дисциплины
Аннотация
Данная дисциплина ставит своей целью изучение основных задач и методов обработки и анализа текстов, а также освоение программных систем и инструментов, в которых реализованы данные методы. Эти базовые знания и навыки необходимы в профессиональной деятельности специалистов по анализу данных и машинного обучения.
Содержание учебной дисциплины
- Введение
- Методы сбора и хранения данных
- Частотный анализ текстов
- Морфологический анализ и разрешение неоднозначности
- Синтаксический анализ. Универсальные зависимости
- Лексический анализ. Выделение ключевых слов и словосочетаний. Исправление опечаток
- Векторная модель
- Классификация текстов
- Классификация последовательностей
- Языковое моделирование
- Машинный перевод. Трансформеры
- Предобученные модели
- Большие языковые модели
- Инструктивное дообучение и обучение с подкрепление на основе обратной связи от людей
- Суммаризация текстов, вопросно-ответные системы
- Информационный поиск
- Мультимодальная обработка текстов
Список литературы
Рекомендуемая основная литература
- Ian Goodfellow and Yoshua Bengio and Aaron Courville. Deep Learning, 2016. URL: http://www.deeplearningbook.org
- Indurkhya N., Damerau F. J. Handbook of natural language processing. – Chapman and Hall/CRC, 2010. – 704 pp.
Рекомендуемая дополнительная литература
- Goldberg, Y. (2015). A Primer on Neural Network Models for Natural Language Processing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.6454221A
- The Handbook of Computational Linguistics and Natural Language Processing [Электронный ресурс] / ed. by Alexander Clark, Chris Fox, Shalom Lappin; DB ebrary. – Chichester: John Wiley & Sons, 2013. – 203 p. – Режим доступа: https://ebookcentral.proquest.com/lib/hselibrary-ebooks/reader.action?docID=4035461&query=computational+linguistics