2023/2024
Прикладные задачи анализа данных
Статус:
Майнор
Когда читается:
2 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Лощилова Лариса Борисовна
Язык:
русский
Кредиты:
5
Контактные часы:
20
Программа дисциплины
Аннотация
Данный курс посвящен техникам работы с реальными данными (обработка пропусков, работа с категориальными признаками, работа с большими данными) и разбору конкретных применений анализа данных. Рассматриваются задачи анализа текстов, анализа изображений, прогнозирования спроса, кредитного скоринга, анализа социальных сетей, предсказания вероятности клика по рекламе. Каждый класс задач разбирается на примере реальных данных
Цель освоения дисциплины
- Изучение дисциплины «Прикладные задачи анализа данных» нацелено на освоение основных методов и алгоритмов прикладного анализа данных с применением языка программирования Python. Предполагается, что в результате освоения курса студенты будут способны самостоятельно решать прикладные задачи анализа данных с использованием языка программирования Python.
Планируемые результаты обучения
- Иметь навыки обработки текстов в автоматическом режиме
- Иметь навыки работы с рекомендательными системами
- Уметь анализировать сети с помощью основных характеристик
Содержание учебной дисциплины
- Тема 1. Автоматическая обработка текстов
- Тема 2. Рекомендательные системы
- Тема 3. Сетевые модели
Промежуточная аттестация
- 2023/2024 учебный год 2 модуль0.2 * Аудиторная работа + 0.4 * Домашнее задание + 0.4 * Контрольная работа
Список литературы
Рекомендуемая основная литература
- Коэльо, Л. П. Построение систем машинного обучения на языке Python / Л. П. Коэльо, В. Ричарт , перевод с английского А. А. Слинкин. — 2-е изд. — Москва : ДМК Пресс, 2016. — 302 с. — ISBN 978-5-97060-330-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/82818 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Dekking F. M. et al. A Modern Introduction to Probability and Statistics: Understanding why and how. – Springer Science & Business Media, 2005. – 488 pp.
- Manning, C. D., & Schèutze, H. (1999). Foundations of Statistical Natural Language Processing. Cambridge, Mass: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=24399
- Mirkin, B. Core concepts in data analysis: summarization, correlation and visualization. – Springer Science & Business Media, 2011. – 388 pp.