Бакалавриат
2022/2023




Python для анализа данных
Статус:
Курс обязательный (Культурология)
Направление:
51.03.01. Культурология
Где читается:
Факультет гуманитарных наук
Когда читается:
2-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
50
Охват аудитории:
для всех
Преподаватели:
Перевышина Татьяна Олеговна
Язык:
русский
Кредиты:
3
Контактные часы:
30
Программа дисциплины
Аннотация
На сегодняшний день Python является стандартом индустрии для анализа данных. По окончании этого курса, студенты получат в свое распоряжение набор аналитических инструментов, которые им пригодятся как в академии, так и при работе в частном или государственном секторе. Целью этого курса является развитие навыков программирования и создание крепкой практической базы для анализа и презентации данных. С использованием онлайн-курса "Python для извлечения и обработки данных" (URL: https://www.coursera.org/learn/python-kak-inostrannyj).
Цель освоения дисциплины
- Развитие и закрепление навыков программирования на языке Python.
- Формирование и развитие навыков работы со специализированными библиотеками для обработки, визуализации и анализа данных (pandas, numpy, plotly, matplotlib, seaborn).
- Развитие навыков работы с данными: обработка, визуализация, разведывательный анализ.
- Знакомство с задачами линейной и логистической регрессии
- Развитие навыков постановки исследовательской задачи и тестирования гипотез с помощью количественных методов
Планируемые результаты обучения
- Выбирает корректные графики для визуализации данных
- Выбирает правильный тип визуализации для решения конкретной задачи
- Загружает данные в pandas и работает с ними (фильтрация, агрегация, заполнение пропущенных значений)
- Настраивает внешний вид графиков в библиотеках Python для визуализации
- Определяет тип задачи регрессии, умеет составлять уравнение регрессии
- Подсчитывает описательные статистики, оценивает распределения, интерпретирует корреляции
- Проводит разведывательный анализ данных
- Проводит разведывательный анализ данных с помощью визуализаций
- Разбирается в выборе линейной модели для обучения, используя библиотеки Python
- Уверенно пользуется языком Python для решения аналитических задач
- Умеет подсчитывать и интерпретировать метрики качества для задачи регрессии
Содержание учебной дисциплины
- Основы программирования в Python
- Введение в анализ данных на Python
- Визуализация данных
- Линейная/логистическая регрессия
Промежуточная аттестация
- 2022/2023 учебный год 4 модуль0.25 * ДЗ1 + 0.2 * Активность + 0.3 * СР + 0.25 * ДЗ2
Список литературы
Рекомендуемая основная литература
- Muller, A. C., & Guido, S. (2017). Introduction to machine learning with Python: a guide for data scientists. O’Reilly Media. (HSE access: http://ebookcentral.proquest.com/lib/hselibrary-ebooks/detail.action?docID=4698164)
Рекомендуемая дополнительная литература
- Mirkin, B. Core concepts in data analysis: summarization, correlation and visualization. – Springer Science & Business Media, 2011. – 388 pp.
- Miroslav Kubat. An Introduction to Machine Learning. Springer, 2015 (296 pages) ISBN: 9783319200095: — Текст электронны // ЭБС books24x7 — https://library.books24x7.com/toc.aspx?bookid=117295
- Мастицкий, С. Э. Визуализация данных с помощью ggplot2 / С. Э. Мастицкий. — Москва : ДМК Пресс, 2017. — 222 с. — ISBN 978-5-97060-470-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/107895 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Основы алгоритмизации и программирования на Python : учеб. пособие / С.Р. Гуриков. — М. : ФОРУМ : ИНФРА-М, 2019. — 343 с. — (Среднее профессиональное образование). - Режим доступа: http://znanium.com/catalog/product/970143
- Северенс, Ч. Введение в программирование на Python : учебное пособие / Ч. Северенс. — 2-е изд. — Москва : ИНТУИТ, 2016. — 231 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100703 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.