Бакалавриат
2022/2023




Анализ данных в Python
Статус:
Курс обязательный (Философия)
Направление:
47.03.01. Философия
Где читается:
Факультет гуманитарных наук
Когда читается:
2-й курс, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
50
Охват аудитории:
для своего кампуса
Преподаватели:
Перевышина Татьяна Олеговна
Язык:
русский
Кредиты:
3
Контактные часы:
16
Программа дисциплины
Аннотация
Данный курс представляет собой адаптацию общеуниверситетского курса по программированию на Python специально для студентов образовательной программы «Философия» и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения базовых типов данных и синтаксических конструкций Python, а также анализа данных.
Дисциплина реализуется с помощью онлайн-курса Учебник по Анализу данных (начальный уровень) https://edu.hse.ru/course/view.php?id=136231
Цель освоения дисциплины
- Овладение студентами основ статистики и анализа данных для применения в решении различных практических задач.
- Получение навыков вычисления релевантных описательных статистик и интерпретация полученных результатов.
- Умение вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты.
- Умение визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой.
Планируемые результаты обучения
- Понимать и корректно использовать основные статистические понятия
- Фильтровать данные по нескольким условиям
- Создавать сводные таблицы
- Сортировать данные
- Переводить значения признака в z-оценки
- Обрабатывать пропущенные значения и выбросы
- Использовать Python в применении к анализу данных
- Корректно открывать табличные данные различных форматов
- Использовать собственноручно написанные функции для обработки данных, создания новых переменных
- Вычислять описательные статистики и интерпретировать полученные результаты
Содержание учебной дисциплины
- 1. Введение в статистику. Базовые манипуляции с данными
- 2. Типы данных. Создание новых переменных
- 3. Генеральная совокупность и выборка. Частотные таблицы и распределения
- 4. Описательные статистики: меры центральной тенденции и разброса
- 5. Выбросы и пропуски
- 6. Корреляция
- 7. Линейная регрессия
Промежуточная аттестация
- 2022/2023 учебный год 4 модуль0.2 * Тесты на семинарах + 0.25 * Контрольная работа + 0.15 * Активность на семинарах + 0.4 * Домашнее задание
Список литературы
Рекомендуемая основная литература
- Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392
Рекомендуемая дополнительная литература
- Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081