Бакалавриат
2022/2023
Основы анализа данных в Python
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Политология)
Направление:
41.03.04. Политология
Кто читает:
Кафедра высшей математики
Где читается:
Факультет социальных наук
Когда читается:
3-й курс, 1 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
24
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Контактные часы:
24
Программа дисциплины
Аннотация
Дисциплина нацелена на развитие навыков обработки количественных данных в Python без углубления в математические основы и статистическую теорию. Элементы статистической теории в этом курсе используются, однако акцент делается на процедурах подготовки данных к анализу (чистка данных, фильтрация, группировка, агрегирование, элементы визуализации), а также использовании и интерпретации коэффициентов корреляции и регрессии (линейной и логистической) - наиболее широко применяемых инструментах анализа данных в социальных науках.
Цель освоения дисциплины
- Освоение базовых инструментов анализа данных в Python. Подготовка к независимому экзамену по анализу данных.
Планируемые результаты обучения
- определять шкалы данных и выбирать подходящие для них способы визуализации и анализа
- уметь вычислять описательные статистики в Python и интерпретировать их
- уметь интерпретировать различные виды графиков
- уметь строить доверительный интервал для доли и для среднего в Python и интерпретировать полученные интервалы
- уметь интерпретировать статистические выдачи из Python
- уметь проверять гипотезы о равенстве доли числу, о равенстве среднего числу и о равенстве средних средствами Python
- уметь вычислять в Python коэффициент корреляции Пирсона и проверять его статистическую значимость
- уметь реализовывать в Python проверку независимости признаков в качественной шкале с помощью критерия хи-квадрат Пирсона
- уметь реализовывать в Python метод k-ближайших соседей
- уметь оценивать в Python модель линейной регрессии и интерпретировать полученные результаты
- уметь оценивать в Python модель логистической регрессии и интерпретировать полученные результаты
Содержание учебной дисциплины
- Описательные статистики и статистический вывод
- Корреляция
- Визуализация
- Линейная регрессия
- Логистическая регрессия
Элементы контроля
- Экзамен
- Итоговый проект
- Домашнее задание 1
- Домашнее задание 2
- Домашнее задание 3
- Домашнее задание 4
- Домашнее задание 5
- Домашнее задание 6
Промежуточная аттестация
- 2022/2023 учебный год 1 модуль0.25 * Экзамен + 0.1 * Домашнее задание 6 + 0.08 * Домашнее задание 3 + 0.08 * Домашнее задание 2 + 0.08 * Домашнее задание 5 + 0.08 * Домашнее задание 4 + 0.25 * Итоговый проект + 0.08 * Домашнее задание 1