• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2022/2023

Основы анализа данных в Python

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс по выбору (Политология)
Направление: 41.03.04. Политология
Когда читается: 3-й курс, 1 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 24
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 3
Контактные часы: 24

Программа дисциплины

Аннотация

Дисциплина нацелена на развитие навыков обработки количественных данных в Python без углубления в математические основы и статистическую теорию. Элементы статистической теории в этом курсе используются, однако акцент делается на процедурах подготовки данных к анализу (чистка данных, фильтрация, группировка, агрегирование, элементы визуализации), а также использовании и интерпретации коэффициентов корреляции и регрессии (линейной и логистической) - наиболее широко применяемых инструментах анализа данных в социальных науках.
Цель освоения дисциплины

Цель освоения дисциплины

  • Освоение базовых инструментов анализа данных в Python. Подготовка к независимому экзамену по анализу данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • определять шкалы данных и выбирать подходящие для них способы визуализации и анализа
  • уметь вычислять описательные статистики в Python и интерпретировать их
  • уметь интерпретировать различные виды графиков
  • уметь строить доверительный интервал для доли и для среднего в Python и интерпретировать полученные интервалы
  • уметь интерпретировать статистические выдачи из Python
  • уметь проверять гипотезы о равенстве доли числу, о равенстве среднего числу и о равенстве средних средствами Python
  • уметь вычислять в Python коэффициент корреляции Пирсона и проверять его статистическую значимость
  • уметь реализовывать в Python проверку независимости признаков в качественной шкале с помощью критерия хи-квадрат Пирсона
  • уметь реализовывать в Python метод k-ближайших соседей
  • уметь оценивать в Python модель линейной регрессии и интерпретировать полученные результаты
  • уметь оценивать в Python модель логистической регрессии и интерпретировать полученные результаты
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Описательные статистики и статистический вывод
  • Корреляция
  • Визуализация
  • Линейная регрессия
  • Логистическая регрессия
Элементы контроля

Элементы контроля

  • неблокирующий Экзамен
  • неблокирующий Итоговый проект
  • неблокирующий Домашнее задание 1
  • неблокирующий Домашнее задание 2
  • неблокирующий Домашнее задание 3
  • неблокирующий Домашнее задание 4
  • неблокирующий Домашнее задание 5
  • неблокирующий Домашнее задание 6
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 1 модуль
    0.25 * Экзамен + 0.1 * Домашнее задание 6 + 0.08 * Домашнее задание 3 + 0.08 * Домашнее задание 2 + 0.08 * Домашнее задание 5 + 0.08 * Домашнее задание 4 + 0.25 * Итоговый проект + 0.08 * Домашнее задание 1
Список литературы

Список литературы

Рекомендуемая дополнительная литература

  • Голая статистика : самая интересная книга о самой скучной науке, Уилан, Ч., 2016

Авторы

  • Стукал Денис Константинович