• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2022/2023

Анализ данных в Python

Статус: Курс обязательный (Философия)
Направление: 47.03.01. Философия
Когда читается: 2-й курс, 4 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 50
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 3
Контактные часы: 16

Программа дисциплины

Аннотация

Данный курс представляет собой адаптацию общеуниверситетского курса по программированию на Python специально для студентов образовательной программы «Философия» и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения базовых типов данных и синтаксических конструкций Python, а также анализа данных. Дисциплина реализуется с помощью онлайн-курса Учебник по Анализу данных (начальный уровень) https://edu.hse.ru/course/view.php?id=136231
Цель освоения дисциплины

Цель освоения дисциплины

  • Овладение студентами основ статистики и анализа данных для применения в решении различных практических задач.
  • Получение навыков вычисления релевантных описательных статистик и интерпретация полученных результатов.
  • Умение вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты.
  • Умение визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимать и корректно использовать основные статистические понятия
  • Фильтровать данные по нескольким условиям
  • Создавать сводные таблицы
  • Сортировать данные
  • Переводить значения признака в z-оценки
  • Обрабатывать пропущенные значения и выбросы
  • Использовать Python в применении к анализу данных
  • Корректно открывать табличные данные различных форматов
  • Использовать собственноручно написанные функции для обработки данных, создания новых переменных
  • Вычислять описательные статистики и интерпретировать полученные результаты
Содержание учебной дисциплины

Содержание учебной дисциплины

  • 1. Введение в статистику. Базовые манипуляции с данными
  • 2. Типы данных. Создание новых переменных
  • 3. Генеральная совокупность и выборка. Частотные таблицы и распределения
  • 4. Описательные статистики: меры центральной тенденции и разброса
  • 5. Выбросы и пропуски
  • 6. Корреляция
  • 7. Линейная регрессия
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
  • неблокирующий Тесты на семинарах
  • неблокирующий Активность на семинарах
  • неблокирующий Контрольная работа
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.2 * Тесты на семинарах + 0.25 * Контрольная работа + 0.15 * Активность на семинарах + 0.4 * Домашнее задание
Список литературы

Список литературы

Рекомендуемая основная литература

  • Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392

Рекомендуемая дополнительная литература

  • Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081