• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Анализ данных на Python

2024/2025
Учебный год
RUS
Обучение ведется на русском языке
3
Кредиты
Статус:
Курс обязательный
Когда читается:
3-й курс, 1, 2 модуль

Преподаватели

Программа дисциплины

Аннотация

Данный курс направлен на формирование компетенций у студентов в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Начальный)» в SmartLMS (https://edu.hse.ru/course/view.php?id=136231).
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимать и корректно использовать основные статистические понятия
  • Фильтровать данные по нескольким условиям
  • Создавать сводные таблицы
  • Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
  • Вычислять релевантные описательные статистики и интерпретировать полученные результаты
  • Визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой
  • Сортировать данные
  • Переводить значения признака в z-оценки
  • Обрабатывать пропущенные значения и выбросы
  • Корректно открывать табличные данные различных форматов
  • Использовать собственноручно написанные функции для обработки данных, создания новых переменных
  • Использовать Python в применении к анализу данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в инструменты
  • Введение в статистику. Базовые манипуляции с данными
  • Типы данных. Создание новых переменных
  • Генеральная совокупность и выборка. Частотные таблицы и распределения
  • Описательные статистики: меры центральной тенденции и разброса
  • Z-оценка. Выбросы
  • Корреляция
  • Введение в визуализацию данных
  • Продвинутая визуализация данных
  • Линейная регрессия
Элементы контроля

Элементы контроля

  • неблокирующий Мини-тесты
    10-15 минутные тесты, проводимые в начале лекций по пройденному материалу онлайн-курса. Каждый тест оценивается по 10-балльной шкале, в итоговую оценку идет среднее всех тестов. Множественное задание: состоит из 3 -5 оцениваемых заданий. Синхронный элемент контроля.
  • неблокирующий Контрольная работа - 1
    Проводится онлайн с демонстрацией экрана и прокторингом с двумя камерами. Контрольная, основанная на Спецификации НЭ по Анализу данных 2024-25 года начального уровня. В контрольную входит задания, аналогичные части заданий варианта НЭ, на решение которых отводится 60 минут. Оценивается по 10-балльной шкале. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по Анализу данных. Подлежит обязательной пересдаче при ликвидации академической задолженности. Синхронный элемент контроля.
  • неблокирующий Контрольная работа - 2
    Проводится онлайн с демонстрацией экрана и прокторингом с двумя камерами. Контрольная, основанная на Спецификации НЭ по Анализу данных 2024-25 года начального уровня. В контрольную входит задания, аналогичные части заданий варианта НЭ, на решение которых отводится 80 минут. Оценивается по 10-балльной шкале. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по Анализу данных. Подлежит обязательной пересдаче при ликвидации академической задолженности. Синхронный элемент контроля.
  • неблокирующий Домашнее задание
    Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Домашнее задание: асинхронный элемент контроля. Оценивается по 10-балльной шкале.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0,2ДЗ+0,25КР1+0,25КР2+0,3Мин.Тесты
Список литературы

Список литературы

Рекомендуемая основная литература

  • Elementary statistics : a step by step approach, Bluman, A. G., 2007
  • Essentials of statistics for the behavioral sciences, Gravetter, F. J., 2014

Рекомендуемая дополнительная литература

  • Статистика и котики, Савельев, В. В., 2018

Авторы

  • Королева Анастасия Романовна
  • Карпов Максим Евгеньевич
  • Бурова Маргарита Борисовна