We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis

2024/2025
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Course type:
Compulsory course
When:
2 year, 1, 2 module

Instructors


Бакшук Матвей Вячеславович


Галушко Илья Николаевич


Егоров Артём Константинович


Исмаилов Исмаил Ильясович


Malkova, Ksenia


Perevyshina, Tatiana


Sumernikov, Elijah

Программа дисциплины

Аннотация

Данный курс направлен на формирование компетенций у студентов в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Начальный)» в SmartLMS (https://edu.hse.ru/course/view.php?id=136231).
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимать и корректно использовать основные статистические понятия
  • Фильтровать данные по нескольким условиям
  • Создавать сводные таблицы
  • Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
  • Вычислять релевантные описательные статистики и интерпретировать полученные результаты
  • Визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой
  • Сортировать данные
  • Переводить значения признака в z-оценки
  • Обрабатывать пропущенные значения и выбросы
  • Корректно открывать табличные данные различных форматов
  • Использовать собственноручно написанные функции для обработки данных, создания новых переменных
  • Использовать Python в применении к анализу данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в инструменты
  • Введение в статистику. Базовые манипуляции с данными
  • Типы данных. Создание новых переменных
  • Генеральная совокупность и выборка. Частотные таблицы и распределения
  • Описательные статистики: меры центральной тенденции и разброса
  • Z-оценка. Выбросы
  • Корреляция
  • Введение в визуализацию данных
  • Продвинутая визуализация данных
  • Линейная регрессия
Элементы контроля

Элементы контроля

  • неблокирующий Экзамен
  • неблокирующий Тесты на семинарах
  • неблокирующий Проект
  • неблокирующий работа на семинаре
  • неблокирующий домашние задания
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.3 * Проект + 0.25 * Тесты на семинарах + 0.3 * Экзамен + 0.1 * домашние задания + 0.05 * работа на семинаре
Список литературы

Список литературы

Рекомендуемая основная литература

  • Elementary statistics : a step by step approach, Bluman, A. G., 2007
  • Essentials of statistics for the behavioral sciences, Gravetter, F. J., 2014

Рекомендуемая дополнительная литература

  • Статистика и котики, Савельев, В. В., 2018

Авторы

  • Карпов Максим Евгеньевич
  • Королева Анастасия Романовна
  • Бакшук Матвей Вячеславович