Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2024/2025

Анализ данных

Статус: Курс обязательный (Экономика и статистика)
Направление: 38.03.01. Экономика
Когда читается: 3-й курс, 1 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 50
Охват аудитории: для своего кампуса
Преподаватели: Васильев Николай Николаевич, Карпов Максим Евгеньевич, Никитюк Михаил Андреевич
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Также будут рассмотрены темы, связанные с основами машинного обучения. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Базовый)» в SmartLMS (https://edu.hse.ru/course/view.php?id=136232).
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Использовать Python в применении к анализу данных.
  • Корректно открывать табличные данные различных форматов.
  • Фильтровать данные по нескольким условиям.
  • Сортировать данные.
  • Использовать собственноручно написанные функции для обработки данных, создания новых переменных.
  • Создавать сводные таблицы.
  • Вычислять описательные статистики и интерпретировать полученные результаты.
  • Переводить значения признака в z-оценки.
  • Обрабатывать пропущенные значения и выбросы.
  • Вычислять релевантные описательные статистики и интерпретировать полученные результаты.
  • Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты.
  • Визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой.
  • Понимать и корректно использовать основные статистические понятия.
  • Визуализировать данные с помощью различных диаграмм: тепловой карты, ящика с усами и других.
  • Создавать интерактивные визуализации.
  • Реализовывать разведочный анализ данных.
  • Уметь реализовывать все шаги проверки статистических гипотез.
  • Применять параметрические статистические критерии для проверки гипотез.
  • Применять непараметрические статистические критерии для проверки гипотез.
  • Построить уравнение линейной регрессии с использованием метода наименьших квадратов.
  • Оценивать качество модели линейной регрессии с помощью релевантных метрик.
  • Решать задачу классификации с использованием логистической регрессии и KNN.
  • Оценивать качество модели классификации с помощью релевантных метрик.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в инструменты.
  • Введение в статистику. Базовые манипуляции с данными.
  • Типы данных. Создание новых переменных.
  • Генеральная совокупность и выборка. Частотные таблицы и распределения.
  • Описательные статистики: меры центральной тенденции и разброса.
  • Z-оценка. Выбросы.
  • Корреляция.
  • Введение в визуализацию данных.
  • Продвинутая визуализация данных.
  • Введение в тестирование гипотез. Непараметрические критерии.
  • Параметрические критерии для проверки гипотез.
  • Линейная регрессия.
  • Логистическая регрессия.
  • Введение в машинное обучение.
Элементы контроля

Элементы контроля

  • неблокирующий Практика на семинаре
    Практические задания в Smart LMS с автопроверкой, дедлайн до дня перед следующим семинаром.
  • неблокирующий Мини-тесты
  • неблокирующий Контрольная работа
  • неблокирующий Проект
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 1st module
    min(0.1 * Практика на семинаре + 0.15 * Мини-тесты + 0.4 * Контрольная работа + 0.35 * Проект, 8) Согласно положению (ПОПАТКУС), итоговая оценка за дисциплину-пререквизит по цифровой компетенции к соответствующему независимому экзамену не может быть выше 8 баллов.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Elementary Statistics : A Step by Step Approach, 684 p., Bluman, A. G., 1995
  • Essentials of statistics for the behavioral sciences, Gravetter, F. J., 2014

Рекомендуемая дополнительная литература

  • Статистика и котики, Савельев, В. В., 2018

Авторы

  • Королева Анастасия Романовна
  • Карпов Максим Евгеньевич
  • Рословцева Кристина Олеговна
  • Кононова Елизавета Дмитриевна