Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2023/2024

Анализ данных на Python

Статус: Курс обязательный (Востоковедение)
Направление: 58.03.01. Востоковедение и африканистика
Когда читается: 3-й курс, 3 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 50
Охват аудитории: для своего кампуса
Преподаватели: Касьяненко Дарья Алексеевна, Конюшенко Юлия Николаевна, Ластовецкий Дмитрий Александрович
Язык: русский
Кредиты: 3
Контактные часы: 24

Программа дисциплины

Аннотация

Данный курс направлен на формирование компетенций у студентов в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Начальный)» в SmartLMS (https://edu.hse.ru/course/view.php?id=136231).
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимать и корректно использовать основные статистические понятия
  • Фильтровать данные по нескольким условиям
  • Создавать сводные таблицы
  • Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
  • Вычислять релевантные описательные статистики и интерпретировать полученные результаты
  • Визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой
  • Сортировать данные
  • Переводить значения признака в z-оценки
  • Обрабатывать пропущенные значения и выбросы
  • Корректно открывать табличные данные различных форматов
  • Использовать собственноручно написанные функции для обработки данных, создания новых переменных
  • Использовать Python в применении к анализу данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в инструменты
  • Введение в статистику. Базовые манипуляции с данными
  • Типы данных. Создание новых переменных
  • Генеральная совокупность и выборка. Частотные таблицы и распределения
  • Описательные статистики: меры центральной тенденции и разброса
  • Z-оценка. Выбросы
  • Корреляция
  • Введение в визуализацию данных
  • Продвинутая визуализация данных
  • Линейная регрессия
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа-1
    Контрольная, основанная на Спецификации НЭ по Анализу данных 2023-24 года начального уровня. В контрольную входит задания, аналогичные части заданий варианта НЭ (вопросы 1-9, 19 (п.2, 3), 20-22, 25. Демовариант независимого экзамена можете найти по ссылке: https://edu.hse.ru/mod/quiz/view.php?id=938269), на решение которых отводится 80 минут. Оценивается по 10-балльной шкале. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по Анализу данных: https://edu.hse.ru/course/view.php?id=133864 Если студент не может написать контрольную работу по уважительной причине, то вес контрольной работы для него переносится на экзамен.
  • неблокирующий Экзамен
    Экзамен, основанный на Спецификации НЭ по Анализу данных 2023-24 года начального уровня. В экзамен входят задания, аналогичные части заданий варианта НЭ, на решение которых отводится 120 минут. Оценивается по 10-балльной шкале. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по Анализу данных: https://edu.hse.ru/course/view.php?id=133864 Если студент не может написать экзамен по уважительной причине, то он может написать экзамен в период пересдач.
  • неблокирующий Проект
    Для каждого этапа устанавливается соответствующий дедлайн. Если группа не сдала этап работы в установленный дедлайн, то от итоговой оценки за проект отнимается 1 балл. Если вовремя не был сдан ни один из этапов проекта, то максимальная возможная оценка за проект – 5 баллов. Проект не может быть засчитан, если студент не пришел на защиту даже, если проект групповой и защищает группа без студента - непришедшему ставится ноль, или не сдал проект ДО ЗАЩИТЫ в установленное время.. В случае подозрения в несамостоятельном выполнении задания преподаватель имеет право обнулить оценку за него или провести устную защиту.
  • неблокирующий Мини-тесты
    5-10 минутные тесты, проводимые на семинарах по пройденному материалу онлайн-курса. Каждый тест оценивается по 10-балльной шкале, в итоговую оценку идет среднее всех тестов. Количество мини-тестов – 7. При пропуске форм контроля по уважительной причине (подтверждённой учебным офисом или документально лично преподавателям) студент имеет право на перерасчет итоговой оценки без пропущенных форм контроля.
  • неблокирующий Домашнее задание
    Всего 3 домашних задания за весь курс. При пропуске форм контроля по уважительной причине (подтверждённой учебным офисом или документально лично преподавателям) студент имеет право на перерасчет итоговой оценки без пропущенных форм контроля.
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 3 модуль
    Итоговая оценка: min(0,2 * КР +0.2 * Экзамен + 0.2 * Домашние задания + 0.2 * Мини-тесты на семинарах + 0.2 * Проект (групповой); 8) В соответствии с п. 69 “Положения об организации промежуточной аттестации и текущего контроля успеваемости студентов” (ПОПАТКУСа) итоговая оценка студента за дисциплину-пререквизит (ДПР) к НЭ по АД не может быть больше 8 баллов.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Elementary statistics : a step by step approach, Bluman, A. G., 2007
  • Essentials of statistics for the behavioral sciences, Gravetter, F. J., 2014

Рекомендуемая дополнительная литература

  • Статистика и котики, Савельев, В. В., 2018

Авторы

  • Карпов Максим Евгеньевич
  • Бурова Маргарита Борисовна
  • Королева Анастасия Романовна