• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2022/2023

Введение в Data Science

Статус: Курс обязательный (Маркетинг и рыночная аналитика)
Направление: 38.03.02. Менеджмент
Когда читается: 2-й курс, 4 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 50
Охват аудитории: для своего кампуса
Преподаватели: Бурова Маргарита Борисовна, Волкова Анастасия Эдуардовна, Гриднев Макар Дмитриевич, Дубенюк Анна Антоновна, Калашников Александр Юрьевич, Корпачев Сергей Сергеевич, Косакин Даниил Юрьевич, Пак Марина Александровна, Панов Петр Алексеевич, Перевышина Татьяна Олеговна, Седашов Данила Михайлович, Сусла Диана Михайловна
Язык: русский
Кредиты: 3
Контактные часы: 28

Программа дисциплины

Аннотация

Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательных программ «Управление бизнесом», «Маркетинг и рыночная аналитика» и «Управление цепями поставок и бизнес-аналитика» и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Также будут рассмотрены темы, связанные с основами машинного обучения.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимать и корректно использовать основные статистические понятия
  • Фильтровать данные по нескольким условиям
  • Создавать сводные таблицы
  • Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
  • Вычислять релевантные описательные статистики и интерпретировать полученные результаты
  • Уметь реализовывать все шаги проверки статистических гипотез
  • Применять параметрические статистические критерии для проверки гипотез
  • Применять непараметрические статистические критерии для проверки гипотез
  • Создавать интерактивные визуализации
  • Сортировать данные
  • Переводить значения признака в z-оценки
  • Обрабатывать пропущенные значения и выбросы
  • Строить уравнение линейной регрессии с использованием метода наименьших квадратов
  • Оценивать качество модели линейной регрессии с помощью релевантных метрик
  • Оценивать качество модели классификации с помощью релевантных метрик
  • Корректно открывать табличные данные различных форматов
  • Использовать собственноручно написанные функции для обработки данных, создания новых переменных
  • Вычислять описательные статистики и интерпретировать полученные результаты
  • Использовать Python в применении к анализу данных
  • Визуализировать данные с помощью различных диаграмм: тепловой карты, ящика с усами и других
  • Реализовывать разведочный анализ данных
  • Решать задачу классификации с использованием логистической регрессии и KNN
Содержание учебной дисциплины

Содержание учебной дисциплины

  • 1. Введение в инструменты
  • 2. Введение в статистику. Базовые манипуляции с данными
  • 3. Типы данных. Создание новых переменных
  • 4. Генеральная совокупность и выборка. Частотные таблицы и распределения
  • 5. Описательные статистики: меры центральной тенденции и разброса
  • 6. Z-оценка. Выбросы
  • 7. Корреляция
  • 8. Введение в визуализацию данных
  • 9. Продвинутая визуализация данных
  • 10. Введение в тестирование гипотез. Непараметрические критерии
  • 11. Параметрические критерии для проверки гипотез
  • 12. Линейная регрессия
  • 13. Логистическая регрессия
  • 14. Введение в машинное обучение
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа 1
    *Если ваш курс проходит в онлайн формате, то все контрольные мероприятия осуществляются в формате "ОНЛАЙН С ПРОКТОРИНГОМ" Контрольная, основанная на Спецификации НЭ по Анализу данных 2022-23 года базового уровня. В контрольную входит задания, аналогичные части заданий варианта НЭ, на решение которых отводится 60 минут. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по анализу данных Подлежит обязательной пересдаче при ликвидации академической задолженности. Синхронный элемент контроля. Контрольные: жёсткий дедлайн.
  • неблокирующий Домашнее задание
    *В случае выявления элементов списывания домашней работы возможна устная защита. Всего будет 4 домашних задания, итоговая оценка вычисляется как среднее по всем домашним заданиям. Асинхронный элемент контроля. Домашние задания: дедлайн + поздний дедлайн со штрафом 1 балл каждый день
  • неблокирующий Тест
    *Если ваш курс проходит в онлайн формате, то все контрольные мероприятия осуществляются в формате "ОНЛАЙН С ПРОКТОРИНГОМ" Всего будет 4 теста. Резервных дней для написания теста нет. В случае пропуска по уважительной причине можно написать удаленно или перераспределить вес на другие тесты. Синхронный элемент контроля. 5-10 минутные тесты, проводимые на семинарах по пройденному материалу онлайн-курса.
  • неблокирующий Контрольная работа 2
    *Если ваш курс проходит в онлайн формате, то все контрольные мероприятия осуществляются в формате "ОНЛАЙН С ПРОКТОРИНГОМ" Контрольная, основанная на Спецификации НЭ по Анализу данных 2022-23 года базового уровня. В контрольную входит задания, аналогичные части заданий варианта НЭ, на решение которых отводится 60 минут. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по Анализу данных Подлежит обязательной пересдаче при ликвидации академической задолженности. Синхронный элемент контроля. Контрольные: жёсткий дедлайн.
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.25 * Тест + 0.25 * Домашнее задание + 0.25 * Контрольная работа 1 + 0.25 * Контрольная работа 2
Список литературы

Список литературы

Рекомендуемая основная литература

  • Frederick J Gravetter, Lori-Ann B. Forzano, & Tim Rakow. (2021). Research Methods For The Behavioural Sciences, Edition 1. Cengage Learning.

Рекомендуемая дополнительная литература

  • Frederick J Gravetter, Larry B. Wallnau, Lori-Ann B. Forzano, & James E. Witnauer. (2020). Essentials of Statistics for the Behavioral Sciences, Edition 10. Cengage Learning.

Авторы

  • Королева Анастасия Романовна
  • Рословцева Кристина Олеговна
  • Кононова Елизавета Дмитриевна