2022/2023
Анализ данных на Python: примеры и задачи для бизнеса
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Дисциплина общефакультетского пула
Кто читает:
Департамент экономики
Когда читается:
2, 3 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Контактные часы:
32
Программа дисциплины
Аннотация
Курс «Анализ данных на Python: примеры и задачи для бизнеса» - курс от ПАО «Газпромнефть» - партнеров ОП «Экономика», который читается для сотрудников компании. Студентам ОП Экономика предлагается прослушать этот курс и выполнить предлагаемые практические задания. Курс отличает глубокое изложение теории и ее применение для решения практических задач. После прохождения курса студенты получат навыки по определению целей, задач анализа данных, этапов проведения исследования; знание методов и инструментов анализа данных и машинного обучения и их применения в решении бизнес-задач; знания об использовании результатов анализа данных в процессе принятия решений и улучшения существующих бизнес-процессов.
Цель освоения дисциплины
- Понимание работы методов анализа данных, практический опыт применения изученных методов
Планируемые результаты обучения
- навыки работы с диаграммами
- знания и навыки применения кластерного анализа для больших данных
- знания и навыки проверки статистических гипотез для анализа больших данных
- знания и навыки применения линейного регрессионного анализа для решения практических задач по анализу больших данных
- знания и навыки прогнозирования на основе регрессионной модели с сезонными индикаторами для решения практических задач
- знания и навыки применения метола к-го ближайшего соседа для решения практических задач
- знания и навыки применения деревьев классификации CART для анализа больших данных
Содержание учебной дисциплины
- Визуализация, описательные статистики.
- Кластерный анализ.
- Проверка статистических гипотез.
- Линейный регрессионный анализ.
- Прогнозирование на основе регрессионной модели с сезонными индикаторными (фиктивными, структурными) переменными.
- Метод к-го ближайшего соседа.
- Деревья классификации CART.
Элементы контроля
- Лабораторная работа 1. Проверка гипотез.Для предлагаемого массива данных подготовить данные для анализа, сформулировать гипотезы, полезные для бизнеса, проинтерпретировать полученные результаты.
- Лабораторная работа 2. Кластеризация наблюденийДан массив данных. Подготовить данные для анализа. Проанализировать данные с помощью кластерного анализа. Обосновать количество выбранных кластеров. Проинтерпретировать полученные кластеры
- Лабораторная работа 3. Моделирование сезонных данных.Дан массив данных. Подготовить данные для анализа. Определить вид сезонности. Построить модель поведения зависимой переменной с учетом сезонного фактора. Оценить качество и предложить интерпретацию полученного результата.
Промежуточная аттестация
- 2022/2023 учебный год 3 модульОрезульт. = (О лабор.1+ О лабор.2+ О лабор.3)/3
Список литературы
Рекомендуемая основная литература
- S. Christian Albright, & Wayne L. Winston. (2019). Business Analytics: Data Analysis & Decision Making, Edition 7. Cengage Learning.
Рекомендуемая дополнительная литература
- S. Christian Albright, Wayne L. Winston, Mark Broadie, Peter Kolesar, Lawrence L. Lapin, William D. Whisler, & Jack W. Calhoun. (n.d.). Data Analysis and Decision Making, Fourth Edition. Http://Www.Cengagebrain.Com/Content/Albright76125_0538476125_01.01_toc.Pdf.