Бакалавриат
2023/2024
Современные методы анализа данных и машинного обучения
Статус:
Курс обязательный (Бизнес-информатика)
Направление:
38.03.05. Бизнес-информатика
Кто читает:
Департамент бизнес-информатики
Где читается:
Высшая школа бизнеса
Когда читается:
3-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
74
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
7
Контактные часы:
70
Программа дисциплины
Аннотация
Данный курс посвящен изучению основ анализа данных, построения визуализаций, применения продуктовых гипотез, аналитики данных, дата-инжиниринга, а также различных алгоритмов, применяемых при работе с данными и извлечении бизнес-выводов на основе них. В контексте курса делается упор на составляющую аналитики данных с подробным обсуждением специализированных библиотек для работы с данными и осуществления разведочного анализа данных, а также библиотек для применения классического и глубинного машинного обучения для реализации решаемых бизнес-задач.
Цель освоения дисциплины
- Знакомство с языком программирования Python. Уверенное владение языком на базовом уровне для решения задач аналитики. Умение применять специальные библиотеки Numpy, Pandas для анализа бизнес-данных
- Выработка навыков осуществления первичного анализа данных, построения визуализаций данных и их интерпретация
- Знакомство с основными продуктовыми гипотезами, продуктовыми метриками. Умение их применять при решении бизнес-задач на практике
- Ознакомление с принципами извлечения данных с внешних ресурсов и обработки полученных данных
- Проработка математической основы использования машинного обучения, применение линейной алгебры и математического анализа для осуществления алгоритмов
- Знакомство с машинным обучением в контексте задач классического машинного обучения без учителя
- Знакомство с машинным обучением в контексте задач классического машинного обучения с учителем
- Изучение принципов глубинного обучения и применения их на практике для решения бизнес-задач
Планируемые результаты обучения
- Владеть основами синтаксиса языка программирования Python
- Уметь писать простые программы на языке программирования Python
- Уметь применять специальные библиотеки Python для решения простых задач анализа данных
- Владеть основами синтаксиса специальных библиотек для анализа данных: Numpy, Pandas
- Владеть основами синтаксиса библиотек Matplotlib, Seaborn
- Строить простейшие визуализации данных
- Применять на практике основы EDA, осуществлять разведочный анализ данных
- Работать с интерактивными визуализациями
- Уметь вычислять и анализировать продуктовые метрики
- Уметь строить и проверять продуктовые гипотезы
- Осуществлять парсинг данных с внешних ресурсов
- Работать с API внешних ресурсов
- Уметь применять знания линейной алгебры в Python
- Уметь применять знания математического анализа в Python
- Использовать математический анализ и линейную алгебру для математического обоснования и оптимизации решений задач машинного обучения
- Уметь применять машинное обучение для решения задач анализа данных
- Дифференцировать методы машинного обучения по типам решаемых задач, метрикам качества, функциям ошибки, применять методы машинного обучения на практике
- Решать задачи кластеризации на практике с использованием методов машинного обучения
- Уметь применять нейронные сети для решения различных задач машинного обучения
Содержание учебной дисциплины
- Введение в Python и библиотеки для анализа данных
- Задачи анализа данных, аналитики, основы EDA
- Продуктовые гипотезы, продуктовые метрики
- Извлечение данных
- Математика для машинного обучения
- Классическое машинное обучение. Обучение с учителем
- Классическое машинное обучение. Обучение без учителя
- Основы глубинного обучения
Элементы контроля
- ДЗСредняя оценка за все практические домашние задания, предусмотренные на курсе
- ГПСредняя оценка за все практические групповые инициативные проекты, предусмотренные на курсе
- АктивностьОценивание посещения и активности студента на семинарах, а также активности на лекциях
- КРКонтрольная работа представляет собой проверочный элемент контроля, выполняемый студентами по результатам освоения первой половины курса
- ЭкзаменЭкзамен представляет собой практическую работу, выполняемую студентами по результатам освоения курса
Промежуточная аттестация
- 2023/2024 4th module0.14 * Активность + 0.12 * ГП + 0.28 * ДЗ + 0.14 * КР + 0.32 * Экзамен
Список литературы
Рекомендуемая основная литература
- Pandas for everyone : Python data analysis, Chen, D. Y., 2023
- Python for data analysis : data wrangling with pandas, numPy, and IPhython, Mckinney, W., 2017
- Python для data science, Васильев, Ю., 2023
- Python для сложных задач : наука о данных и машинное обучение, Плас, Дж. В., 2018
- Python для сложных задач: наука о данных и машинное обучение : пер. с англ., Плас, Дж. Вандер, 2019
- Анализ социальных медиа на Python : извлекайте и анализируйте данные из всех уголков социальной паутины на Python, Бонцанини, М., 2018
- Введение в машинное обучение с помощью Python : руководство для специалистов по работе с данными, Мюллер, А., 2018
- Дифференциальное исчисление и исследование функций многих переменных : Учебное пособие, Михайлова, И.Г., 2014
- Когнитивная бизнес-аналитика : учеб. пособие для вузов, Абдикеев, Н. М., 2012
- Линейная алгебра и функции многих переменных : учеб. пособие для физ. специальностей ун-тов, Булдырев, В. С., 1985
- Нейронные сети. Полный курс : пер. с англ., Хайкин, С., 2018
Рекомендуемая дополнительная литература
- Good charts : the HBR guide to making smarter, more persuasive data visualizations, Berinato, S., 2016
- Visualizations and dashboards for learning analytics, , 2021
- Бизнес-аналитика: от данных к знаниям : учеб. пособие, Паклин Н.Б., Орешков В.И., 2010
- Большие данные в образовании: анализ данных как основание принятия управленческих решений : сб. науч. ст. I Международной конференции, 15 окт. 2020 г., Москва, , 2020
- Интеллектуальные технологии управления. Искусственные нейронные сети и нечеткая логика, Усков, А. А., 2004
- Искусственные нейронные сети : теория и практика, Круглов, В. В., 2002
- Краткий курс математического анализа. Т.2: Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ, Кудрявцев, Л. Д., 2008
- Машинное обучение : наука и искусство построения алгоритмов, которые извлекают знания из данных, Флах, П., 2015