Бакалавриат
2020/2021
Машинное обучение в маркетинге на языке Python
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Маркетинг и рыночная аналитика)
Направление:
38.03.02. Менеджмент
Где читается:
Высшая школа бизнеса
Когда читается:
2-й курс, 2 модуль
Формат изучения:
с онлайн-курсом
Преподаватели:
Беднарский Роман Александрович,
Рожков Александр Геннадьевич,
Теванян Элен Арамовна,
Ульянкин Филипп Валерьевич
Язык:
русский
Кредиты:
3
Контактные часы:
30
Программа дисциплины
Аннотация
Целями освоения дисциплины «Машинное обучение в маркетинге» являются ознакомление студентов с широким перечнем маркетинговых задач и решений, стоящих перед современным маркетологом и роли инструментов машинного обучения в решении этих задач. В курсе рассматриваются задачи в сфере управления клиентской базой, портфелем продуктов компании и реализации комплекса коммуникаций; обсуждение основных источников информации, необходимой для использования аналитических инструментов машинного обучения, возможности использования открытых данных и сбора данных автоматизированными методами; изучение аналитических методов в маркетинге с использованием технологий Machine Learning; изучение инструментов визуализации и представления результатов анализа; формирование у студентов практических навыков аналитики в маркетинге. В ходе работы над задачами курса будут использованы базы данных клиентов, статистика продаж, базы данных опросов потребителей российских и зарубежных компаний.
Цель освоения дисциплины
- Изучение основных маркетинговых задач в рамках работы с клиентами: сегментация, привлечение, удержание клиентов, повторные и перекрестные продажи.
- Формирование навыков использования и изучение особенностей применения аналитических алгоритмов машинного обучения: регрессия, классификация, кластеризация, решающие деревья, случайный лес, анализ текстов, тематическое моделирование, LDA.
- Изучение основных понятий, лучших практик и регулирующих документов при работе с персональными данными и данными клиентов.
Планируемые результаты обучения
- Владение языком программирования Python на среднем уровне
- Знание техник дополнительных и перекрестных продаж онлайн и офлайн и параметров оценки их эффективности
- Владеет методами анализа: линейная регрессия, регрессионные деревья, случайный лес
- Знание каналов привлечения клиентов, проблемы баланса привлечения и удержания, основные параметры оценки привлекаемых клиентов, стратегии выбора целевых сегментов.
- Владение методами анализа данных: логистическая регрессия, kNN, решающие деревья, случайный лес.
- Знание модели “Цепочка удовлетворенность клиента – удержание – лояльность – прибыль”. Способы оценки лояльности, факторы формирования лояльности. Прогнозирование удержания клиентов. Работа с клиентами, склонными к оттоку.
- Владение методами анализа данных: метрики классификации.
- Знание понятия сегментации, критериев выделения сегментов, критерии выбора целевых сегментов. Задача сегментации для новых и существующих рынков.
- Владение методами сегментации на основе анализа данных: кластеризация, анализ текстов, тематическое моделирование, LDA.
- Знание принципов законодательного регулирования работы с персональными данными в РФ и за рубежом, и этические принципы работы с данными клиентов
Содержание учебной дисциплины
- Онлайн модуль DataCampДанная часть курса посвящена развитию навыков работы в Python, полученных студентами в ходе изучения предыдущих курсов. Основной упор делается на самостоятельные занятия в рамках online курсов на платформе DataCamp. Каждому студенту предоставляется индивидуальный доступ, логин и пароль высылаются на электронную почту @edu.hse.ru. По результатам прохождения курсов на DataCamp может быть проведена самостоятельная работа для оценки текущего уровня навыков.
- Перекрестные и дополнительные продажиВ рамках раздела рассматриваются: техники дополнительных и перекрестных продаж, практики продаж онлайн и офлайн. Параметры, влияющие на эффективность дополнительных и перекрестных продаж. Методы анализа данных: линейная регрессия, регрессионные деревья, случайный лес.
- Привлечение клиентовВ рамках раздела рассматриваются: каналы привлечения клиентов, баланс привлечения и удержания, основные параметры оценки привлекаемых клиентов, стратегии выбора целевых сегментов. Методы анализа данных: логистическая регрессия, kNN, решающие деревья, случайный лес.
- Отток и удержание клиентовВ рамках раздела рассматриваются: Цепочка удовлетворенность клиента – удержание – лояльность – прибыль. Оценки лояльности, факторы формирования лояльности. Прогнозирование удержания клиентов. Работа с клиентами, склонными к оттоку. Методы анализа данных: метрики классификации.
- Сегментация клиентовВ рамках раздела рассматриваются: понятие сегментации, критерии для выделения сегментов, критерии выбора целевых сегментов. Задача сегментации для новых и существующих рынков. Методы сегментации на основе анализа данных: кластеризация, анализ текстов, тематическое моделирование, LDA.
- Работа с данными клиентов: законодательные и этические аспектыВ рамках раздела рассматриваются: понятие персональных данных. Этические аспекты работы с персональными данными. Законодательное регулирование работы с персональными данными в РФ и в мире. Основные положения GDPR.
Элементы контроля
- Самостоятельная работаСамостоятельная работа по теме кластеризация для контроля освоения данной темы.
- Домашнее задание
- ПроектПроект по машинному обучению со сбора данных/обработки данных до расчета эффективности модели.
- Экзамен (письменный, онлайн)Экзамен проводится онлайн.
- Онлайн модуль на платформе DataCampОнлайн-курсы: 1) Manipulating DataFrames with pandas [https://www.datacamp.com/courses/manipulating-dataframes-with-pandas]; 2) Merging DataFrames with pandas [https://www.datacamp.com/courses/merging-dataframes-with-pandas]; 3) 2 главы из Supervised Learning: Classification, Regression [https://www.datacamp.com/courses/supervised-learning-with-scikit-learn]; 4) 3 главы из Data Visualization with Seaborn: Seaborn Introduction, Customizing Seaborn Plots, Additional Plot Types [https://www.datacamp.com/courses/data-visualization-with-seaborn].
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.3 * Домашнее задание + 0.06 * Онлайн модуль на платформе DataCamp + 0.18 * Проект + 0.06 * Самостоятельная работа + 0.4 * Экзамен (письменный, онлайн)
Список литературы
Рекомендуемая основная литература
- V. Kumar, Werner Reinartz (2012). Customer Relationship Management: Concept, Strategy, and Tools. Springer-Verlag Berlin Heidelberg
Рекомендуемая дополнительная литература
- Abbott, D. (2014). Applied Predictive Analytics : Principles and Techniques for the Professional Data Analyst. Indianapolis, Indiana: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=752690
- Baesens, B. (2014). Analytics in a Big Data World : The Essential Guide to Data Science and Its Applications. Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=761032