• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2020/2021

Машинное обучение в маркетинге на языке Python

Статус: Курс обязательный (Маркетинг и рыночная аналитика)
Направление: 38.03.02. Менеджмент
Когда читается: 2-й курс, 2 модуль
Формат изучения: с онлайн-курсом
Преподаватели: Беднарский Роман Александрович, Рожков Александр Геннадьевич, Теванян Элен Арамовна, Ульянкин Филипп Валерьевич
Язык: русский
Кредиты: 3
Контактные часы: 30

Программа дисциплины

Аннотация

Целями освоения дисциплины «Машинное обучение в маркетинге» являются ознакомление студентов с широким перечнем маркетинговых задач и решений, стоящих перед современным маркетологом и роли инструментов машинного обучения в решении этих задач. В курсе рассматриваются задачи в сфере управления клиентской базой, портфелем продуктов компании и реализации комплекса коммуникаций; обсуждение основных источников информации, необходимой для использования аналитических инструментов машинного обучения, возможности использования открытых данных и сбора данных автоматизированными методами; изучение аналитических методов в маркетинге с использованием технологий Machine Learning; изучение инструментов визуализации и представления результатов анализа; формирование у студентов практических навыков аналитики в маркетинге. В ходе работы над задачами курса будут использованы базы данных клиентов, статистика продаж, базы данных опросов потребителей российских и зарубежных компаний.
Цель освоения дисциплины

Цель освоения дисциплины

  • Изучение основных маркетинговых задач в рамках работы с клиентами: сегментация, привлечение, удержание клиентов, повторные и перекрестные продажи.
  • Формирование навыков использования и изучение особенностей применения аналитических алгоритмов машинного обучения: регрессия, классификация, кластеризация, решающие деревья, случайный лес, анализ текстов, тематическое моделирование, LDA.
  • Изучение основных понятий, лучших практик и регулирующих документов при работе с персональными данными и данными клиентов.
Планируемые результаты обучения

Планируемые результаты обучения

  • Владение языком программирования Python на среднем уровне
  • Знание техник дополнительных и перекрестных продаж онлайн и офлайн и параметров оценки их эффективности
  • Владеет методами анализа: линейная регрессия, регрессионные деревья, случайный лес
  • Знание каналов привлечения клиентов, проблемы баланса привлечения и удержания, основные параметры оценки привлекаемых клиентов, стратегии выбора целевых сегментов.
  • Владение методами анализа данных: логистическая регрессия, kNN, решающие деревья, случайный лес.
  • Знание модели “Цепочка удовлетворенность клиента – удержание – лояльность – прибыль”. Способы оценки лояльности, факторы формирования лояльности. Прогнозирование удержания клиентов. Работа с клиентами, склонными к оттоку.
  • Владение методами анализа данных: метрики классификации.
  • Знание понятия сегментации, критериев выделения сегментов, критерии выбора целевых сегментов. Задача сегментации для новых и существующих рынков.
  • Владение методами сегментации на основе анализа данных: кластеризация, анализ текстов, тематическое моделирование, LDA.
  • Знание принципов законодательного регулирования работы с персональными данными в РФ и за рубежом, и этические принципы работы с данными клиентов
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Онлайн модуль DataCamp
    Данная часть курса посвящена развитию навыков работы в Python, полученных студентами в ходе изучения предыдущих курсов. Основной упор делается на самостоятельные занятия в рамках online курсов на платформе DataCamp. Каждому студенту предоставляется индивидуальный доступ, логин и пароль высылаются на электронную почту @edu.hse.ru. По результатам прохождения курсов на DataCamp может быть проведена самостоятельная работа для оценки текущего уровня навыков.
  • Перекрестные и дополнительные продажи
    В рамках раздела рассматриваются: техники дополнительных и перекрестных продаж, практики продаж онлайн и офлайн. Параметры, влияющие на эффективность дополнительных и перекрестных продаж. Методы анализа данных: линейная регрессия, регрессионные деревья, случайный лес.
  • Привлечение клиентов
    В рамках раздела рассматриваются: каналы привлечения клиентов, баланс привлечения и удержания, основные параметры оценки привлекаемых клиентов, стратегии выбора целевых сегментов. Методы анализа данных: логистическая регрессия, kNN, решающие деревья, случайный лес.
  • Отток и удержание клиентов
    В рамках раздела рассматриваются: Цепочка удовлетворенность клиента – удержание – лояльность – прибыль. Оценки лояльности, факторы формирования лояльности. Прогнозирование удержания клиентов. Работа с клиентами, склонными к оттоку. Методы анализа данных: метрики классификации.
  • Сегментация клиентов
    В рамках раздела рассматриваются: понятие сегментации, критерии для выделения сегментов, критерии выбора целевых сегментов. Задача сегментации для новых и существующих рынков. Методы сегментации на основе анализа данных: кластеризация, анализ текстов, тематическое моделирование, LDA.
  • Работа с данными клиентов: законодательные и этические аспекты
    В рамках раздела рассматриваются: понятие персональных данных. Этические аспекты работы с персональными данными. Законодательное регулирование работы с персональными данными в РФ и в мире. Основные положения GDPR.
Элементы контроля

Элементы контроля

  • неблокирующий Самостоятельная работа
    Самостоятельная работа по теме кластеризация для контроля освоения данной темы.
  • неблокирующий Домашнее задание
  • неблокирующий Проект
    Проект по машинному обучению со сбора данных/обработки данных до расчета эффективности модели.
  • блокирующий Экзамен (письменный, онлайн)
    Экзамен проводится онлайн.
  • неблокирующий Онлайн модуль на платформе DataCamp
    Онлайн-курсы: 1) Manipulating DataFrames with pandas [https://www.datacamp.com/courses/manipulating-dataframes-with-pandas]; 2) Merging DataFrames with pandas [https://www.datacamp.com/courses/merging-dataframes-with-pandas]; 3) 2 главы из Supervised Learning: Classification, Regression [https://www.datacamp.com/courses/supervised-learning-with-scikit-learn]; 4) 3 главы из Data Visualization with Seaborn: Seaborn Introduction, Customizing Seaborn Plots, Additional Plot Types [https://www.datacamp.com/courses/data-visualization-with-seaborn].
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.3 * Домашнее задание + 0.06 * Онлайн модуль на платформе DataCamp + 0.18 * Проект + 0.06 * Самостоятельная работа + 0.4 * Экзамен (письменный, онлайн)
Список литературы

Список литературы

Рекомендуемая основная литература

  • V. Kumar, Werner Reinartz (2012). Customer Relationship Management: Concept, Strategy, and Tools. Springer-Verlag Berlin Heidelberg

Рекомендуемая дополнительная литература

  • Abbott, D. (2014). Applied Predictive Analytics : Principles and Techniques for the Professional Data Analyst. Indianapolis, Indiana: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=752690
  • Baesens, B. (2014). Analytics in a Big Data World : The Essential Guide to Data Science and Its Applications. Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=761032