Магистратура
2020/2021
Методы анализа больших данных в исследованиях поведения покупателей
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Прикладные методы социального анализа рынков)
Направление:
39.04.01. Социология
Где читается:
Факультет социальных наук
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Управителев Филипп Александрович
Прогр. обучения:
Прикладные методы социального анализа рынков
Язык:
русский
Кредиты:
6
Контактные часы:
56
Программа дисциплины
Аннотация
Курс “Методы анализа больших данных в исследованиях поведения покупателей” предназначен для магистрантов второго года обучения и продолжает идеи и практики курса “Автоматизированный сбор больших данных в экономико-социологических исследованиях”. В курсе рассматриваются основные задачи продуктовой аналитики в IT-сфере, использующие идеи и методы больших данных. Слушатели курса ознакомятся с основными ролями и компетенциями аналитиков в IT-компаниях, научатся отвечать с помощью данных на ключевые бизнес-вопросы, стоящие перед аналитиками. Также слушатели познакомятся с возможностями применения методов машинного обучения для повышения ценности продукта - сегментации пользователей по их платежному поведению, прогнозирование оттока, прогностическая оценка окупаемости рекламных кампаний и т.д.
Цель освоения дисциплины
- Дать студентам представление об основных задачах и инструментах, стоящих перед аналитиками в современных бизнес-компаниях.
- Показать студентам возможные перспективы профессионального развития и заложить необходимые базовые навыки.
Планируемые результаты обучения
- Студенты понимают цели и задачи, которые стоят перед аналитиками в бизнес-компаниях, преимущественно IT-сферы.
- Студенты знают разные метрики активности и вовлечения пользователей, понимают их разницу, способны рассчитать метрики или нарисовать соответствующие графики.
- Студенты понимают, как высчитываются монетизационные показатели проекта, способны различать различные модели монетизации, могут оценить и проинтерпретировать lifetime value пользователя.
- Студенты понимают, как проводить АБ-тесты для новых элементов продукта: способны написать дизайн исследования, рассчитать выборку и проинтерпретировать результаты.
- Студенты понимают основные модели привлечения пользователей продукта через рекламные кампании, способны оценивать и предсказывать эффективность рекламных кампаний.
Содержание учебной дисциплины
- Введение в цели и задачи продуктовой аналитикиЛекция: Направления деятельности аналитиков: веб-аналитика, маркетинговая аналитика, продуктовая аналитика, анализ данных и машинное обучение. Основные задачи продуктовых аналитиков. Процессы и роль аналитика в продукте. Жизненный цикл продукта. Роль аналитиков на каждой этапе.
- Метрики активности и вовлечения пользователейЛекция: Оценка активности пользователей - DAU, MAU. Методы оценки удержания (retention) и оттока (churn), проблема операционализации оттока. Rolling retention, недостатки метода. Retention rate. Основные ошибки при оценке удержания. Практикумы: Подключение к базам данных. PostgreSQL, основы языка SQL. Визуализация и интерпретация DAU/MAU, значений удержания. Предсказание оттока пользователей: конструирование и отбор переменных, преобразование шкал. Качество прогностической модели.
- Основы юнит-экономики и метрики монетизации пользователейЛекция: Что такое юнит-экономика. Конверсия в целевое действие, скорость конверсии. ARPU, ARPPU, ARPDAU, структура прибыли. ROI. Основные ошибки при вычислении монетизационных метрик. Lifetime value (LTV), модели Pareto/NBD, BG/NBD, BG/BB. RFM-анализ. Понятие бизнес-модели. Практикумы: Вычисление значений конверсии. Расчет LTV. Продуктовые выводы и рекомендации на основе монетизационных метрик. Предсказание классов платящих и неплатящих пользователей. Деревья решений, случайный лес. PMML-спецификация.
- Создание и тестирование фич (feature).Лекции: Понятие фичи в разработке IT-продуктов. Понятие Unique selling proposition (USP). Задачи аналитиков при разработке фич. A/Б-тесты. Парадигмы A/Б-тестов (частотные тесты, sequential-подход, многорукие бандиты). Частые ошибки в тестировании. Размер выборки. Практикумы: Анализ ключевых фич популярных it-продуктов (Яндекс.Музыка, Авито, Twitter, Aviasales, или другие продукты на выбор студентов). Обсуждение возможных новых фич. Постановка гипотезы и построение дизайна А/Б-теста новой фичи. Определение размера выборки. Анализ и интерпретация результатов теста.
- Основы маркетинговой аналитикиИсследования рынка. Модели привлечения пользователей в IT-продукты. Рекламные площадки (Facebook Ads, Google Adwords, прочие.). Проблема атрибуции. Оценка эффективности рекламных кампаний, бенчмарки. Практикумы: Кривые LTV. Оценка окупаемости кампании на 90 день, прогнозирование с помощью линейных моделей.
Элементы контроля
- Контрольная работа 1Работа сдается в виде скрипта на R (Python или другой ЯП - по договоренности со студентом)
- Домашнее задание 1Работа сдается в виде R-markdown-файла (или же любой другой формат, предполагающий использование языков программирования, по договоренности со студентом).
- Контрольная работа 2Работа сдается в виде скрипта на R (Python или другой ЯП - по договоренности со студентом)
- Домашнее задание 2Работа сдается в виде R-markdown-файла (или же любой другой формат, предполагающий использование языков программирования, по договоренности со студентом).
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.35 * Домашнее задание 1 + 0.35 * Домашнее задание 2 + 0.1 * Контрольная работа 1 + 0.2 * Контрольная работа 2
Список литературы
Рекомендуемая основная литература
- Derya Birant. (2011). Data Mining Using RFM Analysis. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.B99B7782
- Джеймс Г., Уиттон Д., Хасти Т. - Введение в статистическое обучение с примерами на языке R - Издательство "ДМК Пресс" - 2017 - 456с. - ISBN: 978-5-97060-495-3 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93580
Рекомендуемая дополнительная литература
- Anderson, C. (2015). Creating a Data-Driven Organization : Practical Advice From the Trenches (Vol. First edition). Beijing: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1045097
- Data mining for the online retail industry: A case study of RFM model-based customer segmentation using data mining. (2012). https://doi.org/10.1057/dbm.2012.17
- Груздев А.В. - Прогнозное моделирование в IBM SPSS Statistics, R и Python: метод деревьев решений и случайный лес - Издательство "ДМК Пресс" - 2018 - 642с. - ISBN: 978-5-97060-539-4 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/123700
- Джеффри М. - Маркетинг, основанный на данных. 15 показателей, которые должен знать каждый - Издательство "Манн, Иванов и Фербер" - 2013 - 384с. - ISBN: 978-5-91657-666-5 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/62237