2020/2021
Data Science в клиентской и текстовой аналитике
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Факультатив
Кто читает:
Базовая кафедра компании SAS
Когда читается:
1, 2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
4
Контактные часы:
48
Программа дисциплины
Аннотация
Цель данного междисциплинарного курса – получениеcne студентами представления об особенностях задач анализа данных в бизнесе с учетом специфики разных отраслей экономики, знакомство с конкретными примерами бизнес-задач, использующих анализ клинентских данных; В рамках курса студенты и слушатели научатся при помощи визуального интерфейса ПО SAS строить прогнозные модели и делать анализ данных без написания кода.
Цель освоения дисциплины
- Целью данного факультатива является рассмотрение современных подходов, инструментов и методов интеллектуального анализа данных, применяемых в анализе клиентских данных.
- Обучение построено на изучении не только соответствующих математических моделей и алгоритмов, но и на рассмотрении примеров их реального применения в этой области. Это позволит студентам изучить весь жизненный цикл аналитической модели, начиная с этапа формирования требований,подготовки данных и заканчивая этапом внедрения/эксплуатации
- В рамках факультатива, студенты научаться обогащать информацию о клиентах с помощью текстовой аналитики на основе машинного обучения, проводить контекстно-семантический анализ и строить Lifestyle- сегментация на основе обогащенных данных из внешних источников.
Планируемые результаты обучения
- Студент способен использовать ключевые показатели эффективности и основные метрики операционной и финансовой деятельности, используемые в разных отраслях экономики, отраслевую и функциональ-ную специфику реализации задач анализа данных в бизнесе.
- СТудент способен применять математические методы и модели для решения задач анализа данных в бизнесе, возни-кающих в области клиентской аналитики, в розничных сетях продаж товаров и при анализе и оценке рисков, принципы проверки и представления результата решения этих задач.
- Студент способен оформлять и представлять свои результаты в виде бизнес-презентации.
- Студенты способны использовать программные средства загрузки, обработки, визуализации и интерактивно-го исследования онлайн данных, а также строить и применять на практике описательные и про-гнозные модели интеллектуального анализа данных и машинного обучения с использованием
- Студент способен использовать программные средства загрузки, обработки, визуализации и интерактивно-го исследования данных, а также строить и применять на практике описательные и про-гнозные модели интеллектуального анализа данных и машинного обучения с использованием
- Студенты получат знания анализа качества игроков в играх
- Студенты знают как формулировать и решать задачи , прогнозирования LTV, churn rate
- Студенты будут знать основные принципы построения прогнозных моделей в розничных рисках
- Студенты знают основные подходы построения заявочной скоринговой модели с помощью классического подхода “преобразование WoE + логистическая регрессия”
- Студенты будут знать зачем анализировать отклоненные заявки (Reject Inference)?
- Студенты будут обладать знаниями как оценивать качество моделей
- Формулировать, решать и оценивать результат решения задач анализа данных в бизнесе, возникающих в области клиентской аналитики, в розничных сетях продаж товаров и при анализе и оценке рисков и в других отраслях экономики.
- Знание актуальных задач бизнеса, для решения которых подходят методы текстовой аналитики (в т.ч. в сочетании с методами машинного обучения).
- Знание основных методов текстовой аналитики и программных инструментов, применяемых для анализа неструктурированных данных, их сильных и слабых сторон.
- Умение превращать бизнес-задачу в техническую, решаемую конкретным набором подходов и методов для анализа текста.
- Практические навыки решения задач различных индустрий методами текстовой аналитики.
- Студенты научаться правильно формилировать гепотезы и корректноопределять метрики для проведения тестирования.
- Студенты будут способны корректно оценивать результат по проведенному тестированию и правильно его интопретировать за бизнес-пользователей
Содержание учебной дисциплины
- Раздел 1. Клиентская аналитика. Тема 1. Введение в клиентскую аналитику.Цели и задачи клиентской аналитики. Понятие путешествия клиента в розничной торговле и почему важно управлять путешествием клиента в омниканальной среде. Клиентская аналитика в разных индустриях: Розница,Онлайн, Банк, Телеком и тд.. Обзор этапов развития клиентской аналитики. Решения и инструменты клиентской аналитики. Сквозной бизнес-процесс клиент-ской аналитики. Финансовое обоснование проектов.
- Раздел 1. Тема 2. Клиентская аналитика в Онлайн.Что такое онлайн-аналитика? Какие цели и задачи она решает? Сбор и обработка данных. Инструменты онлайн-аналитики. Разбор интерфейса и отчетов в Google Analytics. Сбор данных в web (метрики, цели, события, проверка отправки данных). Источники трафика, атрибуция и многоканальные последовательности.
- Раздел 1. Тема 3. Прогностическая аналитика и взаимоотношения с клиентами.Обзор существующих методов по обработке и анализа данных (Сегментация, анализ покупательских корзин, модель отклика, рекомендательная система) . Бизнес-интепретация результатов построения моделей прогнозного моделирования. Инструементы и методы анализа слабоструктурированных данных в оптимизации маркетинговых коммуникаций. Построение моделей и визуализация данных. Работа с SAS Visual Statistics: анализ качества данных, кластеризация, деревья решений, регрессия.
- Раздел 1. Тема 4. Анализ данных по клиентам в игровой индустрииЗачем играм анализ данных? Основные количественные характеристики игроков Поведение игрока. Воронки Монетизация игры Что такое LTV? Что такое АРПУ? Для чего необходимо считать churn rate? A/B тесты, зачем они нужны в играх? Задачи прогнозирования в играх. Что прогнозируем и зачем? Задачи прогнозирования в играх. Что прогнозируем и как? Примеры задач из практики
- Раздел 1. Тема 5. Анализ данных в рисках. Роль оценки рисков в управлении рисками в банковской сфере.Виды рисков. Зачем необходимо управлять рисками? Что такое кредитный риск? Управление кредитным риском. Статистика или экспертно? Подход управления кредитным риском, основанным на статистике. Требования к данным и моделям Виды моделей в кредитном анализе. Валидация моделей Построение заявочной скоринговой модели Требования к данным Анализ отклоненных заявок, зачем нужно анализировать тех, кому мы отказали в выдаче кредита? Оценка качества моделей. Основные метрики
- Раздел 1. Тема 6. Оптимизация маркетинговых кампаний для повышения отклика и увеличения прибылиОписания концепции и разработки комплекса предиктивных моделей. Анализ бизнес ограничений, демонстрирующий зависимость прибыли от изменения доступности ограниченного ресурса (sensitivity-анализ). Процессы управления кампаниями с использованием оптимизации.
- Раздел 2. ТЕКСТОВАЯ АНАЛИТИКА Тема 1. Бизнес-задачи текстовой аналитикиОбзор задач бизнеса, которые решаются с помощью классификации текстов или извлечения фактов из неструктурированных данных (отчетов, пользовательских отзывов, новостей и т.д.). Рассмотрение индустрий, где такие задачи встречаются.
- Раздел 2. Тема 2. Инструменты и методы текстовой аналитикиОбзор методов обработки текста и извлечения знаний из неструктурированных данных. Обзор программных продуктов: свободного ПО, библиотек Python и SAS Viya, которые эти методы реализуют.
- Раздел 2. Тема 3. Текстовая аналитика в деле: банки и телекомРазбор кейсов в сфере банковских учреждения и операторов сотовой связи: исследование пользовательского опыта, анализ событий.
- Раздел 2. Тема 4. Текстовая аналитика в деле: образование и закупкиРазбор кейсов в сфере образования и закупок: классификация ответов учеников и объектов медицинских закупок.
- Раздел 2. Тема 5. Текстовая аналитика в деле: ритейлРазбор кейсов в сфере ритейла: анализ отзывов потребителей, юридических документов.
- Раздел 3. Техника создания эффективной презентацииОбщие принципы построения эффективных презентаций на основе данных и презентация результатов моделирования. Практическое занятие: разбор часных ошибок при создании презентаций и практический мастер-класс по созданию презентаций.
- Раздел 4. Data driven-культура и A/B- тестыЧто такое data driven - подход? Описание этапов принятия решения при Data driven -подходе. Описание шагов по a/b -тестированию. RoadMap. Описание частых ошибок при проведении a/b-теста. Интерпретация результатов тестирования и статистическая значимость.
Элементы контроля
- Контрольная работа №1
- Контрольная работа №2
- Экзамен в формате теста с вариантами ответов.Экзамен проводится дистанционно в формате компьютерного теста. Ссылка на тест будет выслана студентам перед началом экзамена.
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.4 * Контрольная работа №1 + 0.4 * Контрольная работа №2 + 0.2 * Экзамен в формате теста с вариантами ответов.
Список литературы
Рекомендуемая основная литература
- Digital Marketing : Strategy, Implementation and Practice, 5th ed., XXIX, 698 p., Chaffey, D., Ellis-Chadwick, F., 2012
- Elements of financial risk management, Christoffersen, P. F., 2012
- Google Analytics для профессионалов : пер. с англ, Клифтон Б., 2013
- Marketing in practice, учебно-методическое пособие для студентов 2 курса специальности "Маркетинг", 57 с., Березина, Н. Е., Мартынова, Н. А., 2004
- Speech and language processing. An introduction to natural language processing, computational lin..., Jurafsky, D., 2009
- Введение в методы байесовского статистического вывода, Хей, Дж., 1987
- Геймификация в бизнесе : как пробиться сквозь шум и завладеть вниманием сотрудников и клиентов, Зикерманн, Г., 2014
- Глубокое обучение на Python, Шолле, Ф., 2019
- Глубокое обучение с точки зрения практика, Паттерсон, Дж., 2018
- Как работает Google, Шмидт, Э., 2015
- Основы Data Science и Big data : Python и наука о данных, Силен, Д., 2017
- Прикладная и компьютерная лингвистика, коллективная монография, под ред. И. С. Николаева, О. В. Митрениной, Т. М. Ландо, 2-е изд., 315 с., , 2017
- Продажи. Кн.6: Привлечение и удержание клиентов, работа с рекламациями : формирование контингента покупателей, постоянные клиенты : пер. с нем., Кюппер В., Врублевская Н.А., 2000
- Риски в бизнесе, менеджменте и маркетинге, Абчук, В. А., 2006
- Стратегия цифрового маркетинга : интегрированный подход к онлайн - маркетингу, Кингснорт, C., 2019
- Теоретический минимум по Big Data : все, что нужно знать о больших данных, Ын, А., 2019
Рекомендуемая дополнительная литература
- E-mail маркетинг работает ! Как продавать больше, используя один из мощнейших маркетинговых инстр..., Бэгготт, К., 2008
- Event - маркетинг : все об организации и продвижении событий, Франкель, Н., 2019
- Банковские риски, Севрук, В. Т., 1994
- Введение в специальность (Маркетинг. Часть I) : учебно - метод. пособие по дисциплине, Шафранская И.Н., 2007
- Мастерство презентации : как создавать презентации, которые могут изменить мир, Каптерев, А., 2013
- Прицельный маркетинг : новые правила привлечения и удержания клиентов, Забин, Дж., 2006
- Риск-менеджмент, учебно-методическое пособие, 77 с., Вайсблат, Б. И., 2004
- Эффективные программы лояльности : как привлечь и удержать клиентов, Васин, Ю. В., 2004