• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2020/2021

Data Science в клиентской и текстовой аналитике

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Факультатив
Кто читает: Базовая кафедра компании SAS
Когда читается: 1, 2 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 4
Контактные часы: 48

Программа дисциплины

Аннотация

Цель данного междисциплинарного курса – получениеcne студентами представления об особенностях задач анализа данных в бизнесе с учетом специфики разных отраслей экономики, знакомство с конкретными примерами бизнес-задач, использующих анализ клинентских данных; В рамках курса студенты и слушатели научатся при помощи визуального интерфейса ПО SAS строить прогнозные модели и делать анализ данных без написания кода.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью данного факультатива является рассмотрение современных подходов, инструментов и методов интеллектуального анализа данных, применяемых в анализе клиентских данных.
  • Обучение построено на изучении не только соответствующих математических моделей и алгоритмов, но и на рассмотрении примеров их реального применения в этой области. Это позволит студентам изучить весь жизненный цикл аналитической модели, начиная с этапа формирования требований,подготовки данных и заканчивая этапом внедрения/эксплуатации
  • В рамках факультатива, студенты научаться обогащать информацию о клиентах с помощью текстовой аналитики на основе машинного обучения, проводить контекстно-семантический анализ и строить Lifestyle- сегментация на основе обогащенных данных из внешних источников.
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент способен использовать ключевые показатели эффективности и основные метрики операционной и финансовой деятельности, используемые в разных отраслях экономики, отраслевую и функциональ-ную специфику реализации задач анализа данных в бизнесе.
  • СТудент способен применять математические методы и модели для решения задач анализа данных в бизнесе, возни-кающих в области клиентской аналитики, в розничных сетях продаж товаров и при анализе и оценке рисков, принципы проверки и представления результата решения этих задач.
  • Студент способен оформлять и представлять свои результаты в виде бизнес-презентации.
  • Студенты способны использовать программные средства загрузки, обработки, визуализации и интерактивно-го исследования онлайн данных, а также строить и применять на практике описательные и про-гнозные модели интеллектуального анализа данных и машинного обучения с использованием
  • Студент способен использовать программные средства загрузки, обработки, визуализации и интерактивно-го исследования данных, а также строить и применять на практике описательные и про-гнозные модели интеллектуального анализа данных и машинного обучения с использованием
  • Студенты получат знания анализа качества игроков в играх
  • Студенты знают как формулировать и решать задачи , прогнозирования LTV, churn rate
  • Студенты будут знать основные принципы построения прогнозных моделей в розничных рисках
  • Студенты знают основные подходы построения заявочной скоринговой модели с помощью классического подхода “преобразование WoE + логистическая регрессия”
  • Студенты будут знать зачем анализировать отклоненные заявки (Reject Inference)?
  • Студенты будут обладать знаниями как оценивать качество моделей
  • Формулировать, решать и оценивать результат решения задач анализа данных в бизнесе, возникающих в области клиентской аналитики, в розничных сетях продаж товаров и при анализе и оценке рисков и в других отраслях экономики.
  • Знание актуальных задач бизнеса, для решения которых подходят методы текстовой аналитики (в т.ч. в сочетании с методами машинного обучения).
  • Знание основных методов текстовой аналитики и программных инструментов, применяемых для анализа неструктурированных данных, их сильных и слабых сторон.
  • Умение превращать бизнес-задачу в техническую, решаемую конкретным набором подходов и методов для анализа текста.
  • Практические навыки решения задач различных индустрий методами текстовой аналитики.
  • Студенты научаться правильно формилировать гепотезы и корректноопределять метрики для проведения тестирования.
  • Студенты будут способны корректно оценивать результат по проведенному тестированию и правильно его интопретировать за бизнес-пользователей
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Раздел 1. Клиентская аналитика. Тема 1. Введение в клиентскую аналитику.
    Цели и задачи клиентской аналитики. Понятие путешествия клиента в розничной торговле и почему важно управлять путешествием клиента в омниканальной среде. Клиентская аналитика в разных индустриях: Розница,Онлайн, Банк, Телеком и тд.. Обзор этапов развития клиентской аналитики. Решения и инструменты клиентской аналитики. Сквозной бизнес-процесс клиент-ской аналитики. Финансовое обоснование проектов.
  • Раздел 1. Тема 2. Клиентская аналитика в Онлайн.
    Что такое онлайн-аналитика? Какие цели и задачи она решает? Сбор и обработка данных. Инструменты онлайн-аналитики. Разбор интерфейса и отчетов в Google Analytics. Сбор данных в web (метрики, цели, события, проверка отправки данных). Источники трафика, атрибуция и многоканальные последовательности.
  • Раздел 1. Тема 3. Прогностическая аналитика и взаимоотношения с клиентами.
    Обзор существующих методов по обработке и анализа данных (Сегментация, анализ покупательских корзин, модель отклика, рекомендательная система) . Бизнес-интепретация результатов построения моделей прогнозного моделирования. Инструементы и методы анализа слабоструктурированных данных в оптимизации маркетинговых коммуникаций. Построение моделей и визуализация данных. Работа с SAS Visual Statistics: анализ качества данных, кластеризация, деревья решений, регрессия.
  • Раздел 1. Тема 4. Анализ данных по клиентам в игровой индустрии
    Зачем играм анализ данных? Основные количественные характеристики игроков Поведение игрока. Воронки Монетизация игры Что такое LTV? Что такое АРПУ? Для чего необходимо считать churn rate? A/B тесты, зачем они нужны в играх? Задачи прогнозирования в играх. Что прогнозируем и зачем? Задачи прогнозирования в играх. Что прогнозируем и как? Примеры задач из практики
  • Раздел 1. Тема 5. Анализ данных в рисках. Роль оценки рисков в управлении рисками в банковской сфере.
    Виды рисков. Зачем необходимо управлять рисками? Что такое кредитный риск? Управление кредитным риском. Статистика или экспертно? Подход управления кредитным риском, основанным на статистике. Требования к данным и моделям Виды моделей в кредитном анализе. Валидация моделей Построение заявочной скоринговой модели Требования к данным Анализ отклоненных заявок, зачем нужно анализировать тех, кому мы отказали в выдаче кредита? Оценка качества моделей. Основные метрики
  • Раздел 1. Тема 6. Оптимизация маркетинговых кампаний для повышения отклика и увеличения прибыли
    Описания концепции и разработки комплекса предиктивных моделей. Анализ бизнес ограничений, демонстрирующий зависимость прибыли от изменения доступности ограниченного ресурса (sensitivity-анализ). Процессы управления кампаниями с использованием оптимизации.
  • Раздел 2. ТЕКСТОВАЯ АНАЛИТИКА Тема 1. Бизнес-задачи текстовой аналитики
    Обзор задач бизнеса, которые решаются с помощью классификации текстов или извлечения фактов из неструктурированных данных (отчетов, пользовательских отзывов, новостей и т.д.). Рассмотрение индустрий, где такие задачи встречаются.
  • Раздел 2. Тема 2. Инструменты и методы текстовой аналитики
    Обзор методов обработки текста и извлечения знаний из неструктурированных данных. Обзор программных продуктов: свободного ПО, библиотек Python и SAS Viya, которые эти методы реализуют.
  • Раздел 2. Тема 3. Текстовая аналитика в деле: банки и телеком
    Разбор кейсов в сфере банковских учреждения и операторов сотовой связи: исследование пользовательского опыта, анализ событий.
  • Раздел 2. Тема 4. Текстовая аналитика в деле: образование и закупки
    Разбор кейсов в сфере образования и закупок: классификация ответов учеников и объектов медицинских закупок.
  • Раздел 2. Тема 5. Текстовая аналитика в деле: ритейл
    Разбор кейсов в сфере ритейла: анализ отзывов потребителей, юридических документов.
  • Раздел 3. Техника создания эффективной презентации
    Общие принципы построения эффективных презентаций на основе данных и презентация результатов моделирования. Практическое занятие: разбор часных ошибок при создании презентаций и практический мастер-класс по созданию презентаций.
  • Раздел 4. Data driven-культура и A/B- тесты
    Что такое data driven - подход? Описание этапов принятия решения при Data driven -подходе. Описание шагов по a/b -тестированию. RoadMap. Описание частых ошибок при проведении a/b-теста. Интерпретация результатов тестирования и статистическая значимость.
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа №1
  • неблокирующий Контрольная работа №2
  • неблокирующий Экзамен в формате теста с вариантами ответов.
    Экзамен проводится дистанционно в формате компьютерного теста. Ссылка на тест будет выслана студентам перед началом экзамена.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.4 * Контрольная работа №1 + 0.4 * Контрольная работа №2 + 0.2 * Экзамен в формате теста с вариантами ответов.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Digital Marketing : Strategy, Implementation and Practice, 5th ed., XXIX, 698 p., Chaffey, D., Ellis-Chadwick, F., 2012
  • Elements of financial risk management, Christoffersen, P. F., 2012
  • Google Analytics для профессионалов : пер. с англ, Клифтон Б., 2013
  • Marketing in practice, учебно-методическое пособие для студентов 2 курса специальности "Маркетинг", 57 с., Березина, Н. Е., Мартынова, Н. А., 2004
  • Speech and language processing. An introduction to natural language processing, computational lin..., Jurafsky, D., 2009
  • Введение в методы байесовского статистического вывода, Хей, Дж., 1987
  • Геймификация в бизнесе : как пробиться сквозь шум и завладеть вниманием сотрудников и клиентов, Зикерманн, Г., 2014
  • Глубокое обучение на Python, Шолле, Ф., 2019
  • Глубокое обучение с точки зрения практика, Паттерсон, Дж., 2018
  • Как работает Google, Шмидт, Э., 2015
  • Основы Data Science и Big data : Python и наука о данных, Силен, Д., 2017
  • Прикладная и компьютерная лингвистика, коллективная монография, под ред. И. С. Николаева, О. В. Митрениной, Т. М. Ландо, 2-е изд., 315 с., , 2017
  • Продажи. Кн.6: Привлечение и удержание клиентов, работа с рекламациями : формирование контингента покупателей, постоянные клиенты : пер. с нем., Кюппер В., Врублевская Н.А., 2000
  • Риски в бизнесе, менеджменте и маркетинге, Абчук, В. А., 2006
  • Стратегия цифрового маркетинга : интегрированный подход к онлайн - маркетингу, Кингснорт, C., 2019
  • Теоретический минимум по Big Data : все, что нужно знать о больших данных, Ын, А., 2019

Рекомендуемая дополнительная литература

  • E-mail маркетинг работает ! Как продавать больше, используя один из мощнейших маркетинговых инстр..., Бэгготт, К., 2008
  • Event - маркетинг : все об организации и продвижении событий, Франкель, Н., 2019
  • Банковские риски, Севрук, В. Т., 1994
  • Введение в специальность (Маркетинг. Часть I) : учебно - метод. пособие по дисциплине, Шафранская И.Н., 2007
  • Мастерство презентации : как создавать презентации, которые могут изменить мир, Каптерев, А., 2013
  • Прицельный маркетинг : новые правила привлечения и удержания клиентов, Забин, Дж., 2006
  • Риск-менеджмент, учебно-методическое пособие, 77 с., Вайсблат, Б. И., 2004
  • Эффективные программы лояльности : как привлечь и удержать клиентов, Васин, Ю. В., 2004