We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Research and Design Seminar "Data Mining in Communication Projects"

2024/2025
Academic Year
RUS
Instruction in Russian
9
ECTS credits
Delivered at:
School of Communication
Course type:
Compulsory course
When:
1 year, 2-4 module

Instructors


Egorov, Dmitry


Коточигов Константин Львович


Nester (Nesterenko), Roman


Suvorina, Tatiana

Программа дисциплины

Аннотация

Проектно-исследовательский семинар направлен на поэтапное погружение в экосистему и аналитические методы в цифровых коммуникациях. На первом этапе студенты знакомятся с индустрией, основными трендами, кейсами, типами и источниками данных. На втором этапе студенты получают практические навыки аудиторного анализа, маркетинговой и продуктовой аналитики с использованием Python и SQL. На третьем этапе студенты применяют методы машинного обучения для обработки естественного языка, создания предиктивных моделей и рекомендательных систем при решении коммуникационных задач. Семинар также реализует функцию экспертной поддержки проектной работы студентов в рамках подготовки курсовой работы.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью дисциплины «Проектно-исследовательский семинар «Анализ данных в коммуникационных проектах» является освоение студентами аналитических и управленческих компетенций, необходимых для реализации прикладных коммуникационных проектов, основанных на данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Использует инструменты измерения и увеличения эффективности коммуникаций.
  • Представляет результаты анализа данных в формате презентации, отчета или интерактивного дэшборда ; объясняет научно-популярным языком принципы работы алгоритма, цели и задачи проекта.
  • Составляет запросы к базам данных в SQL
  • Студент выбирает методы, подходы и инструменты для решения поставленных профессиональных задач, исходя из критического анализа существующей бизнеспрактики и обзора релевантных научных исследований.
  • Считает и применяет метрики продуктовой аналитики.
  • Формулирует гипотезы и составляет план проекта на основе имеющихся данных и поставленных задач
  • Использует статистические методы для сравнения пользовательских групп и составления портрета аудитории.
  • Описывает актуальную экосистему диджитал-рынка (наполнение, ключевые игроки, функционал технических платформ).
  • Классифицирует инструменты измерения эффективности цифровых коммуникационных стратегий
  • На базовом уровне формирует коммуникационную стратегию на основе использования и анализа данных
  • Использует прикладные библиотеки Python для разработки простых рекомендательных систем
  • Отбирает признаки для предиктивной модели.
  • Выделяет аномалии в данных.
  • Разрабатывает модели машинного обучения, использующие текстовые данные.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Экосистема рекламного (digital) рынка и его эволюция.
  • Тема 2. Индикаторы эффективной коммуникации.
  • Инструменты измерения эффективности.
  • Тема 4. Инструменты увеличения эффективности.
  • Онлайн-данные.
  • Тема 6. Оффлайн данные.
  • Тема 7. Онлайн + Оффлайн.
  • Тема 8. Смежные источники данных и аналитики
  • Тема 9. От медиа планирования к аудиторному планированию.
  • Безопасность данных.
  • От обезличенной коммуникации к персональной.
  • Тема 12. Изменение потребительского поведения.
  • Тема 13. Анализ данных для решения задач рекламодателей.
  • Введение в проектную работу и подготовку КР
  • Базы данных и SQL
  • Первичный анализ данных. Сравнение пользовательских групп.
  • Задачи обучения с учителем. Как построить свой Look-a-like.
  • Обучение без учителя. Поиск групп среди аудитории сайта и построение персональной коммуникации.
  • Прикладные задачи и метрики продуктовой аналитики
  • Оценка эффективности рекламных кампаний.
  • Визуализация и представление результатов.
  • RFM-анализ для сегментации пользователей по транзакционным данным. Визуализация. Предсказание Lifetime Value пользователей.
  • Когортный анализ.
  • A/B-тестирование и эксперименты.
  • Особенности мобильной аналитики.
  • Workshop по решению задач продуктовой и маркетинговой аналитики.
  • Синтез и анализ источников, обзор литературы для проектной работы
  • Методология анализа данных CRISP-DM.
  • Оценивание моделей и отбор признаков.
  • Обработка естественного языка и интеллектуальный анализ текста
  • Рекомендательные системы.
Элементы контроля

Элементы контроля

  • неблокирующий Кейс
  • неблокирующий Домашнее задание по анализу аудитории
    Статистический анализ характеристик целевой аудитории коммуникационной кампании.
  • неблокирующий Мини-проект: кластеризация посетителей сайта и выбор эффективных сегментов для РК
  • неблокирующий Обзор источников по теме курсового проекта
  • неблокирующий Домашнее задание по сегментации аудитории
  • неблокирующий Презентация плана индивидуального курсового проекта
  • неблокирующий Домашнее задание: обработка естественного языка
  • неблокирующий Домашнее задание: рекомендательная система
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 4th module
    0.125 * Домашнее задание по анализу аудитории + 0.125 * Домашнее задание по сегментации аудитории + 0.125 * Домашнее задание: обработка естественного языка + 0.125 * Домашнее задание: рекомендательная система + 0.125 * Кейс + 0.125 * Мини-проект: кластеризация посетителей сайта и выбор эффективных сегментов для РК + 0.125 * Обзор источников по теме курсового проекта + 0.125 * Презентация плана индивидуального курсового проекта
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python для сложных задач: наука о данных и машинное обучение. - 978-5-4461-0914-2 - Плас Дж. Вандер - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/376830 - 376830 - iBOOKS
  • Машинное обучение с использованием Python. Сборник рецептов: Пер. с англ. - 978-5-9775-4056-8 - Элбон Крис - 2019 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/366635 - 366635 - iBOOKS
  • Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка - 978-5-4461-1153-4 - Бенджамин Бенгфорт, Ребекка Билбро, Тони Охеда - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/365298 - 365298 - iBOOKS
  • Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка , перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Твердохлебова, М. Д., Интернет-маркетинг : учебник / М. Д. Твердохлебова. — Москва : КноРус, 2025. — 190 с. — ISBN 978-5-406-13783-3. — URL: https://book.ru/book/955537 (дата обращения: 26.08.2024). — Текст : электронный.

Рекомендуемая дополнительная литература

  • 9781118824900 - Szabó, Gábor; Boykin, Oscar - Social Media Data Mining and Analytics - 2018 - John Wiley & Sons, Inc. - http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=1899346 - nlebk - 1899346
  • 9781498751414 - Foster, Ian; Ghani, Rayid; Jarmin, Ron S.; Kreuter, Frauke; Lane, Julia I. - Big Data and Social Science : A Practical Guide to Methods and Tools - 2017 - CRC Press - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=1353316 - nlebk - 1353316
  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Martin Oberhofer, Eberhard Hechler, Ivan Milman, Scott Schumacher, & Dan Wolfson. (2014). Beyond Big Data : Using Social MDM to Drive Deep Customer Insight. [N.p.]: IBM Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1600785

Авторы

  • Грызунова Елена Аркадьевна