Бакалавриат
2022/2023



Инструменты и методы в коммуникационных исследованиях
Статус:
Курс обязательный (Реклама и связи с общественностью)
Направление:
42.03.01. Реклама и связи с общественностью
Кто читает:
Школа коммуникаций
Где читается:
Факультет креативных индустрий
Когда читается:
4-й курс, 1 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Хапаева Наталья Михайловна
Язык:
русский
Кредиты:
2
Контактные часы:
26
Программа дисциплины
Аннотация
Основной курс специализации «Исследования в коммуникациях» посвящен применению современных методов обработки количественных данных для целей коммуникационного исследования. Цель данного курса – обеспечить студентов необходимыми навыками и умениями для работы с эмпирическими данными, обобщения полученных результатов и создания уникальных коммуникационных продуктов на основании исследования. В результате освоения дисциплины студенты смогут применять методы статистики и машинного обучения к методологии количественного коммуникационного исследования, формулировать выводы на основании данных и принимать решения, исходя из результатов исследования. Работа в рамках курса строится вокруг освоения методов и подходов, применения их и разбора сопряженных с данными методами и подходами кейсов. Курс сочетает в себе лучшие практики аналитической работы, анализа больших данных и основы дата-ориентированных коммуникаций, что является приоритетным направлением в индустрии сегодня.
Цель освоения дисциплины
- формирование профессиональных компетенций по работе с данными, используя язык программирования Python
- формирование профессиональных компетенций для проведения социологических, маркетинговых и коммуникационных исследований в сфере рекламы и PR.
Планируемые результаты обучения
- Собирать данные с помощью web-scraping, парсить данные и сохранять их в табличном виде
- Владеет методами анализа: линейная регрессия, регрессионные деревья, случайный лес
- Владение методами сегментации на основе анализа данных: кластеризация, анализ текстов, тематическое моделирование, LDA.
- Умеет применять нейронные сети для решения задач
- Знает основные стадии ведения проекта машинного обучения; умеет распозанавать задачи машинного обучения в реальных бизнес-задачах; имеет навыки оценки качества и интерпретации полученных результатов
- Знать: основные методы классификации данных такие как линейная и логистическая регрессия, метод поддерживающих векторов, метод к ближайших соседей, деревья принятия решений, случайный лес; методы оценки качества классификации.
- Владеет терминологией, обладает базовыми знаниями о нейронные сетях как виде распределенных информационных систем. Знает принципы построения нейронных сетей. Умеет применять нейронные сети в научных и практических целях.
- Осуществляет анализ текстовой информации с использованием технологии Text Mining
- Демонстрирует знание специальных видов нейронных сетей: рекуррентные, сверточные, глубокие сети для обработки текстов (распределенные представления слов и рекурсивные нейронные сети)
- Владеет библиотеками Pandas и Numpy для обработки данных
- Знать особенности работы с современными дистрибутивами Python
- Владеет методами кластеризации данных
- Знает основные понятия и постановки задач машинного обучения
- Умеет выполнять кластеризацию и визуализацию данных
- Владеет понятием алгоритмов на больших данных (кластеризация, понижение размерности, популярные предметные наборы и ассоциативные правила)
- Владеет понятием алгоритмов на больших данных (рекомендательные системы и интернет-реклама)
- Владеет понятиями: объединения моделей; усреднение, бутстрап, бэггинг; бустинг: AdaBoost. Знает алгоритм Random Forest.
- Владеет понятием линейной регрессии; лассо-регрессии; гребневой регрессии. Знает ошибки модели в задачах регрессии. Владеет понятием метрик качества.
- Владеет методом кластеризации для анализа аудитории с помощью библиотек Python.
- Умеет извлекать (парсить) данные с веб-ресурсов, используя пакеты для Python. Владеет базовыми навыками работы с SQL. Умеет проверять качество данных.
- Владеет основными методами ручного и машинного анализа текстовых данных.
- Владеет основными принципами кодирования текстовых данных.
- Сравнивать задачи классификации и задачи регрессии. Иллюстрировать задачи классификации (бинарной и множественной). Сравнивать наиболее известные классификаторы (логистическая регрессия, деревья решений, случайный лес, метод опорных векторов).
- Владеет метриками качества линейной регрессии: MSE, MAE, R2.
- Владеет основами коммуникационных исследований
Содержание учебной дисциплины
- Основы коммуникационных исследований
- Язык программирования Python как интрумент коммуникационных исследований
- Обработка данных в Python с использованием библиотеки Pandas
- Автоматизированный сбор данных с использованием инструментов парсинга
- Статистика для обработки данных
- Обработка текстовых данных средствами и инструментами Python
- Методы машинного обучения для коммуникационного исследования
- Предсказание
- Классификация
- Основы работы с неструктурированными данными
- Бэггинг и бустинг
- Сегментация
- Анализ сетевых структур
- Введение в нейронные сети
- Рекомендательные системы для коммуникационных задач
Элементы контроля
- Домашние заданияДомашнее задание представляет собой набор инструкций и задач по работе с данными с использованием языка программирования в Python. Инструкции к каждому домашнему заданию высылаются преподавателем как минимум за 7 дней до предполагаемого срока сдачи работы. При загрузке файлов студент обязан указать корректно свои фамилию и имя. Оценка за домашние задания не подлежит пересдаче, так как данная форма контроля по факту состоит из нескольких форм контроля. В результате, оценка за домашние задания выставляется как среднее арифметическое оценок за все домашние задания, предусмотренные на курсе.
- Контрольная работаКонтрольная работа проходит в письменном виде и представляет собой набор открытых и закрытых тестовых вопросов. На выполнение работы студенту отводится 120 минут. Оценка выставляется пропорционально проценту правильных ответов от всех вопросов в тесте.
- Итоговый проектВыполнение студентами этапов проекта предусмотрено на протяжении всего курса. Итоговый проект выполняется строго в группах 2-4 человека. Проект состоит из двух частей - ipynb-файл с содержанием проекта (вес в оценке за итоговый проект: 80%) и презентация основных результатов и степени достижения целей проекта в любом формате (вес в оценке за итоговый проект: 20%).
- ЭкзаменОценка достижения студентами планируемых результатов обучения в рамках данного курса проходит в форме сдачи итогового экзамена. Экзамен проходит в письменной форме; его продолжительность - 240 минут. Экзамен состоит из двух частей, где в первой части студент в свободной форме письменно отвечает на любые два из трех вопросов в билете, а затем - выполняет практическое задание по анализу данных с использование Python. Обе части имеют равный вес в итоговой оценке за экзамен.
- Проект
- Домашние задания
- Активность