• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2021/2022

Машинное обучение и анализ больших данных

Статус: Курс обязательный (Коммуникации, основанные на данных)
Направление: 42.04.01. Реклама и связи с общественностью
Когда читается: 1-й курс, 3, 4 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Преподаватели: Просветов Артем Владимирович
Прогр. обучения: Коммуникации, основанные на данных
Язык: русский
Кредиты: 5
Контактные часы: 60

Программа дисциплины

Аннотация

Настоящая дисциплина относится к блоку дисциплин базовой части цикла дисциплин программы «Коммуникации, основанные на данных». В результате успешного освоения курса студенты будут: • знать типологии задач и метрики качества в машинном обучении; • уметь корректно использовать математические модели для прогнозирования показателей коммуникационной среды, корректно использовать математические модели и алгоритмы для анализа текстов в PR и рекламе, адекватно оценивать корректность использования статистических методов, применяемых при формулировке и решении задач анализа коммуникационной среды; • владеть статистическим анализом данных с использованием Python и Jupyter, базовыми навыками анализа данных, математическим аппаратом для оптимизации рекламной деятельности.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины "Машинное обучение и анализ больших данных" является обучение студентов навыкам использования машинного обучения и анализа данных для последующей разработки стратегий продвижения продуктов и услуг в цифровом пространстве.
Планируемые результаты обучения

Планируемые результаты обучения

  • Адекватно оценивает корректность использования методов анализа данных, применяемых при решении исследовательских задач.
  • Адекватно оценивает корректность использования статистических методов, применяемых при формулировке и решении задач, владеет базовыми навыками анализа данных.
  • Демонстрирует уверенное владение статистическим анализом данных с использованием Python и Jupyter.
  • Знает базовые понятия теории вероятности. Владеет математическим аппаратом для оптимизации рекламной деятельности.
  • Знает основные определения науки о данных, направления применения анализа больших данных в PR, рекламе и маркетинге.
  • Использует базовые метрики качества в задачах классификации, кластеризации и регрессии.
  • Корректно применяет ансамбли моделей Random Forest и Gradient Boosting в машинном обучении.
  • Понимает базовые принципы применения нейронных сетей.
  • Понимает особенности применения рекомендательных систем, соревновательных нейронных сетей и автокодировщиков для применения в маркетинговых коммуникациях.
  • Понимает особенности применения сверточных и рекуррентных нейронных сетей для анализа текста при решении коммуникационных задач.
  • Применяет метод логистической регрессии для анализа данных.
  • Применяет методы кластеризации для анализа данных.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Что такое большие данные и аналитика данных?
  • Введение в теорию вероятности и её применение на практике.
  • Введение в статистику и её применение на практике.
  • Введение в программирование на Python.
  • Введение в машинное обучение.
  • Практика работы с данными на основе задачи кластеризации.
  • Практическое построение моделей на основе логистической регрессии.
  • Ансамбли моделей в машинном обучении.
  • Метрики качества в машинном обучении.
  • Нейронные сети: введение.
  • Нейронные сети: сверточные и рекуррентные сети.
  • Нейронные сети для рекомендательных систем, соревновательные нейронные сети и автокодировщики.
Элементы контроля

Элементы контроля

  • неблокирующий Опроект – оценка за итоговый групповой проект
  • неблокирующий Од/з – оценка за индивидуальное выполнение всех домашних заданий.
  • неблокирующий Оауд – оценка за работу на семинарах.
  • неблокирующий Оэкз – оценка за устный экзамен.
    ОСОБЕННОСТИ ОРГАНИЗАЦИИ ЭКЗАМЕНА В ДИСТАНЦИОННОМ ФОРМАТЕ. Экзамен проводится в устной форме по билетам. Экзамен проводится на платформе Google Hangouts (https://meet.google.com). Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, стабильное подключение к Интернету. Для участия в экзамене студент обязан: поставить фамилию и имя в профиле, явиться на экзамен согласно точному расписанию начала экзамена, не выключать камеру и микрофон в течение всего периода проведения экзамена, включая подготовку и ответы. По завершении своего ответа студент может покинуть экзамен. Во время экзамена студентам запрещено: выключать камеру, пользоваться подсказками третьих лиц. Разрешено пользоваться рукописными конспектами. Билеты распределяются рандомно в начале экзамена посредством генератора случайных чисел на компьютере преподавателя. В начале экзамена студентам даётся 20 минут на подготовку. Во время подготовки камера должна располагаться таким образом, чтобы был виден рабочий стол студента. На столе не должно быть ничего, кроме черновика (белый лист бумаги), рукописного конспекта и ручки, также можно поставить чашку или бутылку воды. В комнате не должны находиться посторонние лица. Телефон необходимо заранее поставить на беззвучный режим и убрать. Пользоваться файлами, ПО, вкладками или браузерами на компьютере в период проведения экзамена не разрешается. По истечении 20 минут студенты по очереди устно отвечают на вопросы своего билета. Очерёдность определяется готовностью студентов. Кратковременным нарушением связи во время экзамена считается нарушение связи менее минуты. Долговременным нарушением связи во время экзамена считается нарушение минута и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре экзамена.
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 4 модуль
    0.1 * Оауд – оценка за работу на семинарах. + 0.25 * Опроект – оценка за итоговый групповой проект + 0.25 * Од/з – оценка за индивидуальное выполнение всех домашних заданий. + 0.4 * Оэкз – оценка за устный экзамен.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.

Рекомендуемая дополнительная литература

  • Bruce, P. C., & Bruce, A. (2017). Practical Statistics for Data Scientists : 50 Essential Concepts (Vol. First edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1517577
  • Python for data analysis : data wrangling with pandas, numPy, and IPhython, Mckinney, W., 2017
  • Изучаем Python : программирование игр, визуализация данных, веб - приложения, Мэтиз, Э., 2017
  • Изучаем Python, Лутц, М., 2014
  • Комбинаторика и теория вероятностей, учебное пособие, 99 с., Райгородский, А. М., 2013

Авторы

  • Грызунова Елена Аркадьевна