Магистратура
2023/2024
Машинное обучение в бизнесе
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный
Направление:
42.04.01. Реклама и связи с общественностью
Кто читает:
Школа коммуникаций
Где читается:
Факультет креативных индустрий
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
60
Охват аудитории:
для своего кампуса
Прогр. обучения:
Коммуникации, основанные на данных
Язык:
русский
Кредиты:
6
Контактные часы:
60
Программа дисциплины
Аннотация
В результате успешного освоения курса студенты будут: • знать типологии задач и метрики качества в машинном обучении; • уметь корректно использовать математические модели для прогнозирования показателей коммуникационной среды, корректно использовать математические модели и алгоритмы для анализа текстов в PR и рекламе, адекватно оценивать корректность использования статистических методов, применяемых при формулировке и решении задач анализа коммуникационной среды; • владеть статистическим анализом данных с использованием Python и Jupyter, базовыми навыками анализа данных, математическим аппаратом для оптимизации рекламной деятельности.
Цель освоения дисциплины
- Целью освоения дисциплины "Машинное обучение в бизнесе" является обучение студентов навыкам использования машинного обучения и анализа данных для последующего их применения в прикладных исследованиях коммуникационной среды и потребителей.
Планируемые результаты обучения
- Использует методы работы с графами для решения практических задач профессиональной области. Умеет модифицировать основные математические модели, основанные на теории графов, в соответствии со спецификой задачи
- Адекватно оценивает корректность использования методов анализа данных, применяемых при решении исследовательских задач.
- Адекватно оценивает корректность использования статистических методов, применяемых при формулировке и решении задач, владеет базовыми навыками анализа данных.
- Использует базовые метрики качества в задачах классификации, кластеризации и регрессии.
- Применяет методы кластеризации для анализа данных.
- Применяет методы классификации и логистической регрессии для анализа данных.
- Готовит и валидирует наборы данных для машинного обучения.
- Корректно применяет ансамбли моделей в машинном обучении.
- Готовит датасет для анализа неструктурированных данных (изображений, текстов).
Содержание учебной дисциплины
- Введение в теорию вероятности и её применение на практике.
- Введение в статистику и её применение на практике.
- Введение в машинное обучение.
- Метрики качества в машинном обучении.
- Наборы данных в машинном обучении
- Обучение с учителем. Классификация, логистическая регрессия.
- Ансамбли моделей в машинном обучении. Концепция бустинга.
- Практика работы с данными на основе задачи кластеризации.
- Неструктурированные данные: тексты, изображения.
- Нейронные сети: введение.
- Нейронные сети: сверточные и рекуррентные сети.
- Задачи и методы машинного обучения на графах
- Нейронные сети для рекомендательных систем, соревновательные нейронные сети и автокодировщики.
Элементы контроля
- Прогресс по онлайн-курсуПрогресс студента по онлайн-курсу "Введение в машинное обучение" https://edu.hse.ru/course/view.php?id=132489
- Итоговый групповой проект
- Работа на семинарах
- Индивидуальное выполнение домашних заданий
- ЭкзаменУстный экзамен. Экзамен состоит из 2 вопросов по билетам (по одному вопросу из блока «Математика и обучение с учителем» и «Обучение без учителя и нейронные сети»), а также сканирующего опроса по разделам дисциплины. Студентам также предоставляется альтернативная возможность заранее подготовить решение усложнённых задач, которые будут засчитаны на экзамене – система «звездочек» и «джокеров» (подробнее см. критерии оценивания). ОСОБЕННОСТИ ОРГАНИЗАЦИИ ЭКЗАМЕНА В ДИСТАНЦИОННОМ ФОРМАТЕ. Экзамен проводится на платформе Google Hangouts (https://meet.google.com). Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, стабильное подключение к Интернету. Для участия в экзамене студент обязан: поставить фамилию и имя в профиле, явиться на экзамен согласно точному расписанию начала экзамена, не выключать камеру и микрофон в течение всего периода проведения экзамена, включая подготовку и ответы. По завершении своего ответа студент может покинуть экзамен. Во время экзамена студентам запрещено: выключать камеру, пользоваться подсказками третьих лиц. Разрешено пользоваться рукописными конспектами. Билеты распределяются рандомно в начале экзамена посредством генератора случайных чисел на компьютере преподавателя. В начале экзамена студентам даётся 20 минут на подготовку. Во время подготовки камера должна располагаться таким образом, чтобы был виден рабочий стол студента. На столе не должно быть ничего, кроме черновика (белый лист бумаги), рукописного конспекта и ручки, также можно поставить чашку или бутылку воды. В комнате не должны находиться посторонние лица. Телефон необходимо заранее поставить на беззвучный режим и убрать. Пользоваться файлами, ПО, вкладками или браузерами на компьютере в период проведения экзамена не разрешается. По истечении 20 минут студенты по очереди устно отвечают на вопросы своего билета. Очерёдность определяется готовностью студентов. Кратковременным нарушением связи во время экзамена считается нарушение связи менее минуты. Долговременным нарушением связи во время экзамена считается нарушение минута и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре экзамена.
Промежуточная аттестация
- 2023/2024 4th module0.25 * Индивидуальное выполнение домашних заданий + 0.25 * Итоговый групповой проект + 0.1 * Прогресс по онлайн-курсу + 0.1 * Работа на семинарах + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- Технологии анализа данных: Data Mining, Text Mining, Visual Mining, OLAP. 2 изд. - 5-94157-991-8 - Барсегян А., Куприянов М., Степаненко В., Холод И. - 2008 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/335156 - 335156 - iBOOKS
Рекомендуемая дополнительная литература
- 9781491952931 - Bruce, Peter C.; Bruce, Andrew - Practical Statistics for Data Scientists : 50 Essential Concepts - 2017 - O'Reilly Media - http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=1517577 - nlebk - 1517577
- Trevor Hastie, Robert Tibshirani , et al., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2nd edition, 2017. Free from the publisher: https://web.stanford.edu/~hastie/ElemStatLearn/printings/ESLII_print12.pdf
- Иванов, Б. Н. Дискретная математика и теория графов : учебное пособие для вузов / Б. Н. Иванов. — Москва : Издательство Юрайт, 2021. — 177 с. — (Высшее образование). — ISBN 978-5-534-14470-3. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/477683 (дата обращения: 27.08.2024).
- Нидхем, М. Графовые алгоритмы : руководство / М. Нидхем, Э. Холдер , перевод с английского В. С. Яценкова. — Москва : ДМК Пресс, 2020. — 258 с. — ISBN 978-5-97060-799-2. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/140578 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Робинсон, Я. Графовые базы данных: новые возможности для работы со связанными данными / Я. Робинсон, Д. Вебер, Э. Эифрем. — 2-е изд. — Москва : ДМК Пресс, 2016. — 256 с. — ISBN 978-5-97060-201-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/90122 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.