Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2022/2023

Машинное обучение в бизнесе

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Маго-лего
Когда читается: 3, 4 модуль
Онлайн-часы: 60
Охват аудитории: для своего кампуса
Преподаватели: Попов Марк Раилевич, Семенова Анастасия Михайловна
Язык: русский
Кредиты: 6
Контактные часы: 60

Программа дисциплины

Аннотация

В результате успешного освоения курса студенты будут: • знать типологии задач и метрики качества в машинном обучении; • уметь корректно использовать математические модели для прогнозирования показателей коммуникационной среды, корректно использовать математические модели и алгоритмы для анализа текстов в PR и рекламе, адекватно оценивать корректность использования статистических методов, применяемых при формулировке и решении задач анализа коммуникационной среды; • владеть статистическим анализом данных с использованием Python и Jupyter, базовыми навыками анализа данных, математическим аппаратом для оптимизации рекламной деятельности.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины "Машинное обучение в бизнесе" является обучение студентов навыкам использования машинного обучения и анализа данных для последующего их применения в прикладных исследованиях коммуникационной среды и потребителей.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимает основные положения теории графов, владеет методами построения графов
  • Знает основные дискретные структуры и свойства графов. Умеет проводить анализ различных графов и работать с производящими функциями.
  • Использует методы работы с графами для решения практических задач профессиональной области. Умеет модифицировать основные математические модели, основанные на теории графов, в соответствии со спецификой задачи
  • Адекватно оценивает корректность использования методов анализа данных, применяемых при решении исследовательских задач.
  • Адекватно оценивает корректность использования статистических методов, применяемых при формулировке и решении задач, владеет базовыми навыками анализа данных.
  • Знает базовые понятия теории вероятности. Владеет математическим аппаратом для оптимизации рекламной деятельности.
  • Использует базовые метрики качества в задачах классификации, кластеризации и регрессии.
  • Понимает базовые принципы применения нейронных сетей.
  • Понимает особенности применения рекомендательных систем, соревновательных нейронных сетей и автокодировщиков для применения в маркетинговых коммуникациях.
  • Понимает особенности применения сверточных и рекуррентных нейронных сетей для анализа текста при решении коммуникационных задач.
  • Применяет методы кластеризации для анализа данных.
  • Применяет методы классификации и логистической регрессии для анализа данных.
  • Готовит и валидирует наборы данных для машинного обучения.
  • Корректно применяет ансамбли моделей в машинном обучении.
  • Готовит датасет для анализа неструктурированных данных (изображений, текстов).
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в теорию вероятности и её применение на практике.
  • Введение в статистику и её применение на практике.
  • Введение в машинное обучение.
  • Метрики качества в машинном обучении.
  • Наборы данных в машинном обучении
  • Обучение с учителем. Классификация, логистическая регрессия.
  • Ансамбли моделей в машинном обучении. Концепция бустинга.
  • Практика работы с данными на основе задачи кластеризации.
  • Неструктурированные данные: тексты, изображения.
  • Нейронные сети: введение.
  • Нейронные сети: сверточные и рекуррентные сети.
  • Задачи и методы машинного обучения на графах
  • Нейронные сети для рекомендательных систем, соревновательные нейронные сети и автокодировщики.
Элементы контроля

Элементы контроля

  • неблокирующий Опроект – оценка за итоговый групповой проект
  • неблокирующий Од/з – оценка за индивидуальное выполнение всех домашних заданий.
  • неблокирующий Оауд – оценка за работу на семинарах.
  • неблокирующий Оэкз – оценка за устный экзамен.
    ОСОБЕННОСТИ ОРГАНИЗАЦИИ ЭКЗАМЕНА В ДИСТАНЦИОННОМ ФОРМАТЕ. Экзамен проводится в устной форме по билетам. Экзамен проводится на платформе Google Hangouts (https://meet.google.com). Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, стабильное подключение к Интернету. Для участия в экзамене студент обязан: поставить фамилию и имя в профиле, явиться на экзамен согласно точному расписанию начала экзамена, не выключать камеру и микрофон в течение всего периода проведения экзамена, включая подготовку и ответы. По завершении своего ответа студент может покинуть экзамен. Во время экзамена студентам запрещено: выключать камеру, пользоваться подсказками третьих лиц. Разрешено пользоваться рукописными конспектами. Билеты распределяются рандомно в начале экзамена посредством генератора случайных чисел на компьютере преподавателя. В начале экзамена студентам даётся 20 минут на подготовку. Во время подготовки камера должна располагаться таким образом, чтобы был виден рабочий стол студента. На столе не должно быть ничего, кроме черновика (белый лист бумаги), рукописного конспекта и ручки, также можно поставить чашку или бутылку воды. В комнате не должны находиться посторонние лица. Телефон необходимо заранее поставить на беззвучный режим и убрать. Пользоваться файлами, ПО, вкладками или браузерами на компьютере в период проведения экзамена не разрешается. По истечении 20 минут студенты по очереди устно отвечают на вопросы своего билета. Очерёдность определяется готовностью студентов. Кратковременным нарушением связи во время экзамена считается нарушение связи менее минуты. Долговременным нарушением связи во время экзамена считается нарушение минута и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре экзамена.
  • неблокирующий Прогресс по онлайн-курсу
    Прогресс студента по онлайн-курсу "Введение в машинное обучение"
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.1 * Оауд – оценка за работу на семинарах. + 0.25 * Од/з – оценка за индивидуальное выполнение всех домашних заданий. + 0.1 * Прогресс по онлайн-курсу + 0.3 * Оэкз – оценка за устный экзамен. + 0.25 * Опроект – оценка за итоговый групповой проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Trevor Hastie, Robert Tibshirani , et al., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2nd edition, 2017. Free from the publisher: https://web.stanford.edu/~hastie/ElemStatLearn/printings/ESLII_print12.pdf
  • Барсегян А., Куприянов М., Степаненко В., Холод И. - Технологии анализа данных: Data Mining, Text Mining, Visual Mining, OLAP. 2 изд. - 5-94157-991-8 - Санкт-Петербург: БХВ-Петербург - 2008 - 335156 - https://ibooks.ru/bookshelf/335156/reading - iBOOKS
  • Иванов, Б. Н.  Дискретная математика и теория графов : учебное пособие для вузов / Б. Н. Иванов. — Москва : Издательство Юрайт, 2021. — 177 с. — (Высшее образование). — ISBN 978-5-534-14470-3. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/477683 (дата обращения: 28.08.2023).

Рекомендуемая дополнительная литература

  • Bruce, P. C., & Bruce, A. (2017). Practical Statistics for Data Scientists : 50 Essential Concepts (Vol. First edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1517577
  • Нидхем, М. Графовые алгоритмы : руководство / М. Нидхем, Э. Холдер , перевод с английского В. С. Яценкова. — Москва : ДМК Пресс, 2020. — 258 с. — ISBN 978-5-97060-799-2. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/140578 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Робинсон, Я. Графовые базы данных: новые возможности для работы со связанными данными / Я. Робинсон, Д. Вебер, Э. Эифрем. — 2-е изд. — Москва : ДМК Пресс, 2016. — 256 с. — ISBN 978-5-97060-201-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/90122 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Грызунова Елена Аркадьевна