• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Машинное обучение и анализ больших данных

2024/2025
Учебный год
RUS
Обучение ведется на русском языке
Статус:
Курс обязательный
Когда читается:
2-й курс, 2 модуль

Преподаватели

Программа дисциплины

Аннотация

Настоящая дисциплина относится к вариативной части дисциплин программы "Управление цифровым продуктом" и направлен на формирование комплексного понимания современных технологий искусственного интеллекта и их практического применения в бизнесе.В рамках курса студенты познакомятся с ключевыми концепциями машинного обучения и глубокого обучения, освоят принципы работы с данными в ИИ-проектах, изучат классические и современные методы машинного обучения. Особое внимание уделяется практическим аспектам применения технологий искусственного интеллекта в бизнес-контексте.Курс сочетает теоретическую подготовку с практическим освоением инструментов и методов управления AI-проектами. Студенты научатся оценивать эффективность ИИ-решений и принимать обоснованные решения при внедрении технологий искусственного интеллекта в бизнес-среде.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины "Машинное обучение и анализ больших данных" является обучение студентов базовым навыкам использования машинного обучения и анализа данных и пониманию принципов реализации проектов, использующих технологии машинного обучения и ИИ при создании и развитии цифровых продуктов.
Планируемые результаты обучения

Планируемые результаты обучения

  • Объясняет основы математики для анализа данных
  • Формулирует основные постановки задач и типы данных в машинном обучении
  • Применяет методы и модели решающих деревьев, простых нейронных сетей, xgboost, метода опорных векторов и демонстрирует навык их обучения
  • Описывает основные концепции и методы машинного обучения, применяемые при решении классификационных и регрессионных задач
  • Применяет методы кластеризации данных, сингулярного разложения, фактор-анализа, главных компонент
  • Объясняет основные подходы к построению моделей обучения с подкреплением
  • Описывает основные концепции нейронных сетей и методы их обучения в задачах анализа неструктурированных данных
  • Применяет основные используемые методы обработки текстов, изображений и видео
  • Оценивает применимости ИИ и ML-технологий для решения конкретных бизнес-задач.
  • Формулирует требования к данным для ИИ и ML-проектов.
  • Разрабатывает стратегии сбора и подготовки данных для машинного обучения.
  • Выбирает оптимальные методы и алгоритмы машинного обучения под специфику задачи.
  • Применяет понимание принципы работы и области применимости классических неглубоких моделей машинного обучения.
  • Применяет понимание принципов работы и области применения в бизнес-задачах глубоких моделей машинного обучения при обработке не структурированных данных.
  • Применяет понимание принципов и возможности применение методов векторного представления данных для бизнес-задач.
  • Применяет понимание принципов обработки текстов на естественном языке с помощью моделей глубокого обучения и больших языковых моделей и области применения этих решений в бизнес-задачах
  • Оценивает качество и эффективность ML-моделей.
  • Оценивает качество и эффективность моделей глубокого обучения.
  • Управляет жизненным циклом ИИ-проекта.
  • Применяет принципы формирования команды ИИ-проекта.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в искусственный интеллект и машинное обучение
  • Управление данными в ИИ
  • Классические методы машинного обучения
  • Введение в глубокое обучение
  • Задачи обучения без учителя, эмбеддинги
  • Технологии обработки текста на естественном языке и большие языковые модели и их применение в бизнесе
Элементы контроля

Элементы контроля

  • неблокирующий Экзамен
    Экзаменационная работа представляет из себя тест с вопросами закрытого типа. Форма экзамена: Экзамен проводится в письменной форме. Платформа проведения: Экзамен проводится на платформе Canvas LMS. Для участия в экзамене студент обязан: Не позднее 7 дней до проведения экзамена проверить работоспособность компьютерного оборудования, необходимого для сдачи экзамена и убедиться в соответствие имеющегося оборудования требованиям к компьютеру для участия в экзамене на платформе Canvas LMS; Войти на платформу Canvas LMS под личной учетной записью (используется аккаунт студента @edu.hse.ru); Перед началом экзамена проверить скорость работы сети Интернет (для наилучшего результата рекомендуется подключение компьютера к сети через кабель); Подготовить необходимые для проведения экзамена инструменты: ручка, листы бумаги, калькулятор и т. д.; Отключить в диспетчере задач компьютера иные приложения, кроме браузера, в котором будет выполняться вход на платформу Canvas LMS. В случае, если одно из необходимых условий участия в экзамене невозможно выполнить, необходимо за 2 недели до даты проведения экзамена проинформировать об этом преподавателя или сотрудника учебного офиса для принятия решения об участии студента в экзаменах. Во время экзамена студентам запрещено: Пользоваться конспектами, учебниками, прочими учебными материалами; Покидать место выполнения экзаменационного задания; Пользоваться умными гаджетами (смартфон, планшет и др.); Привлекать посторонних лиц для помощи в проведении экзамена, разговаривать с посторонними во время выполнения заданий; Вслух громко зачитывать задания. Во время экзамена студентам разрешено: Использовать бумагу, ручку для ведения записей, расчетов; Использовать калькулятор для ведения расчетов; Запрашивать у преподавателя дополнительную информацию, связанную с выполнением экзаменационного задания; Взаимодействовать с другими студентами по разрешению преподавателя. В случае долговременного нарушения связи с платформами MS Teams и Canvas LMS во время выполнения экзаменационного задания, студент должен уведомить об этом преподавателя, зафиксировать факт потери связи с платформой (скриншот, ответ от провайдера сети Интернет) и обратиться в учебный офис с объяснительной запиской о случившемся для принятия решения о пересдаче экзамена
  • неблокирующий Групповой проект
    Выполнение группового проекта предусматривает построение моделей анализа реальных данных, выявление регулярных выражений, построение аналитических срезов и фильтров, выделение корреляций между срезами, отображение взаимосвязей и визуализацию итогов анализа в BI системе
  • неблокирующий Аудиторная работа
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.1 * Аудиторная работа + 0.6 * Групповой проект + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • GPT-3 : the ultimate guide to building NLP products with OpenAI API, Kublik, S., 2022
  • Аналитическая культура : от сбора данных до бизнес-результатов, Андерсон, К., 2023
  • Введение в машинное обучение с помощью Python : руководство для специалистов по работе с данными, Мюллер, А., 2018
  • Глубокое обучение на Python, Шолле, Ф., 2023
  • Глубокое обучение, Вейдман, С., 2021
  • Глубокое обучение, Гудфеллоу, Я., 2018
  • Глубокое обучение. Самый краткий и понятный курс, Келлехер, Д. Д., 2022
  • Информационные технологии анализа данных. Data Analysis : учебное пособие, Петрунин, Ю. Ю., 2023
  • Корпоративное озеро больших данных : новый подход к использованию Big Data и Data Science в бизнесе, Горелик, А., 2023
  • Машинное обучение с помощью Python : руководство для специалистов по работе с данными, Мюллер, А., 2022
  • Машинное обучение: алгоритмы для бизнеса, Прадо де, М. Л., 2019
  • Методы разноуровневого анализа текстов на естественном языке и их приложения в системах информаци... : автореф. дис. ... д-ра техн. наук : 1.2.1, Смирнов, И. В., 2024
  • Наука о данных : базовый курс, Келлехер, Д. Д., 2023

Авторы

  • Макрушин Сергей Вячеславович
  • Редькина Галина Сергеевна
  • Бекларян Армен Левонович