• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2022/2023

Машинное обучение

Статус: Маго-лего
Когда читается: 3, 4 модуль
Охват аудитории: для всех кампусов НИУ ВШЭ
Преподаватели: Баранов Александр Михайлович, Кловайт Анастасия Алексеевна
Язык: русский
Кредиты: 6
Контактные часы: 48

Программа дисциплины

Аннотация

Курс знакомит студентов с основами машинного обучения, систематизирует знания о стандартных библиотеках, дает представление о классических, нейронных моделях, об ансамблях моделей, тренирует навык правильной формулировки задачи модели и правильной оценки качества модели.
Цель освоения дисциплины

Цель освоения дисциплины

  • познакомить студентов с основными задачами и методами машинного обучения
  • научить применять машинное обучения для решения задач автоматической обработки текстов
Планируемые результаты обучения

Планируемые результаты обучения

  • анализирует преимущества и недостатки разных алгоритмов классификации
  • анализирует преимущества и недостатки разных алгоритмов кластеризации, подбирает оптимальное количество классов
  • воспроизводит и инретпретирует основные термины и понятия, используемые в дальнейшем при освоении курса
  • выбирает и интерпретирует метрики
  • использует предобученные модели для получения контекстных векторных представлений
  • использует слой DropOut для регуляризации, использует предобученные модели для получения представлений картинок
  • настраивает параметры кластеризации, оценивает качество кластеризации
  • обучает модели бинарной и многоклассовой классификации
  • обучает нейронные классификаторы с использованием рекуррентных слоев в keras (gru, lstm), обучает seq2seq модели, использует предобученные векторные представления
  • обучает нейронные классификаторы с использованием сверточных слоев в keras, подбирает параметры в сверточных слоях
  • обучает нейронные классификаторы с использованием слоев Embedding, Dense в keras, выбирает нужную функцию потерь и оптимизатор
  • обучает ранжирующие модели, оценивать результаты ранжирования
  • обучает регрессионные модели
  • обучает случайный лес, градиентный бустинг, пользовуется xgboost, lightgbm и catboost, применяет стекинг
  • отличает accuracy от precision и precision от recall
  • подбирает параметры (размер батча, количество слоев, размерность эмбедингов)
  • разбивает выборку на обучающую и тестовую
  • разбивает выборку на фолды и производит кросс-валидацию
  • различает макро и микро усреднение
  • учитывает сбалансированность классов или распределения при разбиении, определяет переобучение
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение
  • Классификация
  • Регрессия
  • Валидация
  • Ансамбли
  • Кластеризация
  • Ранжирование
  • Нейронные сети (keras)
  • Нейронные сети (cnn)
  • Нейронные сети (rnn)
Элементы контроля

Элементы контроля

  • неблокирующий Проект
  • неблокирующий Домашнее задание
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.7 * Домашнее задание + 0.3 * Проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Федоров, Д. Ю.  Программирование на языке высокого уровня Python : учебное пособие для среднего профессионального образования / Д. Ю. Федоров. — 2-е изд. — Москва : Издательство Юрайт, 2019. — 161 с. — (Профессиональное образование). — ISBN 978-5-534-11961-9. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/446505 (дата обращения: 28.08.2023).

Рекомендуемая дополнительная литература

  • Лучано, Р. Python. К вершинам мастерства / Р. Лучано , перевод с английского А. А. Слинкин. — Москва : ДМК Пресс, 2016. — 768 с. — ISBN 978-5-97060-384-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93273 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Ахапкина Яна Эмильевна
  • Кловайт Анастасия Алексеевна
  • Клышинский Эдуард Станиславович