• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2024/2025

Обучение с подкреплением

Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 2-й курс, 2 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Прогр. обучения: Финансовые технологии и анализ данных
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Цель курса - ознакомление студентов с основными подходами и алгоритмами обучения с подкреплением. Планируется дать понимание того, какие существуют подходы к решению задач обучения с подкреплением, научить выбирать подход и алгоритм, наиболее подходящий для рассматриваемой студентом задачи, научить обучать модели с использованием современных нейросетевых библиотек.
Цель освоения дисциплины

Цель освоения дисциплины

  • уметь распознавать ситуации, в которых уместно применение методов обучения с подкреплением
  • уметь сформулировать задачу обучения с подкреплением и выбрать эффективный способ её решения
  • знать основные парадигмы обучения с подкреплением и границы их применимости
  • уметь обучить по возможности оптимального агента для решения задачи, оценить его эффективность
Планируемые результаты обучения

Планируемые результаты обучения

  • владеть методами теоретического исследования используемых алгоритмов
  • знать основные парадигмы обучения с подкреплением и границы их применимости
  • знать что такое среда, состояние и агент в обучении с подкреплением
  • уметь обучить по возможности оптимального агента для решения задачи, оценить его эффективность
  • уметь сформулировать задачу обучения с подкреплением и выбрать эффективный способ её решения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Многорукие бандиты
  • Марковские процессы
  • Аппроксимация
  • Непрерывное пространство действий
  • Actor-Critic
  • Model-Based
Элементы контроля

Элементы контроля

  • неблокирующий Тесты
    7 тестов по материалам лекций и семинаров
  • неблокирующий Проект
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.5 * Проект + 0.5 * Тесты
Список литературы

Список литературы

Рекомендуемая основная литература

  • Глубокое обучение с подкреплением : теория и практика на языке Python, Грессер, Л., 2022
  • Саттон, Р. С. Обучение с подкреплением: введение : руководство / Р. С. Саттон, Э. Д. Барто , перевод с английского А. А. Слинкина. — Москва : ДМК Пресс, 2020. — 552 с. — ISBN 978-5-97060-097-9. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/179453 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Wiering, M., & Otterlo, M. van. (2012). Reinforcement Learning : State-of-the-Art. Berlin: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=537744
  • Обучение с подкреплением, Саттон, Р. С., 2011

Авторы

  • Яковлева Илона Александровна