Обучение с подкреплением

2024/2025

Статус: Маго-лего

Кто читает: Базовая кафедра ПАО Сбербанк «Финансовые технологии и анализ данных»

Когда читается: 2 модуль

Охват аудитории: для своего кампуса

Язык: русский

Кредиты: 3

Полная версия программы учебной дисциплины

Аннотация

Цель курса - ознакомление студентов с основными подходами и алгоритмами обучения с подкреплением. Планируется дать понимание того, какие существуют подходы к решению задач обучения с подкреплением, научить выбирать подход и алгоритм, наиболее подходящий для рассматриваемой студентом задачи, научить обучать модели с использованием современных нейросетевых библиотек.

Цель освоения дисциплины

уметь распознавать ситуации, в которых уместно применение методов обучения с подкреплением
уметь сформулировать задачу обучения с подкреплением и выбрать эффективный способ её решения
знать основные парадигмы обучения с подкреплением и границы их применимости
уметь обучить по возможности оптимального агента для решения задачи, оценить его эффективность

Планируемые результаты обучения

владеть методами теоретического исследования используемых алгоритмов
знать основные парадигмы обучения с подкреплением и границы их применимости
знать что такое среда, состояние и агент в обучении с подкреплением
уметь обучить по возможности оптимального агента для решения задачи, оценить его эффективность
уметь сформулировать задачу обучения с подкреплением и выбрать эффективный способ её решения