Обучение с подкреплением

2023/2024

Статус: Маго-лего

Кто читает: Базовая кафедра Яндекс

Когда читается: 3, 4 модуль

Охват аудитории: для своего кампуса

Преподаватели: Бронер Валентина Игоревна

Язык: русский

Кредиты: 6

Контактные часы: 80

Полная версия программы учебной дисциплины

Аннотация

Цель курса - ознакомление студентов с основными подходами и алгоритмами обучения с подкреплением. Планируется дать понимание того, какие существуют подходы к решению задач обучения с подкреплением, научить выбирать подход и алгоритм, наиболее подходящий для рассматриваемой студентом задачи, научить обучать модели с использованием современных нейросетевых библиотек.

Цель освоения дисциплины

уметь распознавать ситуации, в которых уместно применение методов обучения с подкреплением
уметь сформулировать задачу обучения с подкреплением и выбрать эффективный способ её решения
знать основные парадигмы обучения с подкреплением и границы их применимости
владеть методами теоретического исследования используемых алгоритмов
уметь достигать баланса между exploration и exploitation
знать что такое среда, состояние и агент в обучении с подкреплением
уметь выбирать архитектуру рекуррентной нейронной сети и обучать её
уметь применять различные трюки для ускорения и оптимизации обучения
уметь обучить по возможности оптимального агента для решения задачи, оценить его эффективность

Планируемые результаты обучения

владеть методами теоретического исследования используемых алгоритмов
знать основные парадигмы обучения с подкреплением и границы их применимости
знать что такое среда, состояние и агент в обучении с подкреплением
уметь выбирать архитектуру рекуррентной нейронной сети и обучать её
уметь достигать баланса между exploration и exploitation
уметь обучить по возможности оптимального агента для решения задачи, оценить его эффективность
уметь применять различные трюки для ускорения и оптимизации обучения
уметь распознавать ситуации, в которых уместно применение методов обучения с подкреплением
уметь сформулировать задачу обучения с подкреплением и выбрать эффективный способ её решения