Обучение с подкреплением

Магистратура 2023/2024

Статус: Курс по выбору (Современные компьютерные науки)

Направление: 01.04.02. Прикладная математика и информатика

Кто читает: Базовая кафедра Яндекс

Где читается: Факультет компьютерных наук

Когда читается: 1-й курс, 3, 4 модуль

Формат изучения: без онлайн-курса

Охват аудитории: для своего кампуса

Преподаватели: Бронер Валентина Игоревна

Прогр. обучения: Современные компьютерные науки

Язык: русский

Кредиты: 6

Контактные часы: 80

Полная версия программы учебной дисциплины

Аннотация

Цель курса - ознакомление студентов с основными подходами и алгоритмами обучения с подкреплением. Планируется дать понимание того, какие существуют подходы к решению задач обучения с подкреплением, научить выбирать подход и алгоритм, наиболее подходящий для рассматриваемой студентом задачи, научить обучать модели с использованием современных нейросетевых библиотек.

Цель освоения дисциплины

уметь распознавать ситуации, в которых уместно применение методов обучения с подкреплением
уметь сформулировать задачу обучения с подкреплением и выбрать эффективный способ её решения
знать основные парадигмы обучения с подкреплением и границы их применимости
владеть методами теоретического исследования используемых алгоритмов
уметь достигать баланса между exploration и exploitation
знать что такое среда, состояние и агент в обучении с подкреплением
уметь выбирать архитектуру рекуррентной нейронной сети и обучать её
уметь применять различные трюки для ускорения и оптимизации обучения
уметь обучить по возможности оптимального агента для решения задачи, оценить его эффективность

Планируемые результаты обучения

владеть методами теоретического исследования используемых алгоритмов
знать основные парадигмы обучения с подкреплением и границы их применимости
знать что такое среда, состояние и агент в обучении с подкреплением
уметь выбирать архитектуру рекуррентной нейронной сети и обучать её
уметь достигать баланса между exploration и exploitation
уметь обучить по возможности оптимального агента для решения задачи, оценить его эффективность
уметь применять различные трюки для ускорения и оптимизации обучения
уметь распознавать ситуации, в которых уместно применение методов обучения с подкреплением
уметь сформулировать задачу обучения с подкреплением и выбрать эффективный способ её решения