Обучение с подкреплением

Магистратура 2024/2025

Статус: Курс по выбору (Финансовые технологии и анализ данных)

Направление: 01.04.02. Прикладная математика и информатика

Кто читает: Базовая кафедра ПАО Сбербанк «Финансовые технологии и анализ данных»

Где читается: Факультет компьютерных наук

Когда читается: 2-й курс, 2 модуль

Формат изучения: без онлайн-курса

Охват аудитории: для своего кампуса

Прогр. обучения: Финансовые технологии и анализ данных

Язык: русский

Кредиты: 3

Полная версия программы учебной дисциплины

Аннотация

Цель курса - ознакомление студентов с основными подходами и алгоритмами обучения с подкреплением. Планируется дать понимание того, какие существуют подходы к решению задач обучения с подкреплением, научить выбирать подход и алгоритм, наиболее подходящий для рассматриваемой студентом задачи, научить обучать модели с использованием современных нейросетевых библиотек.

Цель освоения дисциплины

уметь распознавать ситуации, в которых уместно применение методов обучения с подкреплением
уметь сформулировать задачу обучения с подкреплением и выбрать эффективный способ её решения
знать основные парадигмы обучения с подкреплением и границы их применимости
уметь обучить по возможности оптимального агента для решения задачи, оценить его эффективность

Планируемые результаты обучения

владеть методами теоретического исследования используемых алгоритмов
знать основные парадигмы обучения с подкреплением и границы их применимости
знать что такое среда, состояние и агент в обучении с подкреплением
уметь обучить по возможности оптимального агента для решения задачи, оценить его эффективность
уметь сформулировать задачу обучения с подкреплением и выбрать эффективный способ её решения