Основы обучения с подкреплением

Магистратура 2024/2025

Статус: Курс по выбору (Исследования и предпринимательство в искусственном интеллекте)

Направление: 01.04.02. Прикладная математика и информатика

Кто читает: Департамент больших данных и информационного поиска

Где читается: Факультет компьютерных наук

Когда читается: 1-й курс, 4 модуль

Формат изучения: без онлайн-курса

Охват аудитории: для своего кампуса

Прогр. обучения: Исследования и предпринимательство в искусственном интеллекте

Язык: русский

Кредиты: 3

Контактные часы: 40

Аннотация

Курс посвящен Обучению с подкреплением (RL) — построению алгоритмов, которые изучают систему методом проб и ошибок. В отличие от традиционного машинного обучения, которому необходимо запоминать эталонные «лучшие» результаты, методы RL должны сначала определить, какие именно результаты являются "лучшими". Вместе мы прокачаем основы RL, изучим инженерные «хаки», используемые для решения реальных задач RL, изучим промышленные приложения и имеющиеся актуальные исследовательские работы. В курсе представлены самые разные приложения: от игр и робототехники до рекомендательных систем и машинного перевода.

Программа дисциплины

Программа дисциплины

Аннотация