Заседание общемосковского научного семинара "Математические Методы Анализа Решений в Экономике, Бизнесе и Политике".
20 апреля (среда) 2022 г. в Национальном исследовательском университете «Высшая школа экономики» состоялось очередное заседание общемосковского научного семинара "Математические Методы Анализа Решений в Экономике, Бизнесе и Политике".
Руководители семинара:
д.т.н., проф. Алескеров Фуад Тагиевич,
д.т.н., проф. Подиновский Владислав Владимирович,
д.т.н., проф. Миркин Борис Григорьевич.
Тема: Remarks on new otimization techniques for reinforcement learning
Докладчик: Vadim Azhmyakov (HSE MIEM)
Аннотация:
Our talk is devoted to the control theoretical foundations and practical implementations of advanced computational optimization methods from the Optimal Control Theory (OCT) applied to Reinforcement Learning (RL). Recently some researchers (mostly from MIT, USA) have detected a deep interconnection between the classical OCT and the conceptual part of the RL. It is common knowledge, that the conventional OCT includes many effective, rigorous, and practically approved systems optimization algorithms. This fact is due to a relatively large “uptime” of this specific control engineering area. Our main idea consists in the natural methodology transfer from the numerical OCT to the modern RL and in general to Machine Learning (ML).