Obozov M.A. "Stochastic Q-learning. Алгоритмы для больших дискретных пространств."
🚀https://t.me/sberlogabig/485
👨🔬 Obozov M.A. "Stochastic Q-learning. Алгоритмы для больших дискретных пространств." ⌚️ Четверг 8 августа 20.15 по Москве До этого мы рассматривали достаточно общие алгоритмы в рамках RL-задач. Однако, данные алгоритмы хоть и хорошо работают в целом, они не создавались для задачах с большими дискретными пространствами и показывают неоптимальную вычислительную сложность, а следовательно и для задач кубика рубика или теории групп. В рамках данного доклада мы рассмотрим алгоритм Stochastic Q-Learning, который показывает наилучшие результаты в рамках задач больших дискретных пространств с точки зрения перфоманса и робастности. В дальнейшем предлагается обобщить результаты этого подхода на нашу задачу и другие методы.