Видео
Конечный марковский процесс принятия решений и управление методом Монте-Карло

Конечный марковский процесс принятия решений и управление методом Монте-Карло

Основное внимание на этом занятии уделяется Марковскому процессу принятия решений (MDP) и управлению Монте-Карло (MCC). Первый является математической основой для моделирования принятия решений в условиях, когда результаты действий ненадежны. А второй — метод поиска оптимальных стратегий. На занятии разберем, как работает этот метод, на простом примере, чтобы создать интуитивное понимание. На простых примерах преподаватель познакомит вас с формальными математическими определениями MDP, чтобы прямо во время занятия усовершенствовать и усложнить их. Урок завершится обзором доступных пакетов с открытым исходным кодом для решений RL в бенчмаркинге. После урока слушатели получат вводные задачи по RL в качестве домашней работы. Для кого: DS/ML/DL специалисты, IT-специалисты, которые хотят погрузиться в обучение с подкреплением. «Reinforcement Learning» - https://otus.pw/dkgc/
Преподаватель: Андрей Маргерт - исследователь Машинного Обучения в Wageningen Research, работает над технологиями для улучшения качества, безопасности и доступности продуктов Пройдите опрос по итогам мероприятия - https://otus.pw/J9FF/
Следите за новостями проекта: Telegram: https://t.me/Otusjava
ВКонтакте: https://otus.pw/850t
LinkedIn: https://otus.pw/yQwQ/
Хабр: https://otus.pw/S0nM/

Конечный марковский процесс принятия решений и управление методом Монте-Карло

Смотрите также