Видео
TD Learning и Q-learning // Демо-занятие курса «Reinforcement Learning»

TD Learning и Q-learning // Демо-занятие курса «Reinforcement Learning»

Вместе с экспертом погрузимся во временно-разностное обучение и Q-learning. Поговорим об основных идеях обучения с подкреплением, которые делают алгоритм RL более гибким и эффективным. Разберем алгоритм SARSA с различными примерами реализации. Обсудим сильные и слабые стороны каждого решения. Для кого: DS/ML/DL специалисты, IT-специалисты, которые хотят погрузиться в обучение с подкреплением «Reinforcement Learning» - https://otus.pw/hkre/
Преподаватель: Андрей Маргерт - исследователь Машинного Обучения в Wageningen Research, работает над технологиями для улучшения качества, безопасности и доступности продуктов Пройдите опрос по итогам мероприятия - https://otus.pw/732R/
Следите за новостями проекта: Telegram: https://t.me/Otusjava
ВКонтакте: https://otus.pw/850t
LinkedIn: https://otus.pw/yQwQ/
Хабр: https://otus.pw/S0nM/

TD Learning и Q-learning // Демо-занятие курса «Reinforcement Learning»

Смотрите также