Reinforcement Learning

Ziel von Reinforcement Learning
Markov Decision Process (MDP)
Interaktion Agent & Umgebung in MDPs
Policy
State-(Action)-Value-Funktion
Modellbasiertes vs. modellfreies RL

Kommentare

Nur angemeldete Nutzer dürfen kommentieren. Hier geht's zur kostenlosen Registrierung.