11. MDPs & Q-Learning

Markov Decision Process
State Transistion Matrix
Markov Process
Markov Reward Process
Return
Value Function
Polices
Lösung
Lösungsmethoden
Batch Learning
Q-Learning
$\alpha$

Kommentare

Nur angemeldete Nutzer dürfen kommentieren. Hier geht's zur kostenlosen Registrierung.

FAQ Kontakt Impressum Datenschutz Nutzungsbedingungen

© 2015 - 2024 Philipp Schweers