Reinforcement Learning

Ziel von Reinforcement Learning 
Markov Decision Process (MDP) 
Interaktion Agent & Umgebung in MDPs 
Policy 
State-(Action)-Value-Funktion 
Modellbasiertes vs. modellfreies RL