Reinforcement Learning

Bellman
Policy optimal
policy improve
exploration / exploitation
exploration-exploitation trade-off
Q-Learning

Kommentare

Nur angemeldete Nutzer dürfen kommentieren. Hier geht's zur kostenlosen Registrierung.