State-(Action)-Value-Funktion
Frage:
Was ist die State-Value-Funktion $v_\pi(s)$?
Wie unterscheidet sie sich von der State-Action-Value-Funktion $q_\pi(s, a)$?
Antwort:
Nur angemeldete Nutzer dürfen die Antwort sehen. Hier geht's zur kostenlosen Registrierung.
Kommentare
Nur angemeldete Nutzer dürfen kommentieren.
Hier geht's zur kostenlosen Registrierung.