State-(Action)-Value-Funktion

State-(Action)-Value-Funktion

Frage:

Was ist die State-Value-Funktion $v_\pi(s)$?

Wie unterscheidet sie sich von der State-Action-Value-Funktion $q_\pi(s, a)$?

Antwort:

Nur angemeldete Nutzer dürfen die Antwort sehen. Hier geht's zur kostenlosen Registrierung.