Diskussion:Markow-Entscheidungsproblem

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 10 Jahren von 109.90.216.187 in Abschnitt Belohnungsfunktion
Zur Navigation springen Zur Suche springen

Belohnungsfunktion

[Quelltext bearbeiten]

Die Belohnungsfunktion ist in der Regel eine Abbildung auf den State Action Space, nicht auf den State Space.

--109.90.216.187 Diskussion:Markow-Entscheidungsproblem#c-109.90.216.187-2014-03-17T20:49:00.000Z-Belohnungsfunktion11Beantworten