Action-Value-Funktion

Eine Action-Value-Funktion ist eine Funktion in der Verstärkungslernmethode der künstlichen Intelligenz, die angibt, wie viel zukünftiger Nutzen zu erwarten ist, wenn eine bestimmte Aktion in einem bestimmten Zustand ausgeführt wird. Mit anderen Worten, sie ist eine Funktion, die eine Aktion in einem bestimmten Zustand bewertet, indem sie die erwartete zukünftige Belohnung berücksichtigt. Ein Beispiel hierfür ist die Q-Funktion in der Q-Lernmethode.


» Glossar