Q-Learning ist eine Unterart des bestärkenden Lernens, bei der die optimale action-value function, auch Q-Funktion genannt, gelernt werden soll. Dies gelingt über die Bellman-Gleichung.
» Glossar