Definition: Lernmethode, bei der ein Modell durch Belohnungssysteme eigenständig optimales Verhalten erlernt.
Erläuterung / Anwendung: Häufig in Spielen, Robotik oder Prozessoptimierung eingesetzt.
Beispiel / NXS-AI-Bezug: NXS-AI nutzt RL z. B. bei der Optimierung von Antwortstrategien in Chatbots.