Skip to main content
Top

2024 | OriginalPaper | Chapter

3. Optimal entscheiden in einer bekannten Umwelt

Author : Uwe Lorenz

Published in: Reinforcement Learning

Publisher: Springer Berlin Heidelberg

Activate our intelligent search to find suitable subject content or patents.

search-config
loading …

Zusammenfassung

In diesem Abschnitt wird beschrieben, wie eine optimale Handlungsstrategie in einer Umwelt mit einer endlichen Anzahl von Zuständen und Aktionsmöglichkeiten berechnet werden kann. Sie lernen den Unterschied zwischen einer „off-Policy“- und einer „on-Policy“-Bewertung von Aktionsmöglichkeiten kennen. Es werden die beiden Ansätze „Zustandsbewertung“ und „Taktiksuche“ vorgestellt und in Übungsszenarien mit dem Java-Hamster angewendet und ausprobiert. Zudem werden wir die „Policy-Iteration“ als Kombination der beiden unterschiedlichen Ansätze kennen lernen, die sich hier auf interessante Weise ergänzen. Daraus lässt sich eine allgemeine Strategie zur Suche von optimalem Verhalten ableiten. Schließlich wird auf der erarbeiteten Grundlage die Ermittlung von optimalen Zügen in einem überschaubaren Brettspielszenario mit einem Gegenspieler vorgestellt.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Appendix
Available only for authorised users
Footnotes
1
Vgl. Sutton und Barto 2018, Kap. 4.​1
 
2
Prozesse die einander widersprechen, aber doch eine Einheit bilden und sich u. U. in einer neuen.
Stufe aufheben können.
 
Literature
go back to reference Alpaydin E (2019) Maschinelles Lernen., 2., erweiterte Auflage. De Gruyter Studium, Berlin/Boston. Alpaydin E (2019) Maschinelles Lernen., 2., erweiterte Auflage. De Gruyter Studium, Berlin/Boston.
go back to reference Russell S, Norvig P (2010) Artificial intelligence. A modern approach, 3. Aufl. Pearson Education, New Jersey Russell S, Norvig P (2010) Artificial intelligence. A modern approach, 3. Aufl. Pearson Education, New Jersey
go back to reference Sutton RS, Barto A (2018) Reinforcement learning. An introduction, 2. Aufl. The MIT Press (Adaptive computation and machine learning), Cambridge/London Sutton RS, Barto A (2018) Reinforcement learning. An introduction, 2. Aufl. The MIT Press (Adaptive computation and machine learning), Cambridge/London
Metadata
Title
Optimal entscheiden in einer bekannten Umwelt
Author
Uwe Lorenz
Copyright Year
2024
Publisher
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-662-68311-8_3

Premium Partner