Skip to main content

2020 | OriginalPaper | Buchkapitel

5. Schätzer für Zustandsbewertung und Aktionsauswahl

verfasst von : Uwe Lorenz

Erschienen in: Reinforcement Learning

Verlag: Springer Berlin Heidelberg

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

In der Regel reichen die verfügbaren Ressourcen nicht aus, um Steuerung, Bewertungsfunktion oder Modell tabellarisch zu erfassen. Daher werden in diesem Kapitel parametrisierte Schätzer eingeführt, mit denen wir z. B. die Bewertung von Zuständen auch dann abschätzen können, wenn sie nicht in genau gleicher Form zuvor beobachtet worden sind. Im Besonderen wird auf die sogenannten „künstliche neuronale Netze“ eingegangen. Wir werden auch Möglichkeiten kennenlernen, mit solchen Schätzern parametrisierte Policies zu erstellen, die bei einem gegebenen Zustand eine Wahrscheinlichkeitsverteilung über die zur Verfügung stehenden Aktionen generieren.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Anhänge
Nur mit Berechtigung zugänglich
Fußnoten
1
auch „efferente Nervenzellen“ oder „Motoneuronen“.
 
2
Autor: Zoran Sevarac; Copyright 2010 Neuroph Project http://​neuroph.​sourceforge.​net Licensed under the Apache License, Version 2.0 (the „License“); http://​www.​apache.​org/​licenses/​LICENSE-2.​0 Weitere Hinweise sind in den Files des zitierten Programmcodes.
 
3
Autor: Zoran Sevarac; Copyright 2010 Neuroph Project http://​neuroph.​sourceforge.​netLicensed under the Apache License, Version 2.0 (the „License“);http://​www.​apache.​org/​licenses/​LICENSE-2.​0; Weitere Hinweise sind in den Files des zitierten Programmcodes.
 
Literatur
Zurück zum Zitat Alpaydin, Ethem (2019) Maschinelles Lernen. 2., erweiterte Auflage (De Gruyter Studium) Alpaydin, Ethem (2019) Maschinelles Lernen. 2., erweiterte Auflage (De Gruyter Studium)
Zurück zum Zitat Churchland, Patricia S, Sejnowski, Terrence J (1997) Grundlagen zur Neuroinformatik und Neurobiologie. The Computational Brain in deutscher Sprache: vieweg Computational Intelligence Churchland, Patricia S, Sejnowski, Terrence J (1997) Grundlagen zur Neuroinformatik und Neurobiologie. The Computational Brain in deutscher Sprache: vieweg Computational Intelligence
Zurück zum Zitat Hebb, Donald O (1949) Organization of Behavior Hebb, Donald O (1949) Organization of Behavior
Zurück zum Zitat Kandel, Eric R (2009) Auf der Suche nach dem Gedächtnis. Die Entstehung einer neuen Wissenschaft des Geistes. Taschenbuchausg., 4. Aufl. München: Goldmann (Goldmann, 15570) Kandel, Eric R (2009) Auf der Suche nach dem Gedächtnis. Die Entstehung einer neuen Wissenschaft des Geistes. Taschenbuchausg., 4. Aufl. München: Goldmann (Goldmann, 15570)
Zurück zum Zitat Sutton, Richard S, Barto, Andrew (2018) Reinforcement learning. An introduction. Second edition. Cambridge, MA, London: The MIT Press (Adaptive computation and machine learning) Sutton, Richard S, Barto, Andrew (2018) Reinforcement learning. An introduction. Second edition. Cambridge, MA, London: The MIT Press (Adaptive computation and machine learning)
Metadaten
Titel
Schätzer für Zustandsbewertung und Aktionsauswahl
verfasst von
Uwe Lorenz
Copyright-Jahr
2020
Verlag
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-662-61651-2_5