nach oben

Erschienen in:

2020 | OriginalPaper | Buchkapitel

5. Schätzer für Zustandsbewertung und Aktionsauswahl

verfasst von : Uwe Lorenz

Erschienen in: Reinforcement Learning

Verlag: Springer Berlin Heidelberg

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Zusammenfassung

In der Regel reichen die verfügbaren Ressourcen nicht aus, um Steuerung, Bewertungsfunktion oder Modell tabellarisch zu erfassen. Daher werden in diesem Kapitel parametrisierte Schätzer eingeführt, mit denen wir z. B. die Bewertung von Zuständen auch dann abschätzen können, wenn sie nicht in genau gleicher Form zuvor beobachtet worden sind. Im Besonderen wird auf die sogenannten „künstliche neuronale Netze“ eingegangen. Wir werden auch Möglichkeiten kennenlernen, mit solchen Schätzern parametrisierte Policies zu erstellen, die bei einem gegebenen Zustand eine Wahrscheinlichkeitsverteilung über die zur Verfügung stehenden Aktionen generieren.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel Entscheiden und Lernen in einer unbekannten Umwelt

Nächstes Kapitel Leitbilder in der Künstlichen Intelligenz

Nur mit Berechtigung zugänglich

auch „efferente Nervenzellen“ oder „Motoneuronen“.

Autor: Zoran Sevarac; Copyright 2010 Neuroph Project http://neuroph.sourceforge.net Licensed under the Apache License, Version 2.0 (the „License“); http://www.apache.org/licenses/LICENSE-2.0 Weitere Hinweise sind in den Files des zitierten Programmcodes.

Autor: Zoran Sevarac; Copyright 2010 Neuroph Project http://neuroph.sourceforge.netLicensed under the Apache License, Version 2.0 (the „License“);http://www.apache.org/licenses/LICENSE-2.0; Weitere Hinweise sind in den Files des zitierten Programmcodes.

Alpaydin, Ethem (2019) Maschinelles Lernen. 2., erweiterte Auflage (De Gruyter Studium)

Been, Kim, Pavlus, John (2019) A new approach to understanding how machines think. In: Quantamagazine. https://www.quantamagazine.org/been-kim-is-building-a-translator-for-artificial-intelligence-20190110/

Churchland, Patricia S, Sejnowski, Terrence J (1997) Grundlagen zur Neuroinformatik und Neurobiologie. The Computational Brain in deutscher Sprache: vieweg Computational Intelligence

Fyfe, Colin (2007) Hebbian learning and negative feedback networks. advanced information and knowledge processing. Dordrecht: Springer (Advanced Information and Knowledge Processing). http://gbv.eblib.com/patron/FullRecord.aspx?p=371973

Hassabis, Demis (2014) Deepmind artificial intelligence @ FDOT14. https://www.youtube.com/watch?v=EfGD2qveGdQ

Hebb, Donald O (1949) Organization of Behavior

Kandel, Eric R (2009) Auf der Suche nach dem Gedächtnis. Die Entstehung einer neuen Wissenschaft des Geistes. Taschenbuchausg., 4. Aufl. München: Goldmann (Goldmann, 15570)

Kavukcuoglu, Koray, Minh, Volodymyr, Silver, David (2015) Human-level control through deep reinforcement learning. In: Nature. https://web.stanford.edu/class/psych209/Readings/MnihEtAlHassibis15NatureControlDeepRL.pdf

Sutton, Richard S, Barto, Andrew (2018) Reinforcement learning. An introduction. Second edition. Cambridge, MA, London: The MIT Press (Adaptive computation and machine learning)

Titel: Schätzer für Zustandsbewertung und Aktionsauswahl
verfasst von: Uwe Lorenz
Verlag: Springer Berlin Heidelberg
Buch: Reinforcement Learning
Print ISBN: 978-3-662-61650-5

Electronic ISBN: 978-3-662-61651-2

Copyright-Jahr: 2020
DOI: https://doi.org/10.1007/978-3-662-61651-2_5

Springer Professional

Zusammenfassung

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"