Skip to main content

2020 | OriginalPaper | Buchkapitel

4. Entscheiden und Lernen in einer unbekannten Umwelt

verfasst von : Uwe Lorenz

Erschienen in: Reinforcement Learning

Verlag: Springer Berlin Heidelberg

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

In diesem Kapitel wird beschrieben, wie der Agent ein unbekanntes Umweltsystem, in das er gesetzt wurde erkunden kann. Dabei entdeckt er Zustände mit Belohnungen und muss zum einen die Pfade zu diesen Zielen optimieren („Performanz verbessern“), zum anderen aber auch neue Ziele erkunden („Kompetenzen erlangen“). Hierbei muss er einen trade-off zwischen Ausbeutung und Erkundung berücksichtigen. Einerseits muss er den möglichen Lohn bereits entdeckter Ziele kassieren, andererseits die Erkundung besserer Pfade bzw. die Entdeckung neuer Ziele bewerkstelligen. Hierbei gibt es verschiedene Ansätze, zum einen zielen sie darauf ab, gemachte Erfahrungen so zu verarbeiten, dass sich der Agent unter gleichen Bedingungen künftig besser verhält „modellfreie Methoden“, zum anderen gibt es Ansätze, die darauf abzielen, Modelle, die vorhersagen können, was bei der Auswahl bestimmter Aktionen passieren würde, zu optimieren.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Anhänge
Nur mit Berechtigung zugänglich
Literatur
Zurück zum Zitat Dennett DC (2018) Von den Bakterien zu Bach – und zurück. Die Evolution des Geistes. Suhrkamp, Berlin Dennett DC (2018) Von den Bakterien zu Bach – und zurück. Die Evolution des Geistes. Suhrkamp, Berlin
Zurück zum Zitat Godfrey-Smith P (2019) Der Krake, das Meer und die tiefen Ursprünge des Bewusstseins, 1. Aufl. Matthes & Seitz Berlin, Berlin Godfrey-Smith P (2019) Der Krake, das Meer und die tiefen Ursprünge des Bewusstseins, 1. Aufl. Matthes & Seitz Berlin, Berlin
Zurück zum Zitat Kocsis L, Szepesvári C (2006) Bandit Based Monte-Carlo Planning. In: Fürnkranz J, Scheffer T und Spiliopoulou M (Hrsg) Machine learning: ECML 2006. 17th European Conference on Machine Learning, Berlin, Germany, September 18–22, 2006; Proceedings. ECML; European Conference on Machine Learning. Berlin: Springer (Lecture notes in computer science Lecture notes in artificial intelligence, 4212), S 282–293. Kocsis L, Szepesvári C (2006) Bandit Based Monte-Carlo Planning. In: Fürnkranz J, Scheffer T und Spiliopoulou M (Hrsg) Machine learning: ECML 2006. 17th European Conference on Machine Learning, Berlin, Germany, September 18–22, 2006; Proceedings. ECML; European Conference on Machine Learning. Berlin: Springer (Lecture notes in computer science Lecture notes in artificial intelligence, 4212), S 282–293.
Zurück zum Zitat Russell S, Norvig P (2010) Artificial intelligence. A modern approach, 3. Aufl. Pearson Education Inc., New JerseyMATH Russell S, Norvig P (2010) Artificial intelligence. A modern approach, 3. Aufl. Pearson Education Inc., New JerseyMATH
Zurück zum Zitat Sutton RS, Barto A (2018) Reinforcement learning. An introduction, 2. Aufl. The MIT Press, Cambridge (Adaptive computation and machine learning)MATH Sutton RS, Barto A (2018) Reinforcement learning. An introduction, 2. Aufl. The MIT Press, Cambridge (Adaptive computation and machine learning)MATH
Zurück zum Zitat Williams RJ (1992) Simple statistical gradient-following algorithms for connectionist reinforcement learning. Mach Learn 8(3–4):229–256MATH Williams RJ (1992) Simple statistical gradient-following algorithms for connectionist reinforcement learning. Mach Learn 8(3–4):229–256MATH
Metadaten
Titel
Entscheiden und Lernen in einer unbekannten Umwelt
verfasst von
Uwe Lorenz
Copyright-Jahr
2020
Verlag
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-662-61651-2_4

Premium Partner