Skip to main content
Top

2024 | OriginalPaper | Chapter

4. Entscheiden und Lernen in einer unbekannten Umwelt

Author : Uwe Lorenz

Published in: Reinforcement Learning

Publisher: Springer Berlin Heidelberg

Activate our intelligent search to find suitable subject content or patents.

search-config
loading …

Zusammenfassung

In diesem Kapitel wird beschrieben, wie ein Agent ein unbekanntes Umweltsystem, in das er gesetzt wurde, erkunden kann. Dabei entdeckt er Zustände mit Belohnungen und muss zum einen die Pfade zu diesen Zielen optimieren, d. h. seine „Performanz verbessern“, zum anderen aber auch neue Ziele und Handlungsoptionen erkunden. Hierbei muss der Agent einen Kompromiss zwischen „Ausbeutung“ (Exploitation) und „Erkundung“ (Exploration) berücksichtigen. Einerseits muss er den möglichen Lohn bereits entdeckter Ziele kassieren, andererseits die Erkundung bewerkstelligen ohne zu wissen, ob sich der Abstecher ins Neuland überhaupt lohnt. Hierbei gibt es verschiedene Ansätze, die wertvollen Erfahrungen zu verarbeiten, die der Agent sammelt. Zum einen zielen sie darauf ab, diese so zu verarbeiten, dass der Agent unter gleichen Bedingungen künftig besser reagiert („Modellfreie Methoden“), zum anderen gibt es Ansätze, die darauf abzielen, Modelle zu verbessern, die vorhersagen können, was bei der Auswahl bestimmter Aktionen passieren würde. Zudem gibt es auch Ansätze, die Exploration zu optimieren. Dabei können Begriffe wie bspw. „Neugier“ oder „Langeweile“ als Inspirationsquelle dienen.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Appendix
Available only for authorised users
Literature
go back to reference Dennett DC (2018) Von den Bakterien zu Bach – und zurück. Die Evolution des Geistes. Suhrkamp, Berlin Dennett DC (2018) Von den Bakterien zu Bach – und zurück. Die Evolution des Geistes. Suhrkamp, Berlin
go back to reference Kocsis L, Szepesvári C (2006) Bandit Based Monte-Carlo Planning. In: Fürnkranz J, Scheffer T, Spiliopoulou M (Hrsg) Machine learning: ECML 2006. 17th European Conference on Machine Learning, Berlin, Germany, September 18–22, 2006; proceedings. ECML; European Conference on Machine Learning. Springer, Berlin (Lecture notes in computer science Lecture notes in artificial intelligence, 4212), S 282–293 Kocsis L, Szepesvári C (2006) Bandit Based Monte-Carlo Planning. In: Fürnkranz J, Scheffer T, Spiliopoulou M (Hrsg) Machine learning: ECML 2006. 17th European Conference on Machine Learning, Berlin, Germany, September 18–22, 2006; proceedings. ECML; European Conference on Machine Learning. Springer, Berlin (Lecture notes in computer science Lecture notes in artificial intelligence, 4212), S 282–293
go back to reference Godfrey-Smith P (2019) Der Krake, das Meer und die tiefen Ursprünge des Bewusstseins, 1. Aufl. Matthes & Seitz, Berlin Godfrey-Smith P (2019) Der Krake, das Meer und die tiefen Ursprünge des Bewusstseins, 1. Aufl. Matthes & Seitz, Berlin
go back to reference Legg S, Hutter M (2007) A collection of definitions of intelligence. In: IDSIA-07-07 Legg S, Hutter M (2007) A collection of definitions of intelligence. In: IDSIA-07-07
go back to reference Russell S, Norvig P (2010) Artificial intelligence. A modern approach, 3. Aufl. Pearson Education Inc., New Jersey, USA Russell S, Norvig P (2010) Artificial intelligence. A modern approach, 3. Aufl. Pearson Education Inc., New Jersey, USA
go back to reference Sutton RS, Barto A (2018) Reinforcement learning. An introduction. Second edition. The MIT Press, Cambridge (Adaptive computation and machine learning) Sutton RS, Barto A (2018) Reinforcement learning. An introduction. Second edition. The MIT Press, Cambridge (Adaptive computation and machine learning)
go back to reference Williams RJ (1992) Simple statistical gradient-following algorithms for connectionist reinforcement learning, S 229–256 Williams RJ (1992) Simple statistical gradient-following algorithms for connectionist reinforcement learning, S 229–256
Metadata
Title
Entscheiden und Lernen in einer unbekannten Umwelt
Author
Uwe Lorenz
Copyright Year
2024
Publisher
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-662-68311-8_4

Premium Partner