nach oben

Erschienen in:

2012 | OriginalPaper | Buchkapitel

Actor-Critic Algorithm Based on Incremental Least-Squares Temporal Difference with Eligibility Trace

verfasst von : Yuhu Cheng, Huanting Feng, Xuesong Wang

Erschienen in: Advanced Intelligent Computing Theories and Applications. With Aspects of Artificial Intelligence

Verlag: Springer Berlin Heidelberg

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Compared with value-function-based reinforcement learning (RL) methods, policy gradient reinforcement learning methods have better convergence, but large variance of policy gradient estimation influences the learning performance. In order to improve the convergence speed of policy gradient RL methods and the precision of gradient estimation, a kind of Actor-Critic (AC) learning algorithm based on incremental least-squares temporal difference with eligibility trace (iLSTD(

)) is proposed by making use of the characteristics of AC framework, function approximator and iLSTD(

) algorithm. The Critic estimates the value-function according to the iLSTD(

) algorithm, and the Actor updates the policy parameter based on a regular gradient. Simulation results concerning a grid world with 10×10 size illustrate that the AC algorithm based on iLSTD(

) not only has quick convergence speed but also has good gradient estimation.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel Lazy Learning for Multi-class Classification Using Genetic Programming

Nächstes Kapitel Active and Passive Nearest Neighbor Algorithm: A Newly-Developed Supervised Classifier

Titel: Actor-Critic Algorithm Based on Incremental Least-Squares Temporal Difference with Eligibility Trace
verfasst von: Yuhu Cheng
Huanting Feng
Xuesong Wang
Verlag: Springer Berlin Heidelberg
Buch: Advanced Intelligent Computing Theories and Applications. With Aspects of Artificial Intelligence
Print ISBN: 978-3-642-25943-2

Electronic ISBN: 978-3-642-25944-9

Copyright-Jahr: 2012
DOI: https://doi.org/10.1007/978-3-642-25944-9_24

Springer Professional

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"

Premium Partner