nach oben

Erschienen in:

2008 | OriginalPaper | Buchkapitel

Proposal of Exploitation-Oriented Learning PS-r#

verfasst von : Kazuteru Miyazaki, Shigenobu Kobayashi

Erschienen in: Intelligent Data Engineering and Automated Learning – IDEAL 2008

Verlag: Springer Berlin Heidelberg

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Exploitation-oriented Learning

(XoL) is a novel approach to goal-directed learning from interaction. Though

reinforcement learning

is much more focus on the learning and can gurantee the optimality in

Markov Decision Processes

(MDPs) environments, XoL aims to learn

a rational policy

, whose expected reward per an action is larger than zero, very quickly. We know PS-r* that is one of the XoL methods. It can learn

an useful rational policy

that is not inferior to a random walk in

Partially Observed Markov Decision Processes

(POMDPs) environments where the number of types of a reward is one. However, PS-r* requires

(

) memories where

and

are the numbers of types of a sensory input and an action.In this paper, we propose PS-r

that can learn an useful rational policy in the POMDPs environments by

(

) memories. We confirm the effectiveness of PS-r

in numerical examples.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Nächstes Kapitel Kernel Regression with a Mahalanobis Metric for Short-Term Traffic Flow Forecasting

Titel: Proposal of Exploitation-Oriented Learning PS-r#
verfasst von: Kazuteru Miyazaki
Shigenobu Kobayashi
Verlag: Springer Berlin Heidelberg
Buch: Intelligent Data Engineering and Automated Learning – IDEAL 2008
Print ISBN: 978-3-540-88905-2

Electronic ISBN: 978-3-540-88906-9

Copyright-Jahr: 2008
DOI: https://doi.org/10.1007/978-3-540-88906-9_1

Springer Professional

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"