nach oben

Erschienen in:

2002 | OriginalPaper | Buchkapitel

Q-Cut—Dynamic Discovery of Sub-goals in Reinforcement Learning

verfasst von : Ishai Menache, Shie Mannor, Nahum Shimkin

Erschienen in: Machine Learning: ECML 2002

Verlag: Springer Berlin Heidelberg

Enthalten in: Professional Book Archive

Zugang erhalten

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

We present the Q-Cut algorithm, a graph theoretic approach for automatic detection of sub-goals in a dynamic environment, which is used for acceleration of the Q-Learning algorithm. The learning agent creates an on-line map of the process history, and uses an efficient Max-Flow/Min-Cut algorithm for identifying bottlenecks. The policies for reaching bottlenecks are separately learned and added to the model in a form of options (macro-actions). We then extend the basic Q-Cut algorithm to the Segmented Q-Cut algorithm, which uses previously identified bottlenecks for state space partitioning, necessary for finding additional bottlenecks in complex environments. Experiments show significant performance improvements, particulary in the initial learning phase.

Vorheriges Kapitel On-Line Support Vector Machine Regression

Nächstes Kapitel A Multistrategy Approach to the Classification of Phases in Business Cycles

Titel: Q-Cut—Dynamic Discovery of Sub-goals in Reinforcement Learning
verfasst von: Ishai Menache
Shie Mannor
Nahum Shimkin
Verlag: Springer Berlin Heidelberg
Buch: Machine Learning: ECML 2002
Print ISBN: 978-3-540-44036-9

Electronic ISBN: 978-3-540-36755-0

Copyright-Jahr: 2002
DOI: https://doi.org/10.1007/3-540-36755-1_25

Neuer Inhalt

Bildnachweise

VDI-Icon, Profil Icon, inhalt2, Springer Professional Modul/© Springer Fachmedien Wiesbaden GmbH, Die Gewinner und Laudatoren des Sustainability Award in Automotive 2024/© Uli Regenscheit | ATZlive, Search Icon, Banner Hanser, Dr. Fabian Struck/© Forto Logistics SE & Co., Bau Immobilie/© Gina Sanders / Fotolia, Kundenpotenzial/© Andrii Yalanskyi / Getty Images / iStock, Zeitschrift Wissensmanagement Cover, PatentFit-Logo/© Springer Fachmedien Wiesbaden GmbH, ATZ-Webinar: Prototypenfreie Entwicklung durch Offline- und Driver-in-the-Loop-HiL-Tests /© (c) VI-grade, chassis.tech plus 2023/© [M] ATZlive / TÜV SÜD PRODUCT SERVICE GMBH, adäsion-Webinar-Matinee/© krystiannawrocki_ Getty Images

Springer Professional

Neuer Inhalt

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.