Zum Inhalt

Using Curiosity for an Even Representation of Tasks in Continual Offline Reinforcement Learning

  • 28.10.2023
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Der Artikel vertieft sich in die Anwendung von Neugier beim kontinuierlichen Offline-Verstärkungslernen und konzentriert sich auf die Linderung katastrophalen Vergessens. Es werden zwei neue Strategien zur Wiederholungspufferung vorgestellt: der Hybrid Curious Replay Buffer (HCB) und der Hybrid Reservoir Buffer with Task Separation (HRBTS). Das HCB verwendet Neugier als prioritäre Messgröße für die Aufbewahrung alter Proben, während das HRBTS Neugier einsetzt, um Aufgabenänderungen zu erkennen. Diese Strategien werden in verschiedenen Szenarien kontinuierlichen Lernens mit bestehenden Methoden verglichen, was ihre Effektivität bei der Aufrechterhaltung einer ausgewogenen Vertretung der Aufgaben und der Steigerung der Gesamtleistung demonstriert. Die Experimente, die in Umgebungen wie Pendel, Hopper und MetaWorld durchgeführt wurden, zeigen die Überlegenheit der vorgeschlagenen Methoden im Umgang mit Task Drift und häufigen Task-Begegnungen.

Sie sind noch kein Kunde? Dann Informieren Sie sich jetzt über unsere Lizenzmodelle:

Einzelzugang

Starten Sie jetzt Ihren persönlichen Einzelzugang. Erhalten Sie sofortigen Zugriff auf mehr als 170.000 Bücher und 540 Zeitschriften - pdf-Downloads und Neu-Erscheinungen inklusive.

Jetzt ab 54,00 € pro Monat!                                        

Mehr erfahren

Zugang für Unternehmen

Nutzen Sie Springer Professional in Ihrem Unternehmen und geben Sie Ihren Mitarbeitern fundiertes Fachwissen an die Hand. Fordern Sie jetzt Informationen für Firmenzugänge an.

Erleben Sie, wie Springer Professional Sie in Ihrer Arbeit unterstützt!

Beraten lassen
Titel
Using Curiosity for an Even Representation of Tasks in Continual Offline Reinforcement Learning
Verfasst von
Pankayaraj Pathmanathan
Natalia Díaz-Rodríguez
Javier Del Ser
Publikationsdatum
28.10.2023
Verlag
Springer US
Erschienen in
Cognitive Computation / Ausgabe 1/2024
Print ISSN: 1866-9956
Elektronische ISSN: 1866-9964
DOI
https://doi.org/10.1007/s12559-023-10213-9
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Bildnachweise
AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, ams.solutions GmbH/© ams.solutions GmbH, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Deutsche Telekom MMS GmbH/© Vendosoft, Noriis Network AG/© Noriis Network AG, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG, Doxee AT GmbH/© Doxee AT GmbH , Haufe Group SE/© Haufe Group SE, NTT Data/© NTT Data, Videocast 1: Standbild/© Springer Fachmedien Wiesbaden, IT-Director und IT-Mittelstand: Ihre Webinar-Matineen /© da-kuk / Getty Images / iStock