Zum Inhalt

Self-guided deep deterministic policy gradient with multi-actor

  • 03.03.2021
  • Original Article
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Der Artikel stellt Self-guided Deep Deterministic Policy Gradient with Multi-actor (SDDPGM) vor, eine Lernmethode zur Stärkung der Wahrnehmung und Repräsentation in hochdimensionalen Räumen. Traditionelle Lernmethoden zur Verstärkung haben mit kontinuierlichen Kontrollaufgaben zu kämpfen, aber SDDPGM führt einen selbstgesteuerten Mechanismus ein, der hervorragende episodische Erfahrungen nutzt, um die Handlungen des Agenten zu lenken und das Kritikernetzwerk zu aktualisieren. Darüber hinaus setzt SDDPGM einen Multiakteur-Mechanismus ein, der jede Episode in Phasen unterteilt, die jeweils von einem eigenen Akteursnetzwerk verwaltet werden, was die Lernstabilität deutlich verbessert. Experimentelle Ergebnisse zeigen, dass SDDPGM bei verschiedenen kontinuierlichen Kontrollaufgaben andere Algorithmen übertrifft, was sein Potenzial als vielversprechende Lernmethode zur Verstärkung hervorhebt.

Sie sind noch kein Kunde? Dann Informieren Sie sich jetzt über unsere Lizenzmodelle:

Einzelzugang

Starten Sie jetzt Ihren persönlichen Einzelzugang. Erhalten Sie sofortigen Zugriff auf mehr als 170.000 Bücher und 540 Zeitschriften - pdf-Downloads und Neu-Erscheinungen inklusive.

Jetzt ab 54,00 € pro Monat!                                        

Mehr erfahren

Zugang für Unternehmen

Nutzen Sie Springer Professional in Ihrem Unternehmen und geben Sie Ihren Mitarbeitern fundiertes Fachwissen an die Hand. Fordern Sie jetzt Informationen für Firmenzugänge an.

Erleben Sie, wie Springer Professional Sie in Ihrer Arbeit unterstützt!

Beraten lassen
Titel
Self-guided deep deterministic policy gradient with multi-actor
Verfasst von
Hongming Chen
Quan Liu
Shan Zhong
Publikationsdatum
03.03.2021
Verlag
Springer London
Erschienen in
Neural Computing and Applications / Ausgabe 15/2021
Print ISSN: 0941-0643
Elektronische ISSN: 1433-3058
DOI
https://doi.org/10.1007/s00521-021-05738-9
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, ams.solutions GmbH/© ams.solutions GmbH, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Deutsche Telekom MMS GmbH/© Vendosoft, Noriis Network AG/© Noriis Network AG, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG, Doxee AT GmbH/© Doxee AT GmbH , Haufe Group SE/© Haufe Group SE, NTT Data/© NTT Data, Videocast 1: Standbild/© Springer Fachmedien Wiesbaden, KI-Wissen für mittelständische Unternehmen/© Dell_Getty 1999938268, IT-Director und IT-Mittelstand: Ihre Webinar-Matineen /© da-kuk / Getty Images / iStock