Zum Inhalt

Viability of Future Actions: Robust Safety in Reinforcement Learning via Entropy Regularization

  • 2026
  • OriginalPaper
  • Buchkapitel
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Dieses Kapitel untersucht die Durchführbarkeit zukünftiger Maßnahmen zur Stärkung des Lernens und konzentriert sich auf die Erreichung robuster Sicherheit durch Entropie-Regularisierung und Misserfolgsstrafen. Die Studie zeigt empirisch und theoretisch, dass die Regulierung der Entropie in Kombination mit Strafen für Fehlschläge eine Politik auslöst, die Beschränkungen vermeidet und robust gegenüber Handlungslärm ist. Der Text untersucht die Wechselwirkung zwischen Beschränkungen und Entropie und zeigt, wie diese Kombination Strategien fördert, die eine hohe Anzahl praktikabler Maßnahmen erhalten. Sie bietet auch einen praktischen Ansatz zur Annäherung an beschränkte Probleme mithilfe von Ausfallsstrafen, wodurch die Ergebnisse auf modellfreie Lernalgorithmen zur Verstärkung anwendbar werden. Das Kapitel schließt mit empirischen Beweisen aus Netzwelten und MuJoCo-Benchmarks, die die Robustheit von Entropie-regulierten Maßnahmen unter erhöhtem Handlungslärm veranschaulichen. Darüber hinaus werden die Zielkonflikte zwischen Leistung und Robustheit diskutiert und Einblicke in das Hyperparametertuning für RL-Praktiker gegeben.

Supplementary Information

The online version contains supplementary material available at https://​doi.​org/​10.​1007/​978-3-032-06106-5_​8.
P.-F. Massiani and A. von Rohr—Equal contribution.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Titel
Viability of Future Actions: Robust Safety in Reinforcement Learning via Entropy Regularization
Verfasst von
Pierre-François Massiani
Alexander von Rohr
Lukas Haverbeck
Sebastian Trimpe
Copyright-Jahr
2026
DOI
https://doi.org/10.1007/978-3-032-06106-5_8
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, NTT Data/© NTT Data, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, WSW Software GmbH/© WSW Software GmbH, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG