Zum Inhalt

Power-law initialization algorithm for convolutional neural networks

  • 10.08.2023
  • Original Article
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Der Artikel stellt einen leistungsrechtlichen Initialisierungsalgorithmus für konvolutionale neuronale Netzwerke (CNNs) vor, der die entscheidende Rolle der Gewichtsinitialisierung beim Erreichen optimaler Lösungen behandelt. Traditionelle Methoden, die auf Intervallabstand und Varianzskalierung beruhen, stehen häufig vor Problemen wie langsamer Konvergenz und lokalem Optimum. Die vorgeschlagene Methode Normalized Symmetric Power Law (NSPL) analysiert die räumliche Verteilung der Gewichte in vortrainierten Modellen und zeigt eine Verteilung des Leistungsrechts auf, die über Schichten und Positionen hinweg variiert. Experimente mit populären Datensätzen zeigen, dass NSPL bestehende Methoden wie He-Initialisierung übertrifft und schnellere Trainingsgeschwindigkeiten und höhere Genauigkeit erreicht. Dieser innovative Ansatz bietet eine vielversprechende Lösung, um die Effizienz und Leistung von CNN-Modellen zu steigern.

Sie sind noch kein Kunde? Dann Informieren Sie sich jetzt über unsere Lizenzmodelle:

Einzelzugang

Starten Sie jetzt Ihren persönlichen Einzelzugang. Erhalten Sie sofortigen Zugriff auf mehr als 170.000 Bücher und 540 Zeitschriften - pdf-Downloads und Neu-Erscheinungen inklusive.

Jetzt ab 54,00 € pro Monat!                                        

Mehr erfahren

Zugang für Unternehmen

Nutzen Sie Springer Professional in Ihrem Unternehmen und geben Sie Ihren Mitarbeitern fundiertes Fachwissen an die Hand. Fordern Sie jetzt Informationen für Firmenzugänge an.

Erleben Sie, wie Springer Professional Sie in Ihrer Arbeit unterstützt!

Beraten lassen
Titel
Power-law initialization algorithm for convolutional neural networks
Verfasst von
Kaiwen Jiang
Jian Liu
Tongtong Xing
Shujing Li
Shunyao Wu
Fengjing Shao
Rencheng Sun
Publikationsdatum
10.08.2023
Verlag
Springer London
Erschienen in
Neural Computing and Applications / Ausgabe 30/2023
Print ISSN: 0941-0643
Elektronische ISSN: 1433-3058
DOI
https://doi.org/10.1007/s00521-023-08881-7
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Bildnachweise
AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, ams.solutions GmbH/© ams.solutions GmbH, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Deutsche Telekom MMS GmbH/© Vendosoft, Noriis Network AG/© Noriis Network AG, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG, Doxee AT GmbH/© Doxee AT GmbH , Haufe Group SE/© Haufe Group SE, NTT Data/© NTT Data, Videocast 1: Standbild/© Springer Fachmedien Wiesbaden, IT-Director und IT-Mittelstand: Ihre Webinar-Matineen /© da-kuk / Getty Images / iStock