Zum Inhalt

Understanding Data Preprocessing for Effective End-to-End Training of DNN

  • 2026
  • OriginalPaper
  • Buchkapitel
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Dieses Kapitel geht auf den oft übersehenen, aber kritischen Aspekt der Datenvorverarbeitung in Deep Learning (DL) -Trainingspipelines ein. Es untersucht die Datenvorverarbeitungsleitungen in drei großen Rahmenwerken: TensorFlow, MXNet und PyTorch und ihre Auswirkungen auf die allgemeine Trainingseffizienz. Der Text enthüllt, dass die meisten DL-Frameworks ähnliche Pipelines zur Datenvorverarbeitung gemeinsam haben, aber unterschiedliche DNN-Modelle unterschiedliche Geschwindigkeiten bei der Datenvorverarbeitung und beim tatsächlichen Training aufweisen. Das Kapitel hebt hervor, dass die meisten modellhaften Trainingsabläufe Engpässe beim Laden und der Vorverarbeitung von Daten aufweisen, die zu erheblicher Ressourcenverschwendung führen können, insbesondere zu unzureichend ausgelasteten GPUs. Um diese Engpässe zu beheben, untersucht der Text den Einsatz von CPU-GPU-Co-Processing zur Datenaufbereitung, was die Vorverarbeitungszeit erheblich reduzieren und die Trainingsleistung verbessern kann. Dieser Ansatz bringt jedoch auch Herausforderungen mit sich, wie Probleme mit dem Speicherausfall (OOM) und eine mögliche Verringerung des Durchsatzes aufgrund der gemeinsamen Nutzung von GPU. In diesem Kapitel werden auch die Auswirkungen von Speichermedien auf die Trainingsleistung diskutiert und gezeigt, dass Speichermedien mit hoher Bandbreite die Kosteneffizienz bestimmter DNN-Trainingseinheiten deutlich steigern können. Darüber hinaus schlägt der Text modellspezifische, feinkörnige Cloud-Konfigurationen für effiziente und kosteneffektive Schulungen vor und diskutiert das Potenzial der Ressourcenaufsplitterung im Cloud-Infrastrukturdesign. Das Kapitel schließt mit der Forderung nach automatisierten Werkzeugen zur Optimierung von Skalierungsentscheidungen und zur Verbesserung des Schulungsdurchsatzes und der Systemauslastung. Durch die umfassende Analyse von Pipelines zur Datenvorverarbeitung und deren Auswirkungen auf die Leistungsfähigkeit bietet dieses Kapitel wertvolle Einblicke in die Optimierung von DL-Trainingsabläufen und die Verbesserung der Ressourcennutzung.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Titel
Understanding Data Preprocessing for Effective End-to-End Training of DNN
Verfasst von
Ping Gong
Yuxin Ma
Cheng Li
Xiaosong Ma
Sam H. Noh
Copyright-Jahr
2026
Verlag
Springer Nature Singapore
DOI
https://doi.org/10.1007/978-981-95-1021-4_23
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, NTT Data/© NTT Data, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, FAST LTA/© FAST LTA, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, WSW Software GmbH/© WSW Software GmbH, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH