Zum Inhalt

Unifying Two Operators with One PIM: Leveraging Hybrid Bonding for Efficient LLM Inference

  • 2026
  • OriginalPaper
  • Buchkapitel
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Dieses Kapitel untersucht die Herausforderungen und Lösungen im Bereich effizienter großsprachiger Modelle (LLM) und konzentriert sich dabei auf die duale rechnerische Beschaffenheit von Vorfüll- und Dekodierphasen. Es stellt HB-PIM vor, eine hybride bonding-basierte Processing-in-Memory-Architektur (PIM), die GEMM- und GEMV-Operationen vereint, die Hardwarenutzung verbessert und die Verarbeitungslatenz verringert. Der Text vertieft sich in die Hardwarearchitektur von HB-PIM, einschließlich seiner Dual-Mode-Verarbeitungseinheit und seines Scheduling-Frameworks, das die Arbeitslastaufteilung und Datenplatzierung optimiert. Experimentelle Ergebnisse zeigen signifikante Leistungsverbesserungen gegenüber den modernsten Basislinien und unterstreichen die Vorteile der Hybrid-Bonding-Technologie bei der LLM-Inferenz. Das Kapitel behandelt auch verwandte Arbeiten in PIM-Architekturen und die Aufteilung der Arbeitslast und bietet einen umfassenden Überblick über die aktuelle Landschaft und zukünftige Richtungen in diesem Bereich.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Titel
Unifying Two Operators with One PIM: Leveraging Hybrid Bonding for Efficient LLM Inference
Verfasst von
Jiaxian Chen
Yuxuan Qi
Kaoyi Sun
Zhiliang Lin
Tianyu Wang
Chenlin Ma
Yi Wang
Copyright-Jahr
2026
Verlag
Springer Nature Singapore
DOI
https://doi.org/10.1007/978-981-95-1021-4_16
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, NTT Data/© NTT Data, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, FAST LTA/© FAST LTA, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, WSW Software GmbH/© WSW Software GmbH, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH