Skip to main content
main-content

Tipp

Weitere Artikel dieser Ausgabe durch Wischen aufrufen

Erschienen in: The Journal of Supercomputing 6/2020

05.06.2019

A tool to assess the communication cost of parallel kernels on heterogeneous platforms

verfasst von: Juan A. Rico-Gallego, Sergio Moreno-Álvarez, Juan C. Díaz-Martín, Alexey L. Lastovetsky

Erschienen in: The Journal of Supercomputing | Ausgabe 6/2020

Einloggen, um Zugang zu erhalten
share
TEILEN

Abstract

Ensuring applications to achieve an efficient usage of resources and fast execution time in the complex current heterogeneous high-performance computing platforms is a paramount problem. Essential efforts to reach the goal are the optimal partitioning of the data space between the processes composing a typical task/data-parallel application, and their right mapping and deployment on the platform. The computational and communication performance modeling describing the platform and the application behaviors is an increasingly recognized approach. This paper discusses the utility of the \(\uptau\)–Lop analytic communication performance model in facing these issues and contributes with a practical symbolic computation tool that represents, manipulates and accurately evaluates the formal communication cost expression derived from a hybrid kernel. We identify a set of scenarios where the tool could be applied, provide with both basic and advanced use examples and evaluate the tool on real-life kernels.

Sie möchten Zugang zu diesem Inhalt erhalten? Dann informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 58.000 Bücher
  • über 300 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Testen Sie jetzt 15 Tage kostenlos.

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 50.000 Bücher
  • über 380 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




Testen Sie jetzt 15 Tage kostenlos.

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 69.000 Bücher
  • über 500 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Testen Sie jetzt 15 Tage kostenlos.

Fußnoten
1
Ring algorithm executes in \(P-1\) steps. In each step process with rank p sends a message of size m to process with rank \(p+1\) and receives a message of the same size from rank \(p-1\). The Recursive Doubling algorithm executes in \(\log _2 P\) steps by doubling the message size interchanged in each step. Process p communicates with process \(p \oplus 2^s\) in the step s.
 
Literatur
4.
Zurück zum Zitat Casanova H, Giersch A, Legrand A, Quinson M, Suter F (2014) Versatile, scalable, and accurate simulation of distributed applications and platforms. J Parallel Distrib Comput 74(10):2899–2917 CrossRef Casanova H, Giersch A, Legrand A, Quinson M, Suter F (2014) Versatile, scalable, and accurate simulation of distributed applications and platforms. J Parallel Distrib Comput 74(10):2899–2917 CrossRef
8.
Zurück zum Zitat Lastovetsky A, Reddy R (2007) Data partitioning with a functional performance model of heterogeneous processors. Int J High Perform Comput Appl 21(1):76–90 CrossRef Lastovetsky A, Reddy R (2007) Data partitioning with a functional performance model of heterogeneous processors. Int J High Perform Comput Appl 21(1):76–90 CrossRef
9.
Zurück zum Zitat Lastovetsky A, Mkwawa IH, O’Flynn M (2006) An accurate communication model of a heterogeneous cluster based on a switch-enabled Ethernet network. In: 12th International Conference on Parallel and Distributed Systems, 2006. ICPADS 2006, vol 2, p 6 Lastovetsky A, Mkwawa IH, O’Flynn M (2006) An accurate communication model of a heterogeneous cluster based on a switch-enabled Ethernet network. In: 12th International Conference on Parallel and Distributed Systems, 2006. ICPADS 2006, vol 2, p 6
13.
Zurück zum Zitat Van De Geijn RA, Watts J (1997) Summa: scalable universal matrix multiplication algorithm. Concurr Pract Exp 9(4):255–274 CrossRef Van De Geijn RA, Watts J (1997) Summa: scalable universal matrix multiplication algorithm. Concurr Pract Exp 9(4):255–274 CrossRef
Metadaten
Titel
A tool to assess the communication cost of parallel kernels on heterogeneous platforms
verfasst von
Juan A. Rico-Gallego
Sergio Moreno-Álvarez
Juan C. Díaz-Martín
Alexey L. Lastovetsky
Publikationsdatum
05.06.2019
Verlag
Springer US
Erschienen in
The Journal of Supercomputing / Ausgabe 6/2020
Print ISSN: 0920-8542
Elektronische ISSN: 1573-0484
DOI
https://doi.org/10.1007/s11227-019-02919-1

Weitere Artikel der Ausgabe 6/2020

The Journal of Supercomputing 6/2020 Zur Ausgabe

Premium Partner