Skip to main content
Erschienen in: The Journal of Supercomputing 3/2013

01.09.2013

A preliminary evaluation of OpenACC implementations

verfasst von: Ruymán Reyes, Iván López, Juan J. Fumero, Francisco de Sande

Erschienen in: The Journal of Supercomputing | Ausgabe 3/2013

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

During the last few years, the availability of hardware accelerators, such as GPUs, has rapidly increased. However, the entry cost to GPU programming is high and requires a considerable porting and tuning effort. Some research groups and vendors have made attempts to ease the situation by defining APIs and languages that simplify these tasks. In the wake of the success of OpenMP, industria and academia are working toward defining a new standard of compiler directives to leverage the GPU programming effort. Support from vendors and similarities with the upcoming OpenMP 4.0 standard lead us to believe that OpenACC is a good alternative for developers who want to port existing codes to accelerators. In this paper, we evaluate three OpenACC implementations: two commercial implementations (PGI and CAPS) and our own research implementation, accULL, to evaluate the current status and future directions of the standard.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Blackford LS, Demmel J, Dongarra J, Duff I, Hammarling S, Henry G, Heroux M, Kaufman L, Lumsdaine A, Petitet A, Pozo R, Remington K, Whaley RC (2001) An updated set of basic linear algebra subprograms (BLAS). ACM Trans Math Softw 28(2):135–151 CrossRef Blackford LS, Demmel J, Dongarra J, Duff I, Hammarling S, Henry G, Heroux M, Kaufman L, Lumsdaine A, Petitet A, Pozo R, Remington K, Whaley RC (2001) An updated set of basic linear algebra subprograms (BLAS). ACM Trans Math Softw 28(2):135–151 CrossRef
3.
Zurück zum Zitat Che S, Sheaffer JW, Boyer M, Szafaryn LG, Wang L, Skadron K (2010) A characterization of the Rodinia benchmark suite with comparison to contemporary CMP workloads. In: Proceedings of the IEEE international symposium on workload characterization (IISWC’10), IISWC ’10. IEEE Computer Society, Washington, pp 1–11 CrossRef Che S, Sheaffer JW, Boyer M, Szafaryn LG, Wang L, Skadron K (2010) A characterization of the Rodinia benchmark suite with comparison to contemporary CMP workloads. In: Proceedings of the IEEE international symposium on workload characterization (IISWC’10), IISWC ’10. IEEE Computer Society, Washington, pp 1–11 CrossRef
4.
Zurück zum Zitat Faulk S, Porter A, Gustafson J, Tichy W, Johnson P, Votta L (2004) Measuring high performance computing productivity. Int J High Perform Comput Appl 18(4):459–473 CrossRef Faulk S, Porter A, Gustafson J, Tichy W, Johnson P, Votta L (2004) Measuring high performance computing productivity. Int J High Perform Comput Appl 18(4):459–473 CrossRef
5.
Zurück zum Zitat Lusk E, Yelick K (2007) Languages for high-productivity computing: the DARPA HPCS language project. Parallel Process Lett 17(1):89–102 MathSciNetCrossRef Lusk E, Yelick K (2007) Languages for high-productivity computing: the DARPA HPCS language project. Parallel Process Lett 17(1):89–102 MathSciNetCrossRef
6.
Zurück zum Zitat Nickolls J, Buck I, Garland M, Skadron K (2008) Scalable parallel programming with CUDA. Queue 6(2):40–53 CrossRef Nickolls J, Buck I, Garland M, Skadron K (2008) Scalable parallel programming with CUDA. Queue 6(2):40–53 CrossRef
8.
Zurück zum Zitat Reyes R, López-Rodríguez I, Fumero JJ, de Sande F (2012) accULL: an OpenACC implementation with CUDA and OpenCL support. In: Kaklamanis C, Papatheodorou TS, Spirakis PG (eds) Euro-Par 2012 parallel processing—18th international conference, Euro-Par 2012, Rhodes Island, Greece, August 27–31, 2012. Lecture notes in computer science, vol 7484. Springer, Rhodes Island, pp 871–882 CrossRef Reyes R, López-Rodríguez I, Fumero JJ, de Sande F (2012) accULL: an OpenACC implementation with CUDA and OpenCL support. In: Kaklamanis C, Papatheodorou TS, Spirakis PG (eds) Euro-Par 2012 parallel processing—18th international conference, Euro-Par 2012, Rhodes Island, Greece, August 27–31, 2012. Lecture notes in computer science, vol 7484. Springer, Rhodes Island, pp 871–882 CrossRef
10.
Zurück zum Zitat Reyes R, de Sande F (2012) Optimization strategies in different CUDA architectures using llCoMP. Microprocess Microsyst 36(2):78–87 CrossRef Reyes R, de Sande F (2012) Optimization strategies in different CUDA architectures using llCoMP. Microprocess Microsyst 36(2):78–87 CrossRef
11.
Zurück zum Zitat Wolfe M (2010) Implementing the PGI Accelerator model. In: Proceedings of the 3rd workshop on general-purpose computation on graphics processing units, GPGPU ’10. ACM, New York, pp 43–50 CrossRef Wolfe M (2010) Implementing the PGI Accelerator model. In: Proceedings of the 3rd workshop on general-purpose computation on graphics processing units, GPGPU ’10. ACM, New York, pp 43–50 CrossRef
Metadaten
Titel
A preliminary evaluation of OpenACC implementations
verfasst von
Ruymán Reyes
Iván López
Juan J. Fumero
Francisco de Sande
Publikationsdatum
01.09.2013
Verlag
Springer US
Erschienen in
The Journal of Supercomputing / Ausgabe 3/2013
Print ISSN: 0920-8542
Elektronische ISSN: 1573-0484
DOI
https://doi.org/10.1007/s11227-012-0853-z

Weitere Artikel der Ausgabe 3/2013

The Journal of Supercomputing 3/2013 Zur Ausgabe

Premium Partner