Skip to main content

2013 | OriginalPaper | Buchkapitel

Designing Parallel Sparse Matrix Transposition Algorithm Using CSR for GPUs

verfasst von : Tien-Hsiung Weng, Hoa Pham, Hai Jiang, Kuan-Ching Li

Erschienen in: Intelligent Technologies and Engineering Systems

Verlag: Springer New York

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

In this chapter, we propose a parallel algorithm for sparse matrix transposition using CSR format to run on many-core GPUs, utilizing the tremendous computational power and memory bandwidth of the GPU offered by parallel programming in CUDA. Our code is run on a quad-core Intel Xeon64 CPU E5507 platform and a NVIDIA GPU GTX 470 card. We measure the performance of our algorithm running with input ranging from smaller to larger matrices, and our experimental results show that the preliminary results are scaling well up to 512 threads and are promising for bigger matrices.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat NVIDIA (2008) CUDA programming guide. NVIDIA Corporation, June, 2008, version 2.0. NVIDIA (2008) CUDA programming guide. NVIDIA Corporation, June, 2008, version 2.0.
2.
Zurück zum Zitat Buluç A, Fineman JT, Frigo M, Gilbert JR, Leiserson CE (2009) Parallel sparse matrix-vector and matrix-transpose-vector multiplication using compressed sparse blocks. In: Proceedings of the 21th annual symposium on parallelism in algorithms and architectures, Calgary, 2009, pp 233–244 Buluç A, Fineman JT, Frigo M, Gilbert JR, Leiserson CE (2009) Parallel sparse matrix-vector and matrix-transpose-vector multiplication using compressed sparse blocks. In: Proceedings of the 21th annual symposium on parallelism in algorithms and architectures, Calgary, 2009, pp 233–244
4.
Zurück zum Zitat Krishnamoorthy S, Baumgartner G, Cociorva D, Lam C-C, Sadayappan P (2004) Efficient parallel out-of-core matrix transposition. Int J High Perform Comput Netw 2(2–4):110–119CrossRef Krishnamoorthy S, Baumgartner G, Cociorva D, Lam C-C, Sadayappan P (2004) Efficient parallel out-of-core matrix transposition. Int J High Perform Comput Netw 2(2–4):110–119CrossRef
5.
Zurück zum Zitat Mateescu G, Bauer GH, Fiedler RA (2011) Optimizing matrix transposes using a POWER7 cache model and explicit prefetching. In: Proceedings of the second international workshop on performance modeling, benchmarking and simulation of high performance computing systems, 2011, pp 5–6 Mateescu G, Bauer GH, Fiedler RA (2011) Optimizing matrix transposes using a POWER7 cache model and explicit prefetching. In: Proceedings of the second international workshop on performance modeling, benchmarking and simulation of high performance computing systems, 2011, pp 5–6
6.
Zurück zum Zitat Stathis P, Cheresiz D, Vassiliadis S, Juurlink B (2004) Sparse matrix transpose unit. In: Proceeding of the 18th international conference on parallel and distributed processing symposium (IPDPS), 2004 Stathis P, Cheresiz D, Vassiliadis S, Juurlink B (2004) Sparse matrix transpose unit. In: Proceeding of the 18th international conference on parallel and distributed processing symposium (IPDPS), 2004
7.
Zurück zum Zitat Gustavson FG (1978) Two fast algorithms for sparse matrices: multiplication and permuted transposition. ACM Trans Math Softw 4(3):250–269MathSciNetMATHCrossRef Gustavson FG (1978) Two fast algorithms for sparse matrices: multiplication and permuted transposition. ACM Trans Math Softw 4(3):250–269MathSciNetMATHCrossRef
8.
Zurück zum Zitat Davis TA (1994) University of Florida sparse matrix collection. NA Dig 92 Davis TA (1994) University of Florida sparse matrix collection. NA Dig 92
9.
Zurück zum Zitat Li K-C, Weng T-H (2009) Performance-based parallel application toolkit for high-performance clusters. J Supercomput 48(1):43–65MATHCrossRef Li K-C, Weng T-H (2009) Performance-based parallel application toolkit for high-performance clusters. J Supercomput 48(1):43–65MATHCrossRef
Metadaten
Titel
Designing Parallel Sparse Matrix Transposition Algorithm Using CSR for GPUs
verfasst von
Tien-Hsiung Weng
Hoa Pham
Hai Jiang
Kuan-Ching Li
Copyright-Jahr
2013
Verlag
Springer New York
DOI
https://doi.org/10.1007/978-1-4614-6747-2_31

Neuer Inhalt