Skip to main content
Erschienen in: Computing and Visualization in Science 1/2013

01.02.2013

A balanced accumulation scheme for parallel PDE solvers

verfasst von: Manfred Liebmann, Aurel Neic, Gundolf Haase

Erschienen in: Computing and Visualization in Science | Ausgabe 1/2013

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

We present a tailored load balancing technique that addresses specific performance issues in the boundary data accumulation algorithm for non-overlapping domain decompositions. The technique is used to speed up a parallel conjugate gradient algorithm with an algebraic multigrid preconditioner to solve a potential problem on an unstructured tetrahedral finite element mesh. The optimized accumulation algorithm significantly improves the performance of the parallel solver and we show up to 50 % runtime improvements over the standard approach in benchmark runs with up to 48 MPI processes. The load balancing problem itself is a global optimization problem that is solved approximately by local optimization algorithms in parallel that require no communication during the optimization process.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Baker, A.H., Schulz, M., Yang, U.M.: On the performance of an algebraic multigrid solver on multicore clusters. In: Palma, J.M.L.M., Daydé, M.J., Marques, O., Lopes, J.C. (eds.) VECPAR. Lecture Notes in Computer Science, vol. 6449, pp. 102–115. Springer (2010) Baker, A.H., Schulz, M., Yang, U.M.: On the performance of an algebraic multigrid solver on multicore clusters. In: Palma, J.M.L.M., Daydé, M.J., Marques, O., Lopes, J.C. (eds.) VECPAR. Lecture Notes in Computer Science, vol. 6449, pp. 102–115. Springer (2010)
2.
Zurück zum Zitat Briggs, W.L., Henson, V.E., McCormick, S.F.: A Multigrid Tutorial, 2nd edn. SIAM Books, Philadelphia (2000) Briggs, W.L., Henson, V.E., McCormick, S.F.: A Multigrid Tutorial, 2nd edn. SIAM Books, Philadelphia (2000)
3.
Zurück zum Zitat Dekker, A., Aarts, E.: Global optimization and simulated annealing. Math. Program. 50, 367–393 (1991)CrossRef Dekker, A., Aarts, E.: Global optimization and simulated annealing. Math. Program. 50, 367–393 (1991)CrossRef
4.
Zurück zum Zitat Geimer, M., Wolf, F., Wylie, B.J., Abraham, E., Becker, D., Mohr, B.: The Scalasca performance toolset architecture. Concurr. Comput. Pract. Exp. 22(6), 702–719 (2010) Geimer, M., Wolf, F., Wylie, B.J., Abraham, E., Becker, D., Mohr, B.: The Scalasca performance toolset architecture. Concurr. Comput. Pract. Exp. 22(6), 702–719 (2010)
5.
Zurück zum Zitat Gropp, W., Lusk, E., Skjellum, A.: Using MPI: Portable Parallel Programming with the Message Passing Interface. The MIT Press, Cambridge (1999) Gropp, W., Lusk, E., Skjellum, A.: Using MPI: Portable Parallel Programming with the Message Passing Interface. The MIT Press, Cambridge (1999)
6.
Zurück zum Zitat Haase, G.: A parallel AMG for overlapping and non-overlapping domain decomposition. Electron. Trans. Numer. Anal. (ETNA) 10, 41–55 (2000)MathSciNetMATH Haase, G.: A parallel AMG for overlapping and non-overlapping domain decomposition. Electron. Trans. Numer. Anal. (ETNA) 10, 41–55 (2000)MathSciNetMATH
7.
9.
Zurück zum Zitat Knupp, P.M.: Applications of mesh smoothing: copy, morph, and sweep on unstructured quadrilateral meshes. Int. J. Numer. Methods Eng. 44(1), 37–45 (1999)MathSciNetCrossRef Knupp, P.M.: Applications of mesh smoothing: copy, morph, and sweep on unstructured quadrilateral meshes. Int. J. Numer. Methods Eng. 44(1), 37–45 (1999)MathSciNetCrossRef
10.
Zurück zum Zitat Liebmann, M.: Efficient PDE solvers on modern hardware with applications in medical and technical sciences. Ph.D. thesis, University of Graz, Austria (2009) Liebmann, M.: Efficient PDE solvers on modern hardware with applications in medical and technical sciences. Ph.D. thesis, University of Graz, Austria (2009)
11.
Zurück zum Zitat Meurant, G.: The Lanczos and Conjugate Gradient Algorithms, Software, Environments, and Tools, vol. 19. SIAM, Philadelphia (2006)CrossRef Meurant, G.: The Lanczos and Conjugate Gradient Algorithms, Software, Environments, and Tools, vol. 19. SIAM, Philadelphia (2006)CrossRef
12.
Zurück zum Zitat Mitchell, L., Bishop, M., Hoetzl, E., Neic, A., Liebmann, M., Haase, G., Plank, G.: Modeling cardiac electrophysiology at the organ level in the peta FLOPS computing age. In: AMER INST PHYSICS, pp. 407–410 (2010) Mitchell, L., Bishop, M., Hoetzl, E., Neic, A., Liebmann, M., Haase, G., Plank, G.: Modeling cardiac electrophysiology at the organ level in the peta FLOPS computing age. In: AMER INST PHYSICS, pp. 407–410 (2010)
13.
Zurück zum Zitat Neic, A., Liebmann, M., Haase, G., Plank, G.: Algebraic multigrid solvers on clusters of CPUs and GPUs. In: Jónasson, K. (eds.) PARA (2). Lecture Notes in Computer Science, vol. 7134, pp. 389–398. Springer (2012) Neic, A., Liebmann, M., Haase, G., Plank, G.: Algebraic multigrid solvers on clusters of CPUs and GPUs. In: Jónasson, K. (eds.) PARA (2). Lecture Notes in Computer Science, vol. 7134, pp. 389–398. Springer (2012)
14.
Zurück zum Zitat Neic, A., Liebmann, M., Hoetzl, E., Mitchell, L., Vigmond, E., Haase, G., Plank, G.: Accelerating cardiac bidomain simulations using graphics processing units. IEEE Trans. Biomed. Eng. 59(8), 2281–2290 (2012). doi:10.1109/TBME.2012.2202661 CrossRef Neic, A., Liebmann, M., Hoetzl, E., Mitchell, L., Vigmond, E., Haase, G., Plank, G.: Accelerating cardiac bidomain simulations using graphics processing units. IEEE Trans. Biomed. Eng. 59(8), 2281–2290 (2012). doi:10.​1109/​TBME.​2012.​2202661 CrossRef
15.
Zurück zum Zitat Pechstein, C.: Finite and boundary element tearing and interconnecting solvers for multiscale problems. Lecture Notes in Computational Science and Engineering, vol. 90. Springer (2013) Pechstein, C.: Finite and boundary element tearing and interconnecting solvers for multiscale problems. Lecture Notes in Computational Science and Engineering, vol. 90. Springer (2013)
16.
Zurück zum Zitat Plank, G., Liebmann, M., Weber dos Santos, R., Vigmond, E., Haase, G.: Algebraic multigrid preconditioner for the cardiac bidomain model. IEEE Trans. Biomed. Eng. 54(4), 585–596 (2007)CrossRef Plank, G., Liebmann, M., Weber dos Santos, R., Vigmond, E., Haase, G.: Algebraic multigrid preconditioner for the cardiac bidomain model. IEEE Trans. Biomed. Eng. 54(4), 585–596 (2007)CrossRef
17.
Zurück zum Zitat van Laarhoven, P., Aarts, E.: Simulated Annealing. Kluwer Academic Press, Dordrecht (1987)CrossRefMATH van Laarhoven, P., Aarts, E.: Simulated Annealing. Kluwer Academic Press, Dordrecht (1987)CrossRefMATH
18.
Zurück zum Zitat Wohlmuth, B.I.: A mortar finite element method using dual spaces for the lagrange multiplier. SIAM J. Numer. Anal. 38, 989–1012 (1998)MathSciNetCrossRef Wohlmuth, B.I.: A mortar finite element method using dual spaces for the lagrange multiplier. SIAM J. Numer. Anal. 38, 989–1012 (1998)MathSciNetCrossRef
19.
Zurück zum Zitat Wolf, F.: Scalasca. In: Padua, D. (ed.) Encyclopedia of Parallel Computing, 1st edn, pp. 1775–1785. Springer, Berlin (2011) Wolf, F.: Scalasca. In: Padua, D. (ed.) Encyclopedia of Parallel Computing, 1st edn, pp. 1775–1785. Springer, Berlin (2011)
Metadaten
Titel
A balanced accumulation scheme for parallel PDE solvers
verfasst von
Manfred Liebmann
Aurel Neic
Gundolf Haase
Publikationsdatum
01.02.2013
Verlag
Springer Berlin Heidelberg
Erschienen in
Computing and Visualization in Science / Ausgabe 1/2013
Print ISSN: 1432-9360
Elektronische ISSN: 1433-0369
DOI
https://doi.org/10.1007/s00791-014-0222-y

Premium Partner