Skip to main content
main-content

Über dieses Buch

Parallelisierung komplexer Probleme ging aus der gleichnamigen Veranstaltung 1990 in Mannheim hervor. Es enthält nach einer einleitenden Übersicht von H.W. Meuer über den Stand und die Entwicklungstendenz im Markt für Parallelrechner aktualisierte Artikel zu den im Tutorium diskutierten Themen und eine Zusammenfassung der abschließenden Podiumsdiskussion. Als erstes deutschsprachiges Buch befaßt es sich mit den Problemen und Erfahrungen bei der Programmierung von Fragestellungen aus Wissenschaft und Technik auf Parallelrechnern. Besonders wertvoll sind die Berichte der Anwender, die erstmals Parallelrechner als Produktionsrechner in der Praxis einsetzen. Um einen Überblick über dieses sich sehr schnell entwickelnde Gebiet zu geben, wurde auf eine breite Sammlung verschiedener Anwendungen und Architekturen Wert gelegt. Die Anwendungen erstrecken sich von der Elementarteilchenphysik über Strömungsdynamik im Automobilbau und Meeresforschung bis hin zu Software-Werkzeugen für Parallelrechner selbst. Während die Hälfte der Beiträge Erfahrungen mit globalem Speicher schildern (Cray, IBM, Alliant, Convex), gehen die anderen auf verteilte Speicher ein (Intel, Suprenum, iP-Systems, Parsytec). Der Leser dieses Buches erhält insgesamt einen Überblick und zugleich einen detaillierten Einblick in die derzeitigen Probleme und Erfolge beim Einsatz paralleler Rechner zur Lösung komplexer Probleme.

Inhaltsverzeichnis

Frontmatter

Parallelrechner in den 90er Jahren — Status und Entwicklungstendenzen

Zusammenfassung
Die derzeit dominierende Supercomputer Architektur ist die Multi-Vektorrechner Architektur mit globalem Hauptspeicherkonzept. In Kapitel 1 wird auf diese Systeme eingegangen, ihre Entwicklung, ihr Status und ihre Grenzen werden aufgezeigt. Abschließend wird die Situation auf dem Supercomputermarkt anhand von aktuellen Statistiken erläutert, insbesondere auch in Deutschland. In Kapitel 2 werden die eigentlichen Parallelrechner, basierend auf VLSI-Technik und insbesondere verteiltem Speicherkonzept, in die Überlegungen mit einbezogen. Welche Vorteile, aber auch Nachteile diese Systeme mit lokalem Speicher haben, wird diskutiert. Ausführlicher werden die Systeme von Intel, Parsytec, iP-Systems und Suprenum vorgestellt. Im 3.Kapitel schließlich wird eine Prognose bis etwa zum Jahre 2000 gegeben anhand der zu erwartenden Entwicklung der Multi-Vektorrechner und es wird deduziert, daß in der zweiten Hälfte der 90er Jahre die Ablösung der auch in diesem Jahrzehnt dominierenden Architektur eingeleitet werden wird.
Hans W. Meuer

Erfahrungen mit IBM Parallel FORTRAN

Zusammenfassung
Der vorliegende Beitrag berichtet über Erfahrungen mit Parallel FORTRAN, die im Rahmen eines Joint Study Projektes mit IBM gewonnen wurden [1], Es sollte die Brauchbarkeit der Konzepte sowie die Performance in einer technisch-wissenschaftlichen Umgebung untersucht werden. Es wurden im wesentlichen zwei Programmpakete, die als GSI-typisch galten, parallelisiert und vektorisiert. Mit einem Monte-Carlo-Code wurden die Konzepte des expliziten Multitasking getestet. Beim zweiten Beispiel ging es um Parallelisierung auf DO-Schleifen-Ebene. Beide konnten mit gutem Erfolg parallelisiert werden, allerdings war nicht unerhebliche Eigenleistung vonnöten.
M. Krämer

Parallelisierung von Mehrgitteralgorithmen auf der Alliant FX/80

Zusammenfassung
Ein wesentliches Ziel der numerischen Modellierung im Rahmen der Klima-forschung am AWI ist die Beschreibung der Funktion der polaren Ozeane im Gesamtklimasystem. Eine der Standard-Approximationen in numerischen Modellen der ozeanischen Zirkulation ist die „rigid-lid“ Approximation, welche die schnellen Oberflächenwellen des physikalischen Systems aus den Modellen eliminiert Dies ermöglicht einerseits längere Zeitschritte, wie sie für klimarelevante Probleme unterläßlich sind, andererseits ergibt sich daraus eine zu jedem Zeitschritt der Integration zu lösende elliptische Gleichung. Während die übrigen parabolisch-hyperbolischen Gleichungen relativ einfach zu vektori-sieren und zu parallelisieren sind, erfordert die effiziente Lösung des elliptischen Problems eine im Hinblick auf den zur Verfügung stehenden Rechner sehr genaue Auswahl des Lösungsverfahrens sowie dessen spezifischer Implementierung. Darin liegt auch der Schwerpunkt dieser Arbeit.
W. Hiller, J. Behrens

Strömungsmechanische Anwendungen auf Convex C220

Zusammenfassung
In dieser Arbeit werden die Ergebnisse der Vektorisierung und Parallelisierung des Strömungsprogrammes FIRE® (Flows In Reciprocating Engines) auf dem Zweiprozessor Rechner CONVEX C220 dargestellt. Dabei kann die Vektorisierung, soweit es die Komplexität der Strömungsprobleme und die verwendete Diskretisierungsmethode zulassen, als abgeschlossen betrachtet werden. Weitere Verkürzungen der Rechenzeiten sind nur mehr durch einen schnelleren Rechner oder durch grundlegende Modifikationen am Algorithmus möglich. Die Parallelisierung wurde bisher nur für den rechenintensivsten Teil des Programmes, nämlich für die Lösung großer linearer Gleichungssysteme (105 Gleichungen und mehr) durchgeführt. Obwohl der Parallelisierungsgrad einzelner Programmabschnitte in vielen Fällen größer als 90 % war, konnte die Gesamtdurchsatzleistung doch nur auf das 1.4 – 1.5fache von der eines Einzelprozessors erhöht werden. Gründe dafür sind der immer noch sehr hohe serielle Programmanteil (I/O, Rekursionen etc.), die implizite zeitliche Kopplung und das indirekte Adressierungsschema. Erschwerend kommt noch hinzu, daß in einer industriellen Umgebung mit sehr vielen rechenintensiven Applikationen fast zu keiner Zeit alle vorhandenen Prozessoren für eine einzelne Berechnung zur Verfügung stehen.
G. Bachler

Die Strategie des Autotasking für das MTc-Projekt auf dem CRAY-Mehrprozessorsystem Y-MP8/832

Zusammenfassung
Die Quantenchromodynamik, die Theorie der Kernkräfte, wird auf einem Raum-Zeit-Gitter mit Hilfe eines Hybrid-Monte-Carlo Algorithmus simuliert, der dynamische Quarks exakt berücksichtigt. Die hohen Rechenzeitanforderungen des Programms verlangen den Einsatz moderner Supercomputer, wie der CRAY Y-MP, die ihre hohen Leistungen durch gleichzeitigen Einsatz von Vektor- und Parallel-Hardware erzielen. Diese Arbeit gibt eine kurze Einführung in die Architektur der CRAY Y-MP und die Parallelverarbeitungskonzepte auf Cray-Rechnern. Ausführlicher wird auf das Autotasking-Konzept eingegangen, welches das automatische Auffinden von Parallelismus in existierenden Fortran-Programmen ermöglicht. Außerdem beschreibt diese Arbeit sowohl die Anwendung als auch den Optimierungs- und Transformationsprozeß, der zur Steigerung der Rechenleistung notwendig war. Durch Programmänderungen konnte auf einer CRAY Y-MP8/832 ein Speedup von 7 und damit eine Gesamtleistung von 1,67 GFLOPS erreicht werden.
Siegfried Knecht

Parallelisierung komplexer Anwendungen auf dem iPSC/2, iPSC/860 mit Hilfe der Werkzeugumgebung TOPSYS

Zusammenfassung
Beim Einsatz von Parallelrechnern steht der Anwender vor dem Problem seine Applikation an die neue Rechnerstruktur anzupassen. Beim heutigen Stand der Technik sind dabei, wie in den Anfängen der Nutzung von Vektorrechnern, noch manche Schritte manuell durchzuführen. Insbesondere ist die Optimierung (Tuning) der Anwendung im Bezug auf die parallele Rechnerstruktur noch wenig automatisiert. Der Artikel beschreibt eine Methodologie zur Parallelisierung von Anwendungen auf heutigen Parallelrechnern unter Verwendung der interaktiven Werkzeugumgebung TOPSYS (TOols for Parallel SYStems) Als Zielrechner werden Parallelrechner des Typs MIMD betrachtet, wobei Systeme mit verteilten Betriebsmitteln (insbesondere verteiltem Speicher) wegen der höheren Skalierbarkeit favorisiert weiden. Als exemplarisches Beispiel eines Rechners dieser Klasse wird der iPSC/2 bzw. iPSC/860 Hypercube behandelt. Viele der hier beschriebenen Verfahren können jedoch auch auf Shared-Memory-Systeme sinnvoll angewendet werden.
Thomas Bemmerl

SLAP — SUPRENUM Linear Algebra Package

Zusammenfassung
SLAP ist das Programmpaket zur Linearen Algebra auf dem SUPRENUM-Rechner. Es orientiert sich an den Standards auf diesem Gebiet, LINPACK und LAPACK, berücksichtigt aber auch die spezielle Architektur des Zielsystems. Die bekannten Algorithmen (Matrixoperationen, -faktorisierungen etc.) wurden parallelisiert, implementiert und optimiert; besonderer Wert wurde dabei auf eine günstige Datenaufteilung gelegt. Als Ergebnis stehen die wichtigsten Verfahren der Linearen Algebra als Fortran-Unterprogramme auf SUPRENUM zur Verfügung.
Henry Strauß

Multigrid auf einer Binärbaumarchitektur

Zusammenfassung
Multigrid Verfahren dienen der Lösung partieller Differentialgleichungen. Sie arbeiten mit Bezug zum Definitionsbereich. Als Black-Box Verfahren sind sie ungeeignet. Die Multigrid Methode kann als eine Verfahrensklasse angesehen werden. Ihre maximale Rechengeschwindigkeit entfaltet sie meist nur nach spezifischer Problemanpassung.
W. Dax

Interdisziplinäre Nutzung von Supercluster Parallelrechnern und Anwendungserfahrungen

Zusammenfassung
Das Interdisziplinäre Zentrum für wissenschaftliches Rechnen (IWR) der Universität Heidelberg verfügt seit Anfang 1990 über ein Transputer-System mit 128 Prozessoren. Dieser Beitrag erläutert die Überlegungen, die zur Beschaffung dieses Parallelrechners geführt haben, gibt eine kurze Beschreibung seiner Architektur und berichtet über erste Erfahrungen mit seinem Betrieb im Multi-User-Modus. Das Fazit ist, daß trotz einiger noch bestehender Mängel in Hinsicht Komfort und Zuverläßlichkeit ein Transputer-System dieser mittleren Größe hard- und softwaremäßig beherrschbar ist und auch von einem rein anwendungsorientierten Institut ohne sonderliche technische Vorkenntnisse und Ambitionen betrieben werden kann.
Rolf Rannacher

Transputeranwendungen in der numerischen Strömungsmechanik

Zusammenfassung
Die Verwendung von Transputern in der numerischen Strömungsmcchanik bietet Ansätze für neue Konzepte bei der Realisierung von Simulationssystemen, zum einen durch die Parallelisierung der zugrunde liegenden Algorithmen, zum anderen durch neue Anordnungen der einzelnen das System bildenden Module.
M. Faden, S. Pokorny

Podiumsdiskussion — Gegenwart und Zukunft der Parallel-Verarbeitung

Zusammenfassung
Das Tutorium „Parallelisierung komplexer Probleme“ fand seinen Abschluß mit einer von Hans W. Meuer geleiteten Podiumsdiskussion. An dieser Diskussionsrunde nahmen alle Vortragenden des Tutoriums — die auch gleichzeitig die Autoren der Beiträge des vorliegenden Bandes sind — teil. Die Diskussion war aber nicht nur auf diese Teilnehmer beschränkt, sondern schloß auch alle Zuhörer des Tutoriums mit ein, was bei den hieraus resultierenden lebhaften Diskussionen dem Chairman das Leben nicht leichtmachte.
A. H. L. Emmen, W. Gentzsch

Backmatter

Weitere Informationen