1984 | OriginalPaper | Chapter
Fehlermaskierende Verteilte Systeme zur Erfüllung Hoher Zuverlässigkeits-Anforderugen in Prozessrechner-Netzen
Author : Klaus Echtle
Published in: Architektur und Betrieb von Rechensystemen
Publisher: Springer Berlin Heidelberg
Included in: Professional Book Archive
Activate our intelligent search to find suitable subject content or patents.
Select sections of text to find matching patents with Artificial Intelligence. powered by
Select sections of text to find additional relevant content using AI-assisted search. powered by
Bestehen in Prozeβrechensystemen gleichzeitig hohe Zuverlässigkeits-und Reaktionszeit-Anforderungen, so kommen häufig statische Redundanz-Verfahren (bzw. Hybridredundanz) zum Einsatz. Ihre Vorteile hinsichtlich Diagnostizierbarkeit von transienten Fehlern und Wegfall von Rücksetz- und Wiederanlaufzeiten werden durch die Vervielfachung (i.a. Verdreifachung) der Verarbeitungseinheiten erkauft. Unglücklicherweise belasten in Rechnernetzen die statischen Redundanz-Verfahren die teuren Kommunikationssysteme sogar mit der neunfachen Anzahl redundanter Nachrichten. Dies führt i.a. zur Entwicklung spezieller leistungsfähiger Kommunikationssysteme.Das hier beschriebene Verfahren geht den umgekehrten Weg: Durch die Entwicklung eines speziellen Fehlertoleranz-Verfahrens, das auf Hybridredundanz beruht, wird die Belastung der Kommunikationssysteme auf etwa 1/3 gesenkt. Statt erhöhter Transferraten wird vom Kommunikationssystem eine bestimmte Strategie bei der Festlegung der Transferprioritäten gefordert.Die Besonderheit des Fehlertoleranz-Verfahrens liegt darin, daß die fehlermaskierenden Instanzen nicht verdreifacht, sondern als verteilte Systeme implementiert sind, welche ein effizientes fehlertolerantes Protokoll ausführen. Neben der Maskierung können noch Optimierungsentscheidungen zum Transfer redundanter Nachrichten getroffen werden. Die Re-/Konfigurierung der drei Knoten eines Maskierungs-Systems entsprechend einer 2:1-Aufteilung in Rechnergruppen ermöglicht außerdem die Tolerierung von Mehrfachfehlern, die sich auf Rechnergruppen beschränken.Diese Arbeit schließt mit der Nennung einiger Ergebnisse einer umfangreichen quantitativen Bewertung, die sich auf die SIRAM-Fehlermodellierung und die Anwendung des SIRAM-Simulators stützt.