Skip to main content

2001 | Buch

Datenanalyse in der Biologie

Eine Einführung in Methoden der nichtlinearen Dynamik, fraktalen Geometrie und Informationstheorie

verfasst von: Dr. Marc-Thorsten Hütt

Verlag: Springer Berlin Heidelberg

Buchreihe : Springer-Lehrbuch

insite
SUCHEN

Inhaltsverzeichnis

Frontmatter
1. Mathematische Grundlagen
Zusammenfassung
Experimentelles Arbeiten durch eine mathematische Brille zu betrachten ist ein unverzichtbares Hilfsmittel wissenschaftlichen Arbeitens geworden. Die ganz grundlegenden Begriffe der Statistik finden dabei so selbstverständlich Anwendung, daß sie kaum einer Erwähnung bedürfen. Gleichzeitig bilden sie aber die Basis für eine Verbindung von Experimenten und Mathematik, die sich als Ausgangspunkt von fortgeschritteneren Überlegungen eignet, etwa zur Verallgemeinerung bekannter Begriffe oder zum Hinterfragen ihrer Anwendbarkeit. Das sprachliche Fundament soll in dem vorliegenden Kapitel gelegt werden.
Marc-Thorsten Hütt
2. Grundbegriffe der nichtlinearen Dynamik
Zusammenfassung
In diesem Kapitel werden wir einen neuen mathematischen Begriff kennenlernen, der eine gewisse Verwandtschaft zu Differentialgleichungen aufweist, die sogenannte Differenzengleichung. Dieser Begriff, der auf den ersten Blick wie eine fast nutzlose mathematische Spielerei wirkt, wird sich als ein effizientes Werkzeug zum Erlernen der zentralen Elemente der nichtlinearen Dynamik erweisen. Anhand eines einfachen Gedankenexperiments läßt sich die Idee hinter Differenzengleichungen illustrieren: Im Rahmen einer jährlichen Obsternte wird die Menge der geernteten Früchte bestimmt. Man erhält also eine Zeitreihe mit jährlichen Meßpunkten. In diesem Fall stellt der zeitliche Abstand tatsächlich keine Sampling-Rate dar (vgl. Kapitel 1.1), sondern ist nur Ausdruck der Tatsache, daß dieses System keine häufigere Messung erlaubt.
Marc-Thorsten Hütt
3. Zelluläre Automaten
Zusammenfassung
In diesem Kapitel werden wir eine weitere Methode der Modellbildung kennenlernen, die sich in vielen Aspekten als Verallgemeinerung der Differenzengleichungen lesen läßt. Im Fall der Differenzengleichungen gelangt man durch Anwenden der Funktion / vom Zustand zur Zeit t zum Zustand zur Zeit t+1. Ordnet man nun mehrere solche Systeme in einer Reihe an und erlaubt jedem Einzelsystem, seine unmittelbaren Nachbarn zu beeinflussen, so ergibt sich eine neue Klasse von mathematischen Modellen, sogenannte zellulären Automaten.1 Das Ziel einer solchen Herangehensweise ist die Modellierung von Systemen, die aus einer Vielzahl von interagierenden Elementen bestehen, sogenannte „komplexe Systeme“. Zelluläre Automaten (engl. cellular automata) stellen ein Werkzeug bereit, um Musterbildungsphänomene und Selbstorganisationsprozesse auf lokale Wechselwirkungen zurückführen zu können. Hinter diesen Begriffen steht ein sehr klar umrissenes theoretisches Konzept (Bar-Yam 1997, Wolfram 1984): Prozesse der Selbstorganisation sind in dieser Sprache dadurch charakterisiert, daß räumlich angeordnete Elemente unter dem Einfluß lokaler (also zwischen benachbarten Elementen wirksamer) Regeln charakteristische Strukturen (Muster) ausbilden (siehe Abb. 3.1).
Marc-Thorsten Hütt
4. Elemente der nichtlinearen Zeitreihenanalyse
Zusammenfassung
„Zeitreihenanalyse“ (engl. time series analysis) ist eher eine Zielerklärung als eine konkrete Methode oder mathematische Technik. Sie setzt sich aus einem über Jahrzehnte gewachsenen, auch deutlich erkennbaren Modeerscheinungen unterworfenen Kanon von mathematisch formulierten Fragen an einen Datensatz zusammen. Die Gedankenkette hinter dieser Vorgehensweise ist in Abb. 4.1 schematisch dargestellt. Der erste Punkt erfaßt das Extrahieren bestimmter Einzelinformationen aus der Zeitreihe, also die Charakterisierung der Zeitreihe durch Observablen, die dem oben erwähnten Kanon der Zeitreihenanalyse angehören. Einige dieser Observablen haben für sich schon eine große Bedeutung und Aussagekraft, etwa die Lyapunov-Exponenten bei der Trennung von deterministischen und stochastischen Dynamiken, andere sind eher notwendige Vorarbeiten auf dem Weg zu den weiteren Kernzielen der Zeitreihenanalyse: dem Abfassen von Vorhersagen und der Entwicklung eines mathematischen Modells.
Marc-Thorsten Hütt
5. Analyse raumzeitlicher Strukturen
Zusammenfassung
Eine faszinierende gegenwärtige Entwicklung in den Naturwissenschaften ist die Untersuchung raumzeitlicher Muster in Beobachtungen, die bisher als rein zeitliche Phänomene betrachtet worden sind (Cladis u. Palffy-Muhoray 1995, Nijhout et al. 1997, Blasius et al. 1999b). Moderne experimentelle Techniken erlauben es heute, die Rolle der räumlichen Dimension für die Dynamik des Gesamtsystems überzeugend nachzuweisen. Parallel zu den experimentellen Fortschritten sind in den letzten Jahren die entsprechenden theoretischen Methoden der Datenanalyse und Dateninterpretation entwickelt worden (Albino et al. 1996, Hütt u. Neff 2001). Die Bereitstellung solcher Methoden der Analyse experimenteller Daten ist ein eigenes, äußerst aktuelles Forschungsfeld mit einer fließenden Grenze zwischen Datenanalyse und Modellierung. Allerdings steht die Entwicklung von Methoden, die mit dem beachtlichen Repertoire der nichtlinearen Zeitreihenanalyse vergleichbar wären, für mehrdimensionale (raumzeitliche) Phänomene erst am Anfang. Das Ziel ist dabei stets die Formulierung von standardisierten, auf die Fragestellungen der Biologie zugeschnittenen Analysemethoden, die an theoretisch generierten raumzeitlichen Datensätzen getestet und geeicht werden können. Wie auch bei der Zeitreihenanalyse sind solche Methoden so universell, daß sie sich auf experimentelle Daten anwenden lassen, die auf verschiedenen Skalen (z.B. Membran — Pflanze — Ökosystem) gewonnen wurden.
Marc-Thorsten Hütt
6. Selbstähnlichkeit und fraktale Geometrie
Zusammenfassung
Im Rahmen unserer bisherigen Überlegungen sind wir gelegentlich auf chaotische Strukturen gestoßen, etwa bei der Zeitentwicklung von eindimensionalen zellulären Automaten der Wolfram-Klasse III. Neben vielen anderen Eigenschaften, die wir diskutiert haben, gab es bei diesen Mustern eine intuitiv erkennbare Regelmäßigkeit, die der Unvorhersagbarkeit der Zeitentwicklung ein wenig zu widersprechen schien. Anhand von Abb. 6.1 läßt sich dieser Punkt noch einmal aufgreifen. Folgendes ist auffällig:
  • Ahnliche Strukturen unterschiedlicher Größe treten auf. Das ist nicht zu erwarten: Wir haben hier einzelne „Zellen“ mit einer Nächst-Nachbar-Wechselwirkung (d.h. der Zustand einer Zelle im folgenden Zeitschritt wird nur von der Zelle selbst und ihren zwei Nachbarn beeinflußt). Wie können also — bei dieser fest vorgegebenen Untereinheit — verschieden große, aber ansonsten gleiche Musterbestandteile entstehen?
  • In der „inversen“ Betrachtung (d.h. weiße Elemente vor schwarzem Hintergrund) sieht man, wie größere Dreiecke aus kleineren aufgebaut sind, die ihrerseits noch kleinere Dreiecke als Unterstruktur besitzen.
Marc-Thorsten Hütt
7. Methoden aus der Informationstheorie
Zusammenfassung
Während in den letzten Kapiteln Analysemethoden diskutiert wurden, deren theoretische Grundlagen (vor allem die nichtlineare Dynamik und die fraktale Geometrie) selbst äußerst junge Forschungsgebiete darstellen, sind die beiden zentralen Begriffe des vorliegenden Kapitels, die Entropie H und die Transinformation I bereits seit mehr als 60 Jahren etabliert (Shannon 1948). Allerdings hat sich erst vor wenigen Jahren eine sehr aktive Forschungslandschaft herausgebildet, in der diese Begriffe zur Analyse und Interpretation biologischer Beobachtungen herangezogen werden (Herzel et al. 1998, Weiss u. Herzel 1998). Die Kernidee hinter diesen Methoden ist aufzudecken, wie und in welchem Maße sich Informationstransport in dem System vollzieht. Wir werden sehen, daß der Anwendungsbereich dieser Idee enorm groß ist und von der Analyse von DNA-Sequenzen bis hin zu einem Verständnis raumzeitlicher Selbstorganisationsprozesse reicht.
Marc-Thorsten Hütt
Backmatter
Metadaten
Titel
Datenanalyse in der Biologie
verfasst von
Dr. Marc-Thorsten Hütt
Copyright-Jahr
2001
Verlag
Springer Berlin Heidelberg
Electronic ISBN
978-3-642-56631-8
Print ISBN
978-3-540-42311-9
DOI
https://doi.org/10.1007/978-3-642-56631-8