Skip to main content

2013 | Buch

Stochastik in den Ingenieurwissenschaften

Eine Einführung mit R

verfasst von: Christine Müller, Liesa Denecke

Verlag: Springer Berlin Heidelberg

Buchreihe : Statistik und ihre Anwendungen

insite
SUCHEN

Über dieses Buch

Das Buch bietet eine ausführliche Einführung in die Wahrscheinlichkeitsrechnung und Statistik für Ingenieur- und Naturwissenschaftler. Es behandelt die wesentlichen grundlegenden Methoden, die insbesondere im ingenieurwissenschaftlichen Bereich ihre Anwendung finden. Anhand von Beispielen und realen Datensätzen werden die Anwendungen der Methoden verdeutlicht und mit der freien Statistik Software R auch die Gelegenheit gegeben, alle Beispiele direkt nachzuvollziehen und die erlernten Methoden auf andere Datensätze anzuwenden. Dazu wird ebenfalls eine kurze Einführung in R gegeben. Am Ende jedes Abschnitts finden sich Übungsaufgaben mit deren Hilfe die Verfahren geübt werden können. Lösungen zu den Aufgaben werden elektronisch bereitgestellt.

Inhaltsverzeichnis

Frontmatter
Kapitel 1. Fragestellungen
Zusammenfassung
Die Stochastik ist die Lehre des Zufalls. Lange ist man davon ausgegangen, dass diese Lehre für die Ingenieurwissenschaft nicht von Bedeutung ist, da alles auf Mechanik und anderen deterministischen Prozessen basiert. Aber das ist nicht der Fall. Maschinen produzieren nur mit einer bestimmten Genauigkeit und Teile der Maschinen fallen zufällig aus. Baumaterialien sind nicht immer gleich, sondern schwanken in ihrer Beschaffenheit. Es stellt sich auch die Frage, wie Maschinen und Bauwerke konstruiert werden sollen, so dass bestimmte Anforderungen möglichst gut erfüllt werden. Im Zeitalter der Globalisierung mit ihrem harten Konkurrenzdruck ist es besonders wichtig, dass die Anforderungen so gut wie möglich erfüllt werden. In diesem Kapitel stellen wir einige Beispiele vor, in denen deutlich wird, wo Statistik ihre Anwendung findet. Diese Beispiele werden uns durch das ganze Buch begleiten. Wir werden an ihnen die Benutzung der neu erlernten Methoden üben. Wenn vorhanden werden hier auch die Namen der Dateien genannt, in denen sie die Datensätze zu den Beispielen finden.
Christine Müller, Liesa Denecke

Beschreibende Statistik

Frontmatter
Kapitel 2. Erste Schritte mit R
Zusammenfassung
Bevor wir uns mit den in Kapitel 1 eingeführten Fragestellungen beschäftigen, brauchen wir noch ein Werkzeug, um die Datensätze später wirklich auswerten zu können. Sicher lässt sich das in den meisten Fällen auch per Hand durchführen. Aber insbesondere für große Datensätze und spätestens, wenn Zufallsexperimente simuliert werden sollen, stoßen wir hier an unsere Grenzen. Daher soll im Folgenden eine Statistiksoftware eingeführt werden, die wir zur Auswertung und Simulation nutzen werden. Für alle hier im Buch vorgestellten Methoden werden auch immer die jeweils auszuführenden Schritte in der Software aufgeführt. In diesem Kapitel wird nun eine kurze Einführung in die grundlegende Bedienung der Software R gegeben. Im ersten Abschnitt wird die Homepage angegeben, von der die Software heruntergeladen werden kann. Der zweite Abschnitt erläutert dann zunächst, wie einfache Grafiken erstellt werden können.
Christine Müller, Liesa Denecke
Kapitel 3. Datentypen
Zusammenfassung
In den folgenden Kapiteln werden wir einige statistische Methoden zur Beschreibung von Daten kennenlernen. Dabei werden wir zwischen verschiedenen Merkmals- und Datentypen unterscheiden müssen. Es ist klar, dass wir für einen Datensatz, der z.B. die Abnehmer eines Produkts enthält, andere Methoden zur Beschreibung brauchen als für den Datensatz, der die Laufzeit von Maschinen enthält. Dazu folgt zunächst die Definition des Merkmals und dann die der einzelnen Merkmalstypen. Wir werden jeweils Beispiele für die einzelnen Merkmalstypen kennenlernen. Mit den Datentypen in R und damit auch mit der Unterscheidung zwischen ein- und mehrdimensionalen Daten beschäftigt sich dann der zweite Abschnitt des Kapitels.
Christine Müller, Liesa Denecke
Kapitel 4. Tabellarische und grafische Darstellungen von univariaten Daten
Zusammenfassung
In Zeitungsartikeln, in den Nachrichten im Fernsehen, überall begegnen uns grafische Veranschaulichungen von Daten, sei es um einen ersten Eindruck von den Daten zu bekommen oder die Ergebnisse zu unterstreichen. Grafiken sind ein sehr nützliches Werkzeug zur Beschreibung von Daten. In den einzelnen Abschnitten werden für die unterschiedlichen Merkmalstypen mögliche grafische Darstellungsmethoden vorgestellt.
Christine Müller, Liesa Denecke
Kapitel 5. Statistische Kennzahlen für die Lage
Zusammenfassung
In den vorherigen Abschnitten wurden Methoden zur Darstellung von Daten verwendet, die nur ein geringes Maß an Reduktion vornahmen (z.B. Häufigkeitsverteilung, Histogramm, empirische Verteilungsfunktion, Bildung von Klassen etc.). Oft ist man aber daran interessiert, Datensätze mit wenigen Kenngrößen zu beschreiben (etwa um zwei oder mehr Datensätze miteinander zu vergleichen). Mit solchen Kennzahlen wollen wir uns in den folgenden drei Kapiteln beschäftigen. Wir beginnen mit den Lageparametern. Diese dienen zur Beschreibung des „Zentrums/Schwerpunkts“ eines Datensatzes. Sie geben Anhaltspunkte für die Lage eines untersuchten Merkmals („Durchschnittswert“). Im Folgenden werden für die unterschiedlichen Merkmalstypen diverse Lageparameter vorgestellt.
Christine Müller, Liesa Denecke
Kapitel 6. Statistische Kennzahlen für die Streuung
Zusammenfassung
In diesem Kapitel gehen wir immer von quantitativen Daten aus, da die Messung von Streuung einen Abstandsbegriff voraussetzt. Dabei ist unwesentlich, ob das Merkmal diskret oder stetig ist. Während im vorhergehenden Kapitel ein Datensatz durch verschiedene Lageparameter beschrieben wurde, sollen im Folgenden Größen angegeben werden, die die Streuung eines Merkmals darstellen. Die Streuung in den Daten resultiert daraus, dass bei Messungen eines Merkmals i. Allg. verschiedene Werte beobachtet werden (z.B. Risslängen in Bauträgern oder Lebenszeiten von Glühbirnen). Zwar ermöglichen Lageparameter die Beschreibung eines Datensatzes durch Angabe eines mittleren Werts, jedoch können zwei Datensätze mit gleichem oder zumindest nahezu gleichem Lageparameter sehr unterschiedliche Streuung um diesen Lageparameter aufweisen. Der Lageparameter liefert somit eine nur unzureichende Information über die Struktur des Datensatzes. Dieses Verhalten lässt sich auch aus den Häufigkeitsverteilungen bzw. den zugehörigen Histogrammen ablesen.
Christine Müller, Liesa Denecke
Kapitel 7. Bivariate Daten
Zusammenfassung
In vielen Anwendungen wird nicht nur ein Merkmal eines Objekts gemessen, sondern mehrere (z.B. Laufzeit, Gewicht und Energieverbrauch von Maschinen oder Lieferant und Ausschussquote von Elektroniklieferungen). Im Folgenden werden ausschlie″slich Paare von Merkmalen X und Y eines Objekts betrachtet (Notation: (X, Y) oder (X 1, X 2) etc.). Die Ergebnisse lassen sich jedoch auch auf die Kombination von drei oder mehr Merkmalen übertragen. Das Paar (X, Y) heißt auch \textbf{bivariates Merkmal} mit Komponenten X und Y. Wir beginnen zunächst mit grafischen Darstellungsmöglichkeiten für bivariate Daten, dann folgt ein Abschnitt in dem Maße für den Zusammenhang zwischen zwei Merkmalen vorgestellt werden. Danach beschäftigen wir uns mit Methoden zur Beschreibung des Zusammenhangs zunächst mit linearen Funktionen und dann auch mit nichtlinearen.
Christine Müller, Liesa Denecke

Wahrscheinlichkeitstheorie

Frontmatter
Kapitel 8. Zufallszahlen und Simulationen
Zusammenfassung
In diesem Kapitel wird gezeigt, wie die Statistiksoftware R genutzt werden kann, um Zufallszahlen aus verschiedenen Verteilungen zu simulieren. Für stochastische Simulationen werden Zufallszahlen gebraucht. In R können Zufallszahlen mittels verschiedener Wahrscheinlichkeitsverteilungen erzeugt werden. Während dVerteilung die Dichte der Verteilung ergibt, erhält man mit rVerteilung Zufallszahlen, die gemäß der Verteilung verteilt sind. Der zweite Abschnitt des Kapitels beschäftigt sich mit statistischen Kennzahlen für diese Zufallszahlen. Der letzte Abschnitt beschäftigt sich dann mit der Simulation des Würfelwurfs.
Christine Müller, Liesa Denecke
Kapitel 9. Mengentheoretische Grundlagen
Zusammenfassung
Es werden die Begriffe der Grundmenge, des Ereignis und des Ergebnis eingeführt. Danach werden einige Rechenregeln für Mengen vorgestellt. Zu allen Begriffen werden jeweils Beispiele genannt.
Christine Müller, Liesa Denecke
Kapitel 10. Wahrscheinlichkeitsmaße, Wahrscheinlichkeitsräume
Zusammenfassung
Dieses Kapitel liefert eine Einführung in die Wahrscheinlichkeitsmaße und Wahrscheinlichkeitsräume. Zunächst wird das Wahrscheinlichkeitsmaß definiert und grundlegende Eigenschaften aufgeführt. Nach der Definition von diskreten Wahrscheinlichkeitsräumen wird der sogenannte Laplace-Raum eingeführt. Liegt ein Laplace-Raum vor, so reduziert sich die Berechnung von Wahrschein- lichkeiten also auf das Abzählen von Elementen eines Ereignisses. Mittels einer auf- zählenden Darstellung eines Ereignisses lässt sich die Berechnung auf simple, wenn auch oft mühsame Weise, durchführen.
Christine Müller, Liesa Denecke
Kapitel 11. Zufallsvariablen und deren Verteilungen
Zusammenfassung
In vielen Situationen sind die Elemente ω des Grundraums Ω eines Zufallsexperiments selbst nicht von Interesse, sondern lediglich eine bestimmte Eigenschaft der Elemente ω, wie etwa die Brenndauer einer Glühbirne, die Summe der Augenzahlen zweier Würfel, die Anzahl von Sechsen bei 1000 Würfelwürfen. Darum werden die sogenannten Zufallsvariablen eingeführt. Nach einer allgemeinen Einführung wird die Verteilungsfunktion für eindimensionale Zufallsvariablen definiert. Dabei wird zwischen stetigen und diskreten Zufallsgrößen unterschieden. Im folgenden Abschnitt lernen wir auch die Verteilungsfunktion für mehrdimensionale Zufallsvektoren kennen.
Christine Müller, Liesa Denecke
Kapitel 12. Eindimensionale Wahrscheinlichkeitsverteilungen
Zusammenfassung
In diesem Abschnitt werden einige wichtige Wahrscheinlichkeitsverteilungen vorgestellt. Dabei wird für die Aussage X ist verteilt gemäß einer Verteilung P die Schreibweise XP verwendet. Die Verteilungen werden dargestellt mittels ihrer (Zähl-) Dichte. Zum Teil werden auch die Verteilungsfunktionen dargestellt. In R erhält man (Zähl-)Dichten mittels d distname, Verteilungsfunktionen mittels p distname und Zufallszahlen der Verteilung mittels r distname, wobei distname für den Verteilungsnamen steht. In den aufgeführten Verteilungen wird nur dieser Verteilungsname in R aufgeführt.
Christine Müller, Liesa Denecke
Kapitel 13. Zwei- und mehrdimensionale Wahrscheinlichkeitsverteilungen
Zusammenfassung
Das Kapitel gibt Beispiele, wie zwei oder mehrdimensionale Wahrscheinlichkeitsverteilungen aussehen können. Dabei wird sowohl auf stetige als auch auf diskrete Verteilungen eingegangen. Insbesondere wird die mehrdimensionale Normalverteilung vorgestellt.
Christine Müller, Liesa Denecke
Kapitel 14. Bedingte Wahrscheinlichkeiten und stochastische Unabhängigkeit
Zusammenfassung
In vielen Situationen sind gewisse Vorinformationen bezüglich des Ereignisses A verfügbar. Beispielsweise ist bekannt, dass ein Ereignis B bereits eingetreten ist. Diese Zusatzinformation beeinflusst die Einschätzung der Wahrscheinlichkeiten. Dies wird durch den Begriff der bedingten Wahrscheinlichkeit formalisiert. Mit der Definition und Beispielen dazu beschäftigt sich der erste Abschnitt dieses Kapitels. Darauf aufbauend kann dann im Folgenden die stochastische Unabhängigkeit von Ereignissen und Zufallsvariablen definiert werden.
Christine Müller, Liesa Denecke
Kapitel 15. Erwartungswert und Varianz
Zusammenfassung
Wie Zufallszahlen und damit auch Daten durch einige wenige Parameter wie arithmetisches Mittel, Standardabweichung, p-Quantil beschrieben werden können, können Wahrscheinlichkeitsverteilungen durch Verteilungsparameter beschrieben werden. Die Analoga zu arithmetischem Mittel und empirischer Varianz sind Erwartungswert und Varianz. Diese wollen wir in diesem Kapitel sowohl für diskrete als auch für stetige Wahrscheinlichkeitsverteilungen kennen lernen. Am Schluss des Kapitels wird das Gesetz der großen Zahlen vorgestellt und gezeigt, wie es zur Simulation von Erwartungswert und Varianz genutzt werden kann.
Christine Müller, Liesa Denecke
Kapitel 16. Weitere wahrscheinlichkeitstheoretische Kennzahlen
Zusammenfassung
In diesem Kapitel werden analog zu den statistischen Kennzahlen aus dem ersten Teil des Buchs die p-Quantile und Abhängigkeitsmaße für Wahrscheinlichkeitsverteilungen definiert.
Christine Müller, Liesa Denecke
Kapitel 17. ∗Zuverlässigkeitstheorie∗
Zusammenfassung
Die Zuverlässigkeitstheorie befasst sich mit der Bestimmung des Ausfallrisikos eines Systems. Dabei wird im Allgemeinen vorausgesetzt, dass das Ausfallverhalten der einzelnen Komponenten dieses Systems bekannt ist. Wir setzen voraus, dass diese Komponenten unabhängig voneinander sind und dass auch die Ausfallwahrscheinlichkeiten von einander unabhängig sind. Es werden nur die beiden Zustände „System arbeitet“ und „System ist ausgefallen“ betrachtet. Neben der Zuverlässigkeit von einfachen Systemen werden wir auch verschiedene Modelle zur Beschreibung der Lebenszeiten kennenlernen.
Christine Müller, Liesa Denecke
Kapitel 18. Markovketten
Zusammenfassung
Ein wichtiges Thema der Wahrscheinlichkeitstheorie ist das Studium von stochastischen Prozessen, d.h. von Familien von Zufallsvariablen, die meist die zeitliche, gelegentlich die räumliche, Entwicklung eines Zufallsgeschehens beschreiben. Neben den Folgen von unabhängigen Zufallsvariablen, die bisher betrachtet wurden, ist eine Klasse von Prozessen besonders wichtig, die man Markovsche Ketten oder Markov-Ketten nennt. Sie sind durch eine spezielle übersichtliche Form der Abhängigkeit der Variablen charakterisiert. Markov-Ketten werden zum Beispiel zur Simulation von Warteschlangen oder im Bereich der Qualitätssicherung in der Fertigungskontrolle benutzt.
Christine Müller, Liesa Denecke

Schließende Statistik

Frontmatter
Kapitel 19. Fragestellungen der Schließenden Statistik
Zusammenfassung
Wir haben gesehen, dass die Zufallszahlen die Eigenschaften der Verteilung widerspiegeln, von der sie erzeugt werden. Wenn man nun in der Statistik Daten erhebt, so folgen diese auch einer Verteilung. Der Unterschied ist nur, dass die Verteilung nun unbekannt ist und dass man in der Regel nur wenige Daten hat. Das heißt, man hat Daten x 1, …, x N oder Datenpaare (x 1, y 1), …, (x N , y N ), bei denen N recht klein ist. Auf jeden Fall ist N im Allgemeinen nicht so groß, wie das bei den Zufallszahlen der Fall ist, wo N ja ohne weiteres als 1000 oder sogar 10000 gewählt werden kann. Wie nun trotzdem mit relativ kleinen Datensätzen auf die zu Grunde liegende Wahrscheinlichkeitsverteilung geschlossen werden kann, ist Aufgabe der „Schließenden Statistik“. Ein anderer Name für „Schließende Statistik“ ist „Inferenz-Statistik“.
Christine Müller, Liesa Denecke
Kapitel 20. ∗Punktschätzungen∗
Zusammenfassung
Wie bereits in der Einleitung beschrieben, stellen die Punktschätzung ein Verfahren dar, um bei bekannter Verteilung \(P^{{X_{0}}}\) aus den beobachteten Daten Rückschlüsse auf die unbekannten Parameter zu machen. Hier werden wichtige Anforderungen an Punktschätzungen vorgestellt, sowie ein Verfahren um Punktschätzungen herzuleiten.
Christine Müller, Liesa Denecke
Kapitel 21. Allgemeine Form eines statistischen Tests
Zusammenfassung
Dieses Kapitel gibt einen Überblick über die wichtigsten Begriffe und den Aufbau eines statistischen Tests.
Christine Müller, Liesa Denecke
Kapitel 22. Tests für H0 : μ = μ0 gegen H1 : μμ0 bei Normalverteilung
Zusammenfassung
Kann man annehmen, dass die Daten x 1, …, x N von einer Normalverteilung stammen, d.h. dass sie Realisierungen von unabhängigen, normalverteilten Zufallsvariablen X 1, …, X N sind, vereinfacht sich vieles. Die Verteilung ist dann bis auf die beiden Parameter µ und σ² der Normalverteilung bekannt. Wenn man eine Normalverteilung annimmt, so sind Hypothesen über den Erwartungswert Hypothesen über den Parameter µ. Hier wird das Testproblem H0: µ = µ0 gegen H1: µ ≠ µ0 ausführlicher betrachtet. Es wird dabei auch auf den Fehler 2. Art eingegangen und die Frage, wie groß der Stichprobenumfang sein müsste, um diesen möglichst gering zu halten.
Christine Müller, Liesa Denecke
Kapitel 23. Weitere Tests bei Normalverteilung
Zusammenfassung
In Kap. 22 wurde ausführlich das Testproblem H0: µ = µ0 gegen H1: µ ≠ µ0 behandelt. Wir werden nun weitere Tests für normalverteilte Daten kennenlernen. Wie beim Testproblem H0: µ = µ0 gegen H1: µ ≠ µ0 sind bei einigen Tests auch Aussagen über die Fehlerwahrscheinlichkeiten 2. Art möglich. Es werden Tests für den Erwartungswert und die Varianz, sowie zum Vergleich von zwei Stichproben vorgestellt. Auch Tests auf den Zusammenhang zwischen zwei Stichproben lernen wir kennen.
Christine Müller, Liesa Denecke
Kapitel 24. Tests bei nichtnormalverteilten Daten
Zusammenfassung
In diesem Kapitel lernen wir einige Tests kennen, die benutzt werden können, wenn keine Normalverteilung vorliegt.
Christine Müller, Liesa Denecke
Kapitel 25. ∗Intervallschätzungen/Konfidenzbereiche∗
Zusammenfassung
Nach einer allgemeinen Einführung zu den Konfidenzbereichen wird erläutert, wie mithilfe von Hypothesentests Intervallschätzungen hergeleitet werden können. Dieses Verfahren wird dann genutzt, um für Erwartungswert und Varianz Konfidenzbereiche anzugeben.
Christine Müller, Liesa Denecke
Kapitel 26. ∗Anwendungen in der Qualitätssicherung∗
Zusammenfassung
Wir wollen nun die Erkenntnisse des letzten Teils zur schließenden Statistik nutzen um einen kleinen Einblick in die Methoden der statistischen Qualitätssicherung zu bekommen. Wir betrachten dazu zuerst Qualitätssicherungsmaßnahmen, die vorrangig vom Produzenten bei der Herstellung von Produkten durchgeführt werden. Das betrifft zum Einen die Haltbarkeit der Produkte. Dazu werden wir zunächst noch einmal in Abschn. 26.1 die Lebensdauerverteilungen aus dem Kap. 17 über Zuverlässigkeitstheorie betrachten. Neben der Haltbarkeit müssen die Produkte aber noch viele andere Anforderungen bezüglich Größe, Gewicht, Form, chemischer Zusammensetzung, Aussehen, Funktionalität etc. erfüllen. Wenn ein Produktionsprozess so eingestellt ist, dass alle Anforderungen erfüllt sind, so stellt sich dennoch in der laufenden Fertigung immer wieder die Frage, ob die Anforderungen noch gegeben sind. Durch Verschleiß der Maschinen, durch Personalwechsel, durch Änderungen der Raumtemperatur etc. können sich die Rahmenbedingungen für die Fertigung so ändern, dass die produzierten Produkte die Anforderungen nicht mehr erfüllen. Die Aufgabe der statistischen Fertigungsüberwachung, die in Abschn. 26.2 vorgestellt wird, ist, frühzeitige Abweichungen von den Anforderungen zu erkennen. Dagegen betrifft die Annahmeprüfung, die in Abschn. 26.3 behandelt wird, sowohl den Produzenten als auch die Abnehmer. Damit soll sicher gestellt werden, dass der Konsument nur Produkte annehmen muss, die seine Anforderungen erfüllen. Umgekehrt sichert sie den Hersteller ab, dass bei ausreichender Qualitätslage der Konsument auch die Produkte abnehmen muss.
Christine Müller, Liesa Denecke
Backmatter
Metadaten
Titel
Stochastik in den Ingenieurwissenschaften
verfasst von
Christine Müller
Liesa Denecke
Copyright-Jahr
2013
Verlag
Springer Berlin Heidelberg
Electronic ISBN
978-3-642-38960-3
Print ISBN
978-3-642-38959-7
DOI
https://doi.org/10.1007/978-3-642-38960-3