Skip to main content

2014 | Buch

Statistik angewandt

Datenanalyse ist (k)eine Kunst

verfasst von: Franz Kronthaler

Verlag: Springer Berlin Heidelberg

Buchreihe : Springer-Lehrbuch

insite
SUCHEN

Über dieses Buch

Informationen aus Daten zu gewinnen und einen Datensatz systematisch zu analysieren ist (k)eine Kunst. „Statistik Angewandt“ ist für all jene geschrieben, die mit Hilfe von Daten Informationen gewinnen wollen.

In diesem Buch werden die für eine Datenanalyse benötigten Methoden der Statistik anhand eines einzigen Datensatzes vorgestellt und diskutiert. Dadurch wird deutlich, wie die Methoden der Statistik aufeinander aufbauen. Aus dem Datensatz werden nach und nach immer mehr Informationen gezogen. Die systematische Vorgehensweise der Analyse eines Datensatzes wird durch den Aufbau des Buches eindrücklich illustriert.

Der nicht-mathematische Zugang zu den Konzepten der Statistik und der Fokus auf die Anwendung statistischer Methoden versetzen den Leser in die Lage, einen Datensatz ohne grossen Aufwand gründlich zu analysieren.

Inhaltsverzeichnis

Frontmatter

Basiswissen und Werkzeuge, um Statistik anzuwenden

Frontmatter
1. Statistik ist Spaß
Zusammenfassung
Statistik ist Spaß und interessant. Interessant, weil wir mit Statistik Zusammenhänge entdecken und verstehen, wie sich Personen und auch anderes, z. B. Unternehmen, verhalten. Spaß, einfach weil es Spaß macht, Sachen zu entdecken. In diesem Kapitel klären wir, warum Statistik interessant ist, gleichzeitig klären wir wichtige Begriffe.
Franz Kronthaler

Beschreiben, nichts als beschreiben

Frontmatter
2. Mittelwerte: Wie verhalten sich Personen und Objekte im Schnitt
Zusammenfassung
Mittelwerte benutzen wir, um zu analysieren, wie sich unsere Personen und Objekte im Durchschnitt verhalten, z. B. wie viel Fleisch die Cheeseburger im Durchschnitt enthalten. Dafür stehen uns verschiedene Mittelwerte zur Verfügung: der arithmetische Mittelwert, der Median, der Modus und der geometrische Mittelwert. Diese Werte werden auch Masse der zentralen Tendenz genannt. Die Bedeutung und Anwendung sehen wir uns gleich an.
Franz Kronthaler
3. Streuung: Die Abweichung vom durchschnittlichem Verhalten
Zusammenfassung
Mittelwerte sind nur die eine Seite der Medaille. Sie sind nur so gut, wie sie die untersuchten Personen oder Objekte repräsentieren. Die andere Seite der Medaille ist die Abweichung der einzelnen beobachteten Werte von ihrem Mittelwert. Wenn die einzelnen Werte näher am Mittelwert liegen, dann repräsentiert der Mittelwert die Werte besser, liegen sie weiter vom Mittelwert entfernt, ist der Mittelwert nicht mehr so aussagekräftig.
Franz Kronthaler
4. Häufigkeiten: Wie oft treten Beobachtungen auf
Zusammenfassung
Wir können bereits ermitteln, wie sich Personen oder Objekte bei verschiedenen Variablen im Durchschnitt verhalten und wie die einzelnen Personen und Objekte im Schnitt davon abweichen bzw. streuen. Wir wissen damit bereits eine ganze Menge von unseren Personen oder Objekten. Vielleicht interessiert uns aber auch noch, wie häufig einzelnen Beobachtungen auftreten, z. B. wie viele Unternehmen eine Wachstumsrate zwischen 10 % und 15 % haben, wie viele der Unternehmensgründer sehr erfahren in ihrer Branche sind, usw. Um solche Fragen zu diskutieren, genügt es nicht, mit Durchschnitten zu arbeiten, wir brauchen Häufigkeitsdarstellungen. Zur Verfügung stehen uns hier die Häufigkeitstabelle, die absolute Häufigkeitsdarstellung, die relative Häufigkeitsdarstellung und das Histogramm.
Franz Kronthaler
5. Korrelation: Vom Zusammenhang
Zusammenfassung
Die Korrelation oder die Zusammenhangsberechnung ist neben den Mittelwerten und der Streuung ein weiteres zentrales Konzept der Statistik. Hier fragen wir nach einem Zusammenhang zwischen zwei Variablen, z. B. der Anzahl an Cheeseburgern, die Personen pro Woche essen und der Menge an Speck, die sie um den Bauch tragen. Es könnte einen Zusammenhang geben, denken wir dabei an den Selbstversuch von Morgan Spurlock. Dieser hat sich eine Zeit lang ausschließlich von Fastfood ernährt. Oder denken wir an den Ex-Bürgermeister von New York Michael Bloomberg, welcher den Verkauf von XXL-Softdrinks verbieten wollte. In diesen Fällen wird ein Zusammenhang vermutet. Je mehr Cheeseburger Personen essen, desto mehr Speck tragen sie um den Bauch. Es könnte aber auch andersherum sein, je mehr Speck Personen um den Bauch tragen, desto mehr Cheeseburger essen sie. Mit der letzten Aussage haben wir eine wichtige Information erhalten. Die Korrelation gibt uns keine Aussage über die Richtung des Zusammenhanges, über die Kausalität. Wenn wir eine Korrelation berechnet haben, wissen wir nicht, ob Personen, die viele Cheeseburger essen, mehr Speck haben oder ob Personen die mehr Speck haben, mehr Cheeseburger essen. Wir wissen nur, dass sich die Variablen in dieselbe Richtung bewegen.
Franz Kronthaler
6. Verhältniszahlen: Die Chance, Neues aus altem Wissen zu erzeugen
Zusammenfassung
Bisher haben wir Variablen analysiert, die uns vorliegen. Was aber ist, wenn uns die Information noch nicht vorliegt, sondern in unseren Daten versteckt ist. Wir können dann aus unseren existierenden Variablen die Information erzeugen, indem wir Variablen in eine Beziehung zueinander setzen. Sehen wir uns noch einmal unsere Variable Wachstumsrate an. Mit ihr beschreiben wir das durchschnittliche Gewinnwachstum der Unternehmungen in Prozent. Dieses dürfte weitgehend, aber nicht ganz, unabhängig von der Unternehmensgröße sein. Sehen wir uns aber den Gewinn eines Unternehmens pro Jahr in absoluten Zahlen an, dann spielt die Unternehmensgröße eine viel bedeutendere Rolle. Es macht einen Unterschied, ob ein Unternehmen mit zehn Mitarbeitern CHF 500‘000 Gewinn macht, oder ein Unternehmen mit 100 Mitarbeitern.
Franz Kronthaler

Von Wenigen zu Allen

Frontmatter
7. Von Daten und der Wahrheit
Zusammenfassung
Es ist jetzt an der Zeit, noch einmal über unsere Daten zu sprechen. Warum haben wir diese und wie kommen wir zu diesen? Daten haben wir, um ein Problem zu lösen oder eine Fragestellung zu analysieren. Am Anfang steht daher immer ein Problem bzw. eine Fragestellung. Wir wollen etwas wissen, zum Beispiel:
  • Wie hoch ist die durchschnittliche Wachstumsrate von neu gegründeten Unternehmen?
  • Wie hoch ist das durchschnittliche Alter von Unternehmensgründern?
  • Gründen mehr Frauen oder mehr Männer ein Unternehmen?
  • Gibt es einen Zusammenhang zwischen Marketingaktivitäten und dem Wachstum neu gegründeter Unternehmen?
Franz Kronthaler
8. Hypothesen: Nur eine Präzisierung der Frage
Zusammenfassung
Hypothese ist ein Begriff, der im Forschungsprozess immer wieder benutzt wird, der aber vielen Personen unklar ist. Auch Dozenten haben verschiedentlich eine völlig falsche Vorstellung von dem, was eine Hypothese ist. Eine Hypothese ist grundsätzlich etwas ganz Einfaches. Salopp ausgedrückt ist es nur eine Übersetzung der Fragestellung in eine testbare Aussage. Gleichzeitig ist eine Hypothese aber auch etwas ganz Großartiges. Mit einer Hypothese erzeugen wir statistisch abgesichertes Wissen.
Franz Kronthaler
9. Normalverteilung und andere Testverteilungen
Zusammenfassung
Wir wissen nun, was eine Hypothese ist und dass wir diese nutzen, Forschungsfragen zu beantworten bzw. Aussagen zu testen. Wir wissen aber noch nicht, wie das Testen funktioniert. Um dies zu verstehen, müssen wir uns zunächst klar machen, dass der Zufall nicht ganz zufällig ist. Wir werden sehen, dass der Zufall normal-, aber auch anders verteilt sein kann. Das bedeutet ganz konkret, wir können eine Aussage darüber treffen, wie zufällig der Zufall eintritt. Interessant, nicht? Im Folgenden setzen wir uns mit der Verteilung des Zufalls auseinander. Wir werden sehen, dass die Normalverteilung eine nicht ganz unbedeutende Testverteilung beim Hypothesentest ist. Wir werden aber auch noch andere Testverteilungen kennenlernen. Es bleibt spannend.
Franz Kronthaler
10. Hypothesentest: Was gilt?
Zusammenfassung
Wir wissen nun, was eine Hypothese ist, wir kennen ferner wichtige Testverteilungen. Was wir noch nicht wissen ist, wie wir mit Hilfe der Testverteilungen Hypothesen testen und Aussagen über unsere Grundgesamtheit erzeugen. Das Ziel dieses Kapitels ist es, genau das zu erlernen. Wir klären den Begriff statistische Signifikanz. Wenn wir diesen verstanden haben, können wir wissenschaftliche Studien lesen. Wir erläutern das Signifikanzniveau sowie den Fehler, der beim Testen zugelassen wird. Anschließend diskutieren wir die Schritte, die wir bei Durchführung eines jeden Hypothesentests durchlaufen müssen.
Franz Kronthaler

Verfahren zum Testen von Hypothesen

Frontmatter
11. Der Mittelwerttest
Zusammenfassung
Erinnern wir uns, im Kap. 2 haben wir den arithmetischen Mittelwert kennengelernt und berechnet. Beispielsweise haben wir für unsere Unternehmen herausgefunden, dass diese im Durchschnitt in den letzten 5 Jahren um 7.1 % gewachsen sind, dass sie für Marketing im Durchschnitt 19.81 % und für Produktverbesserung im Durchschnitt 4.65 % vom Umsatz aufwenden. Ferner wissen wir, dass die Unternehmensgründer im Durchschnitt 34.25 Jahre alt sind und dass sie über eine Branchenberufserfahrung von 7.42 Jahre verfügen. Wir haben erfahren, die Aussage gilt nur für die Stichprobe, nicht für die Grundgesamtheit. Damit geben wir uns aber nicht zufrieden. Wir wollen mit Hilfe des Hypothesentests eine Aussage über die Grundgesamtheit erzeugen. Konkret gehen wir beim Mittelwerttest der Frage nach, ob die Annahme zum Mittelwert in der Grundgesamtheit mit dem vorliegenden Stichprobenbefund verträglich ist.
Franz Kronthaler
12. Der Test auf Differenz von Mittelwerten bei unabhängigen Stichproben
Zusammenfassung
Im letzten Kapitel sind wir der Frage nachgegangen, wie alt unsere Unternehmensgründer im Durchschnitt sind und wir haben einen Mittelwerttest durchgeführt. Diese Fragestellung können wir erweitern. Beispielsweise können wir uns dafür interessieren, ob Frauen bei der Gründung eines Unternehmens älter sind als Männer. In diesem Fall vergleichen wir das durchschnittliche Gründungsalter von Frauen mit dem durchschnittlichen Gründungsalter von Männern. Wir vergleichen zwei Mittelwerte und testen, ob sich diese unterscheiden oder ob sie gleich sind. Immer dann, wenn wir zwei Mittelwerte aus zwei verschiedenen Gruppen vergleichen, führen wir den Test auf Differenz von Mittelwerten bei unabhängigen Stichproben durch. Weitere Beispiele aus unserem Datensatz wären die Fragen, ob Industrieunternehmen oder Dienstleistungsunternehmen ein durchschnittlich höheres Wachstum erzielen oder ob sich Frauen und Männer hinsichtlich der Branchenberufserfahrung unterscheiden.
Franz Kronthaler
13. Der Test auf Differenz von Mittelwerten bei abhängigen Stichproben
Zusammenfassung
Beim Mittelwerttest für unabhängige Stichproben haben wir untersucht, ob sich zwei unabhängige Gruppen bezüglich eines Sachverhaltes unterscheiden. Wir haben zwei verschiedene Gruppen untersucht und diese dann verglichen. Beim Test auf Differenz von Mittelwerten bei abhängigen Stichproben untersuchen wir ein und dieselbe Gruppe zweimal und fragen uns, ob eine bestimmte Maßnahme einen Einfluss auf die Gruppe hat. Wir können uns beispielweise fragen, ob Alkohol einen Einfluss auf die Fahrtüchtigkeit von Personen hat, oder ob ein Medikament den Gesundheitszustand von Personen verbessert. Wir untersuchen die Person vor und nach der Maßnahme, vergleichen anschließend die Ergebnisse und fragen damit nach der Wirkung der Maßnahme. Im Unternehmenskontext wird das Verfahren zum Beispiel eingesetzt, um die Wirkung einer Werbemaßnahme zu evaluieren, z. B. um zu fragen, welchen Einfluss eine Werbemaßnahme auf die Einstellung von Personen zu einem bestimmten Produkt oder Unternehmen ausübt. Man könnte aber auch untersuchen, wie Energy-Drinks die Leistungsfähigkeit von Sportlern beeinflusst.
Franz Kronthaler
14. Der Test auf Korrelation bei metrischen, ordinalen und nominalen Daten
Zusammenfassung
In Kap. 5 sind wir der Frage nach dem Zusammenhang zwischen zwei Variablen nachgegangen, also wie und ob sich zwei Variablen gemeinsam bewegen. Wir haben dies sowohl für metrische und ordinale als auch für nominale Variablen untersucht. Beispielsweise untersuchten wir einen Zusammenhang zwischen den Variablen Marketing und Produktverbesserung oder zwischen den Variablen Erwartung und Selbsteinschätzung. Berechnet haben wir die Korrelationskoeffizienten anhand der Stichprobe. Mit dem Test auf Korrelation testen wir nun, ob der in der Stichprobe entdeckte Zusammenhang auch für die Grundgesamtheit gilt. Nur dann ist unser Stichprobenergebnis wirklich für Handlungsempfehlungen und Schlussfolgerungen von Bedeutung. Wenn der in der Stichprobe entdeckte Zusammenhang nicht signifikant ist, dann gilt der entdeckte Zusammenhang in der Grundgesamtheit nicht. Im Folgenden diskutieren wir den Test auf Korrelation für die Korrelationskoeffizienten von Bravais-Pearson und Spearman sowie für nominale Daten.
Franz Kronthaler
15. Weitere Testverfahren für nominale Variablen
Zusammenfassung
Mittlerweile haben wir eine ganze Reihe von Testverfahren kennengelernt. Es fehlt uns noch ein wichtiger Strang, die Testverfahren für nominale Daten. Diese wollen wir uns jetzt ansehen. Die Testverfahren für nominale Daten werden oft kurz χ2-Tests genannt, da die Testverteilung in der Regel die χ2-Verteilung ist. Mit dem χ2-Test auf Unabhängigkeit haben wir bereits eines der Verfahren für nominale Daten kennengelernt. Wir werden uns jetzt zudem ansehen, wie die Tests bei nominalen Daten und einer Stichprobe, bei zwei unabhängigen Stichproben und bei zwei abhängigen Stichproben durchgeführt werden.
Franz Kronthaler

Regressionsanalyse

Frontmatter
16. Die lineare Einfachregression
Zusammenfassung
Das Ziel der linearen Einfachregression ist zu erklären, welchen Einfluss eine Variable X auf eine Variable Y ausübt und was mit der Variable Y passiert, wenn sich die Variable X verändert oder verändert wird.
Franz Kronthaler
17. Die multiple Regressionsanalyse
Zusammenfassung
Im vorangegangen Kapitel haben wir gesehen, dass in der Regel eine unabhängige Variable nicht genügt, um die abhängige Variable ausreichend zu beschreiben. Normalerweise haben mehrere Faktoren einen Einfluss. Wir benötigen typischerweise die multiple Regressionsanalyse, auch multivariate Regressionsanalyse genannt, um einen Sachverhalt zu beschreiben. Mit dieser analysieren wir gleichzeitig den Einfluss mehrerer unabhängiger Variablen auf eine abhängige Variable.
Franz Kronthaler

Wie geht es weiter?

Frontmatter
18. Kurzbericht zu einer Forschungsfrage
Zusammenfassung
Nach der Datenauswertung müssen wir die Ergebnisse in der Regel noch schriftlich, in Form einer Studienarbeit, einer Bachelor- oder Masterarbeit oder in Form eines Journals festhalten. Dabei sind immer folgende Punkte zu diskutieren:
1.
die Problemstellung,
 
2.
die Fragestellung,
 
3.
die Literatur,
 
4.
die Daten und die Methode,
 
5.
die empirischen Ergebnisse,
 
6.
die Zusammenfassung und die Schlussfolgerungen.
 
Franz Kronthaler
19. Weiterführende statistische Verfahren
Zusammenfassung
Mit der multiplen Regressionsanalyse haben wir eines der wichtigsten multivariaten Analyseverfahren kennengelernt. Es ist jedoch nicht das Einzige. Darüber hinaus gibt es weitere multivariate Analyseverfahren, die bei bestimmten Fragestellungen eingesetzt werden. Zu den Wichtigsten geben wir hier noch einen kurzen Abriss. Im nächsten Abschnitt kommen wir dann zu der Literatur, die genutzt werden kann, sich in die Regressionsanalyse und die weiteren Verfahren der multivariaten Analyseverfahren vertieft einzuarbeiten.
Franz Kronthaler
20. Interessante und weiterführende Statistikbücher
Zusammenfassung
Zum Schluss möchte ich noch einige Hinweise zu interessanten und weiterführenden Statistikbüchern geben. Dieser Abschnitt soll eine kleine Hilfe für diejenigen sein, die sich mit der Statistik vertieft auseinandersetzen wollen. Er kann aber natürlich nicht die eigene Recherchearbeit nach geeigneter Literatur ersetzen. Neben den erwähnten Büchern gibt es eine ganze Reihe weiterer guter Lehrbücher.
Franz Kronthaler
21. Ein weiterer Datensatz zum Üben – Praktikant eines Unternehmens
Zusammenfassung
Ein zentrales Feature des Buches ist die Anwendung der diskutierten Verfahren auf andere Datensätze. Um das zu verdeutlichen, wird im Folgenden ein weiterer Datensatz abgebildet. Studenten können diesen Datensatz nutzen, um zu üben. Dozierende haben die Möglichkeit, diesen Datensatz im Unterricht anstatt des im Buch verwendeten Datensatzes einzusetzen, wenn dieser besser zu ihrem Fachbereich passt. Der vollständige simulierte Datensatz ist unter www.statistik-kronthaler.ch verfügbar. Auf dieser Plattform werden im Laufe der Zeit weitere Datensätze bereitgestellt, die in unterschiedlichen Fachbereichen eingesetzt werden können.
Franz Kronthaler
Backmatter
Metadaten
Titel
Statistik angewandt
verfasst von
Franz Kronthaler
Copyright-Jahr
2014
Verlag
Springer Berlin Heidelberg
Electronic ISBN
978-3-642-53740-0
Print ISBN
978-3-642-53739-4
DOI
https://doi.org/10.1007/978-3-642-53740-0