Skip to main content
main-content

Über dieses Buch

Wir leben in einer Welt der Daten. Daten allein aber sind wertlos, wenn wir nicht in der Lage sind, aus ihnen Informationen zu gewinnen. Um Informationen aus Daten zu extrahieren, sind Methoden der multivariaten Datenanalyse unerlässlich.

Dieses Buch bietet eine leicht verständliche Einführung in die wichtigsten Methoden der multivariaten Datenanalyse. Es ist anwendungsorientiert, erfordert nur wenige Kenntnisse in Mathematik und Statistik, demonstriert die Verfahren mit numerischen Beispielen und veranschaulicht jede Methode anhand eines ausführlichen Fallbeispiels. Für Interessierte werden im Einführungskapitel für alle Verfahren relevante statistische Grundlagen aufgefrischt.

Für die 16. Auflage wurden alle Kapitel inkl. Fallbeispielen neu gefasst und mit der aktuellen Version von IBM SPSS gerechnet. Neue, für die anwendungsorientierten Nutzer sinnvolle Auswertungsoptionen wurden ergänzt.

Der Inhalt

Einführung in die empirische Datenanalyse – Regressionsanalyse – Varianzanalyse

Diskriminanzanalyse – Logistische Regression – Kontingenzanalyse – Faktorenanalyse

Clusteranalyse – Conjoint-Analyse

Das Buch wurde 2015 vom Berufsverband Deutscher Markt- und Sozialforscher (BVM) als das Lehrbuch ausgezeichnet, das die deutsche Marktforschungspraxis in den letzten Jahrzehnten nachhaltig geprägt hat. Es ist auch in Englisch und Chinesisch erschienen.

Auf der Webseite www.multivariate-methods.info werden weitere Materialien (bspw. Excel-Beispiele, R Code) angeboten, durch die sich die Verfahren noch besser erschließen und vertiefen lassen. Interaktive Flashcards helfen den eigenen Lernfortschritt zu kontrollieren. Mit der Springer Nature Flashcards-App können Sie exklusive Inhalte nutzen und Ihr Wissen testen.

Inhaltsverzeichnis

Frontmatter

Kapitel 1. Einführung in die empirische Datenanalyse

Zusammenfassung
In diesem einleitenden Kapitel werden die in diesem Buch behandelten acht Methoden der multivariaten Datenanalyse vorgestellt, charakterisiert und klassifiziert. Bei der Anwendung von Methoden der multivariaten Analyse (MVA) werden mehrere Variablen gleichzeitig betrachtet und ihre Zusammenhänge quantitativ analysiert. Ziel der Methoden der multivariaten Analyse ist es, die Zusammenhänge zu beschreiben, zu erklären oder zukünftige Entwicklungen vorherzusagen. Ein Sonderfall der MVA sind bivariate Analysen, bei denen jeweils nur zwei Variablen gleichzeitig betrachtet werden. Methoden der multivariaten Analyse gehören heute zu den Grundlagen der empirischen Forschung in der Wissenschaft.
Weiterhin werden in diesem Kapitel auch Grundlagen der empirischen Datenanalyse vorgestellt, die für alle behandelten Analysemethoden relevant sind. Da die meisten Leser mit diesen Grundlagen vertraut sein werden, dienen diese Darstellungen primär der Wiederholung oder der Möglichkeit, wichtige Aspekte der quantitativen Datenanalyse nochmals nachzuschlagen: Zunächst werden statistische Basiskonzepte vorgestellt (z. B. Mittelwert, Standardabweichung, Kovarianz) und der Unterschied zwischen Korrelation und Kausalität aufgezeigt. Darüber hinaus werden die Grundlagen des statistischen Testens zusammenfassend am Beispiel des Mittelwerttests und des Anteilstests dargestellt. Schließlich wird auf den Umgang mit Ausreißern und Missing Values eingegangen, und das in diesem Buch verwendete Statistikpaket IBM SPSS Statistics wird kurz vorgestellt.
Klaus Backhaus, Bernd Erichson, Sonja Gensler, Rolf Weiber, Thomas Weiber

Kapitel 2. Regressionsanalyse

Zusammenfassung
Die Regressionsanalyse bildet eines der flexibelsten und am häufigsten eingesetzten statistischen Analyseverfahren. Sie dient der Analyse von Beziehungen zwischen einer metrisch skalierten abhängigen Variablen und einer oder mehreren metrisch skalierten unabhängigen Variablen. Insbesondere wird sie eingesetzt, um Zusammenhänge quantitativ zu beschreiben und sie zu erklären, Werte der abhängigen Variablen zu schätzen bzw. zu prognostizieren. Die Regressionsanalyse ist von eminenter Wichtigkeit für Wissenschaft und Praxis.
Klaus Backhaus, Bernd Erichson, Sonja Gensler, Rolf Weiber, Thomas Weiber

Kapitel 3. Varianzanalyse (ANOVA)

Zusammenfassung
Die Varianzanalyse ist ein Verfahren, welches die Wirkung einer (oder mehrerer) unabhängiger Variablen auf eine (oder mehrere) abhängige Variablen untersucht. Für die unabhängigen Variablen, die auch als Faktoren oder Treatments bezeichnet werden, wird dabei lediglich eine nominale Skalierung verlangt, während die abhängige Variable (auch Zielvariable genannt) metrisch skaliert ist. Die Varianzanalyse ist das wichtigste multivariate Verfahren zur Aufdeckung von Mittelwertunterschieden über mehr als zwei Gruppen hinweg und dient damit insbesondere der Auswertung von Experimenten. Das Kapitel behandelt sowohl die einfaktorielle (eine abhängige und eine unabhängige Variable) als auch die zweifaktorielle (eine abhängige Variable und zwei unabhängige Variablen) Varianzanalyse und erweitert die Betrachtungen im Fallbeispiel auf die Analyse mit zwei unabhängigen Faktoren (nominal skaliert) und zwei (metrisch skalierten) Kovariaten. Darüber hinaus werden auch die Kontrastanalyse und der Post hoc-Test behandelt.
Klaus Backhaus, Bernd Erichson, Sonja Gensler, Rolf Weiber, Thomas Weiber

Kapitel 4. Diskriminanzanalyse

Zusammenfassung
Die Diskriminanzanalyse ist ein multivariates Verfahren zur Analyse von Gruppenunterschieden. Sie ermöglicht es, die Unterschiedlichkeit von zwei oder mehreren Gruppen hinsichtlich einer Vielzahl von Variablen zu untersuchen. Ein weiteres Anwendungsgebiet der Diskriminanzanalyse ist die Prognose der Gruppenzughörigkeit neuer Objekte oder Personen. Die Diskriminanzanalyse im Fall von zwei und mehr Gruppen wird in diesem Kapitel beschrieben.
Klaus Backhaus, Bernd Erichson, Sonja Gensler, Rolf Weiber, Thomas Weiber

Kapitel 5. Logistische Regression

Zusammenfassung
Bei vielen Problemstellungen in Wissenschaft und Praxis treten immer wieder die folgenden Fragen auf: Welcher von zwei oder mehreren alternativen Zuständen liegt vor oder welches Ereignis wird eintreffen? Welche Faktoren eignen sich für die Entscheidung oder Prognose und welchen Einfluss haben sie auf das Zustandekommen eines Zustandes oder Ereignisses?
Häufig geht es dabei nur um zwei alternative Zustände oder Ereignisse, z. B. hat ein Patient eine bestimmte Krankheit oder nicht? Zur Beantwortung derartiger Fragen kann die logistische Regression angewendet werden. Die logistische Regression ähnelt hinsichtlich der Problemstellung der Diskriminanzanalyse. Der für den Anwender wesentliche Unterschied zwischen den beiden Verfahren besteht darin, dass die logistische Regression direkt Wahrscheinlichkeiten für das Eintreffen der alternativen Zustände oder der Zugehörigkeiten zu den einzelnen Gruppen liefert.
Klaus Backhaus, Bernd Erichson, Sonja Gensler, Rolf Weiber, Thomas Weiber

Kapitel 6. Kontingenzanalyse

Zusammenfassung
Die Kontingenzanalyse dient dazu, Zusammenhänge zwischen nominal skalierten Variablen aufzudecken und zu untersuchen. Beispielsweise könnte uns interessieren, ob die beiden kategorialen Variablen „Ernährungsstil“ und „Geschlecht“ zusammenhängen. Die Kontingenzanalyse prüft, ob ein Zusammenhang zwischen den beiden Variablen besteht und es kann zudem die Stärke des Zusammenhangs bestimmt werden. Dieses Kapitel beschreibt die Kontingenzanalyse anhand eines Beispiels und erläutert den Einfluss von Störvariablen.
Klaus Backhaus, Bernd Erichson, Sonja Gensler, Rolf Weiber, Thomas Weiber

Kapitel 7. Faktorenanalyse

Zusammenfassung
Die explorative Faktorenanalyse ist ein Verfahren der multivariaten Analyse, das darauf gerichtet ist, Strukturen in großen Variablensets erkennen zu können. Große Variablensets sind oftmals dadurch gekennzeichnet, dass mit steigender Zahl der Variablen davon auszugehen ist, dass sich mehr und mehr Variablen überlappen. Statistisch drückt sich dies in Korrelationen zwischen den Variablen aus. Die exploratorische Faktorenanalyse versucht, die Beziehungszusammenhänge in einem großen Variablenset insofern zu strukturieren, als sie Gruppen von Variablen identifiziert, die hoch miteinander korreliert sind, und diese von weniger korrelierten Gruppen trennt. Die Gruppen von jeweils hoch korrelierten Variablen bezeichnet man auch als Faktoren. Neben der Strukturierungsfunktion wird die Faktorenanalyse auch zur Datenreduktion eingesetzt. Das Kapitel gibt am Ende auch einen kurzen Ausblick auf die konfirmatorische Faktorenanalyse, bei der vorgegebene Faktorenstrukturen überprüft werden.
Klaus Backhaus, Bernd Erichson, Sonja Gensler, Rolf Weiber, Thomas Weiber

Kapitel 8. Clusteranalyse

Zusammenfassung
Die Clusteranalyse ist ein Verfahren zur Gruppierung von Fällen (Untersuchungsobjekten) in einem Datensatz. Zu diesem Zweck muss im ersten Schritt die Ähnlichkeit bzw. Unähnlichkeit (Distanz) zwischen den Fällen über ein geeignetes Maß festgestellt werden. Im zweiten Schritt ist der Fusionierungsalgorithmus zu bestimmen, mit dessen Hilfe die einzelnen Fälle sukzessive zu Gruppen (Cluster) zusammengefasst werden. Ziel ist es dabei, solche Untersuchungsobjekte zu Gruppen (Cluster) zusammenzufassen, die im Hinblick auf die betrachteten Eigenschaften oder Merkmale der Untersuchungsobjekte als möglichst homogen zu bezeichnen sind. Gleichzeitig sollten die Gruppen untereinander eine möglichst große Heterogenität aufweisen, d. h. möglichst unähnlich sein. Die Verfahren der Clusteranalyse können dabei sowohl Variablen mit metrischem, nicht-metrischem als auch gemischtem Skalenniveau verarbeiten. Den Schwerpunkt des Kapitels bilden die hierarchisch-agglomerativen Clusterverfahren, wobei vor allem das Single Linkage-Verfahren und das Ward-Verfahren im Detail vorgestellt werden. Abschließend werden mit der K-Means-Clusteranalyse und der Two-Step-Clusteranalyse auch zwei partitionierende Clusterverfahren behandelt, die vor allem bei großen Datenmengen deutliche Vorteile gegenüber den hierarchischen Clusterverfahren bieten.
Klaus Backhaus, Bernd Erichson, Sonja Gensler, Rolf Weiber, Thomas Weiber

Kapitel 9. Conjoint-Analyse

Zusammenfassung
Die (traditionelle) Conjoint-Analyse ist ein Verfahren zur Messung und Analyse von Präferenzen. Die Probanden bewerten unterschiedliche Alternativen mithilfe metrischer oder ordinaler Skalen. Die gemessenen Präferenzen dienen als Maß für den Nutzenwert einer Alternative. Ziel der Conjoint-Analyse ist es, aus den gemessenen Nutzenwerten den Nutzenbeitrag der einzelnen Eigenschaftsausprägungen zu bestimmen. In diesem Kapitel wird sowohl die traditionelle Conjoint-Analyse wie auch die auswahlbasierte Conjoint-Analyse, die sog. Choice-Based Conjoint-Analyse (CBC-Analyse), beschrieben.
Klaus Backhaus, Bernd Erichson, Sonja Gensler, Rolf Weiber, Thomas Weiber

Backmatter

Weitere Informationen