Die explorative Faktorenanalyse ist ein Verfahren der multivariaten Analyse, das darauf gerichtet ist, Strukturen in großen Variablensets erkennen zu können. Große Variablensets sind oftmals dadurch gekennzeichnet, dass mit steigender Zahl der Variablen davon auszugehen ist, dass sich mehr und mehr Variablen überlappen. Statistisch drückt sich dies in Korrelationen zwischen den Variablen aus. Die exploratorische Faktorenanalyse versucht, die Beziehungszusammenhänge in einem großen Variablenset insofern zu strukturieren, als sie Gruppen von Variablen identifiziert, die hoch miteinander korreliert sind, und diese von weniger korrelierten Gruppen trennt. Die Gruppen von jeweils hoch korrelierten Variablen bezeichnet man auch als Faktoren. Neben der Strukturierungsfunktion wird die Faktorenanalyse auch zur Datenreduktion eingesetzt. Das Kapitel gibt am Ende auch einen kurzen Ausblick auf die konfirmatorische Faktorenanalyse, bei der vorgegebene Faktorenstrukturen überprüft werden.
Anzeige
Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.
Korrelationen bilden die Analysebasis der Faktorenanalyse. Für Leser, die mit dem Begriff nicht mehr hinreichend vertraut sind, werden in Abschn. 1.2.2 Korrelationen nochmals ausführlich erläutert und an einem kleinen Rechenbeispiel verdeutlicht.
Auf der zu diesem Buch gehörigen Internetseite www.multivariate.de stellen wir ergänzendes Material zur Verfügung, um das Verstehen der Methode zu erleichtern und zu vertiefen.
Die Transformation einer Variablen xj in eine standardisierte Variable zj bewirkt, dass anschließend der Mittelwert von zj = 0 und die Varianz von zj = 1 beträgt. Dadurch ergeben sich wesentliche Vereinfachungen bei der Darstellung der folgenden Zusammenhänge. Vgl. zur Standardisierung auch die Ausführungen in Abschn. 1.2.1.
Es werden standardisierte Variablen mit einer Einheitsvarianz von 1 unterstellt. Zur Zerlegung der Einheitsvarianz einer Variablen siehe auch die Erläuterungen in Abschn. 7.2.2.4.2 und insbesondere Abb. 7.13.
Es sei daran erinnert, dass standardisierte Variablen verwendet wurden und daher die Varianz jeder Variable 1 und die Gesamtvarianz des Datensatzes bei fünf Variablen 5 beträgt.
Die Berechnung der Eigenwerte stellt ein „Standardproblem“ der Mathematik dar. Sie werden als erstes berechnet, bevor die Ableitung der Komponenten oder Faktoren erfolgt.
Vgl. zur Problematik der Interpretation von Faktoren bzw. Hauptkomponenten auch die Darstellung in Abschn. 7.2.3 sowie die Darstellungen zum Fallbeispiel in Abschn. 7.3.3.4.
Im Vergleich zur HAA besteht das Ziel der Verfahren ML, GLS und ULS jeweils darin, die Faktorladungen so zu bestimmen, dass die Differenz zwischen der empirischen Korrelationsmatrix (R) und der modelltheoretischen Korrelationsmatrix (\(\widehat{\mathbf{R}}\)) minimal wird. Bei der Alpha-Faktorisierung wird Cronbachs Alpha maximiert, und die Image-Faktorisierung stellt auf das Image einer Variablen ab. Die aufgeführten Verfahren sind auch in SPSS implementiert, wobei in SPSS auch die HKA als weiteres Extraktionsverfahren enthalten ist (vgl. Abb. 7.21).
Es sei daran erinnert, dass im Gegensatz dazu bei der HKA nach einem „Sammelbegriff“ für korrelierende Variablen zu suchen ist. Vgl. zur Problematik der Interpretation von Faktoren auch die Darstellung in Abschn. 7.2.3 sowie die Darstellungen zum Fallbeispiel in Abschn. 7.3.3.4.
Im Fallbeispiel wird der gleiche Datensatz wie auch bei der Diskriminanzanalyse (Kap. 4), der Logistischen Regression (Kap. 5) und der Clusteranalyse (Kap. 8) verwendet. Auf diese Weise sollen die Ähnlichkeiten und Unterschiede zwischen den verschiedenen Verfahrensvarianten besser verdeutlicht werden.
Fehlende Werte sind ein häufiges und leider unvermeidbares Problem bei empirischen Erhebungen (z. B. weil Personen nicht antworten konnten oder wollten). Der Umgang mit fehlenden Werten in empirischen Studien wird in Abschn. 1.5.2 diskutiert.
Auf der zu diesem Buch gehörigen Internetseite www.multivariate.de stellen wir ergänzendes Material zur Verfügung, um das Verstehen der Methode zu erleichtern und zu vertiefen.
Zur Identifikation ähnlich wahrgenommener Objekte ist die Clusteranalyse das zentrale methodische Instrument. Auch die in diesem Buch dargestellte Clusteranalyse (vgl. Kap. 8) basiert im Fallbeispiel auf dem hier verwendeten Datensatz (vgl. Tab. 7.24) und bestätigt das sich hier abzeichnende Ergebnis einer Zwei-Cluster-Lösung.