2010 | OriginalPaper | Buchkapitel
Item-Response-Theorie
verfasst von : Christian Geiser, Michael Eid
Erschienen in: Handbuch der sozialwissenschaftlichen Datenanalyse
Verlag: VS Verlag für Sozialwissenschaften
Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.
Wählen Sie Textabschnitte aus um mit Künstlicher Intelligenz passenden Patente zu finden. powered by
Markieren Sie Textabschnitte, um KI-gestützt weitere passende Inhalte zu finden. powered by
Dieses Kapitel gibt einen Überblick über die wichtigsten Modelle und Methoden der Item-Response-Theorie (IRT). Die IRT stellt Modelle zur psychometrischen Analyse und Skalierung von Test- und Fragebogenitems insbesondere mit nominalem und ordinalem Skalenniveau zur Verfügung. Als eines der einfachsten und bekanntesten IRTModelle wird zunächst das Rasch-Modell (1-parametriges logistisches Modell) für dichotome Items vorgestellt. Im Rasch-Modell wird angenommen, dass alle Items einer Skala oder eines Tests dieselbe latente Dimension (z. B. Fähigkeit, Einstellung, Persönlichkeitseigenschaft) mit unterschiedlichen Itemschwierigkeiten aber jeweils identischer Trennschärfe erfassen. Wichtige Eigenschaften sind die spezifische Objektivität der Messungen, wenn das Rasch-Modell für einen Itemsatz gilt sowie die Tatsache, dass der ungewichtete Summenscore der Items bei Gültigkeit des Rasch-Modells eine suffiziente Statistik für den Personenparameter darstellt. Mögliche Gründe für eine Fehlanpassung des Rasch-Modells in der Praxis werden diskutiert. Anschließend werden das Birnbaum-Modell (2-parametriges logistisches Modell), in welchem die Annahme gleicher Trennschärfen aller Items aufgehoben wird, und das Birnbaum- Modell mit Rateparameter (3-parametriges logistisches Modell), in welchem zusätzlich die Ratewahrscheinlichkeit berücksichtigt wird, besprochen. In den folgenden Abschnitten wird aufWeiterentwicklungen des Rasch-Modells eingegangen. Exemplarisch werden Rasch-Modelle für mehrstufig geordnet kategoriale (ordinale) Items sowie Mischverteilungsmodelle (Mixed-Rasch-Modell) behandelt. In einer empirischen Anwendung auf sechs dichotome Testitems zur Messung der Fähigkeit zur „mentalen Rotation“ (
N
= 519) zeigen wir, wie mit Hilfe des Computerprogramms WINMIRA die Modellparameter, Fitstatistiken für das Rasch-Modell und das Mixed-Rasch- Modell geschätzt werden können. In diesem Anwendungsbeispiel zeigt sich, dass das einfache Rasch-Modell aufgrund unterschiedlicher Lösungsstrategien in Subgruppen schlechter passt als ein 2-Klassen-Mixed-Rasch-Modell, in welchem sich die Itemparameter für zwei latente Klassen unterscheiden können. Eine zweite Anwendung (drei 7-stufige Items zur Erfassung von Offenheit aus dem SOEP;
N
= 2036) illustriert, wie Mischverteilungs-IRT-Modelle dazu genutzt werden können, a priori unbekannte Personengruppen zu identifizieren, die sich hinsichtlich der Nutzung der Ratingskala unterscheiden. Im vorliegenden Fall zeigt sich, dass nur ca. 65% der Befragten die vorgegebene 7-stufige Ratingskala in der intendierten Weise verwendet haben. Die restlichen 35% der Befragten verwendeten die Skala dagegen nur eingeschränkt mit einer Tendenz zu den Extremkategorien sowie zur Mittelkategorie der Skala. Abschließend wird auf praktische Aspekte und besondere Probleme bei der Durchführung von IRT-Analysen eingegangen.