Skip to main content

2012 | Buch

Testtheorie und Fragebogenkonstruktion

herausgegeben von: Univ.-Prof. Dr. Helfried Moosbrugger, Prof. Dr. Augustin Kelava

Verlag: Springer Berlin Heidelberg

Buchreihe : Springer-Lehrbuch

insite
SUCHEN

Über dieses Buch

Einen Test oder Fragebogen selbst konstruieren? Beurteilen, was einen guten Test oder Fragebogen kennzeichnet, und verstehen, welche Theorie dahinter steckt? Datenanalysen am Computer selbst durchführen und interpretieren können? Diese Kompetenzen der Psychologischen Diagnostik und Forschung sollte man beherrschen - nicht nur für Prüfungen oder Abschlussarbeiten in der Psychologie und in den Sozial- oder Wirtschaftswissenschaften, sondern auch für alle Fragen des Assessments im Berufsleben. Dieses erfolgreiche Lehrbuch deckt sowohl die Grundlagen im Bachelor-Studium (z.B. Grundlagen der Planung und Entwicklung von Tests, Testgütekriterien, Itemanalyse, klassische Testtheorie) als auch vertiefende Aspekte im Master-Studiengang ab (z.B. Item-Response-Theorie, adaptives Testen, Latent-Class-Analysis, Latent-State-Trait-Theorie). Die zweite Auflage wurde sorgfältig überarbeitet und aktualisiert. Neu hinzugekommen sind Hinweise und Anleitungen zur Nutzung von Anwendungssoftware (SPSS, LISREL u.a.), Beispieldatensätze sowie Musteranalysen und kommentierte Ergebnisscreens in kostenlosen Zusatzkapiteln zum Download auf www.lehrbuch-psychologie.de. Um das Wissen zu vertiefen oder zu überprüfen, bietet die Website den Studierenden darüber hinaus noch weitere Lern-Tools. Bei allem wurde besonderer Wert auf die verständliche Aufbereitung des Wissens gelegt: Definitionen, Merksätze, Zusammenfassungen und Anwendungsbeispiele helfen, Tests zu verstehen, Tests selbst zu konstruieren, Tests richtig zu interpretieren!

Inhaltsverzeichnis

Frontmatter

Einführung und zusammenfassender Überblick

1. Einführung und zusammenfassender Überblick
Zusammenfassung
Es ist ein großer Personenkreis, dem das vorliegende Lehrbuch »Testtheorie und Fragebogenkonstruktion« von Nutzen sein kann. In der Zielgruppe befinden sich zum einen die Test- und Fragebogenkonstrukteure, für die der »State of the Art« von Planung, Entwicklung, Erprobung, Analyse und Dokumentation von Tests und Fragebogen beschrieben wird. Zum anderen sind es auch die zahlreichen Test- und Fragebogenanwender, die vor der Aufgabe stehen, aus verschiedenen am Markt befindlichen Test- und Fragebogen eine qualifizierte, begründete Auswahl zu treffen, die Verfahren sachkundig zum Einsatz zu bringen, die Testwerte kompetent zu interpretieren und aus den Ergebnissen angemessene Schlussfolgerungen zu ziehen. Insbesondere auch für diese Zielgruppe wurde das Buch als praktisches Nachschlagewerk konzipiert.
Helfried Moosbrugger, Augustin Kelava

Grundlagen

Frontmatter
2. Qualitätsanforderungen an einen psychologischen Test (Testgütekriterien)
Zusammenfassung
Wenn man mit der Frage konfrontiert wird, worin der eigentliche Unterschied zwischen einem unwissenschaftlichen »Test« (etwa einer Fragensammlung) und einem wissenschaftlich fundierten, psychologischen Test besteht, so ist die Antwort darin zu sehen, dass sich ein psychologischer Test dadurch unterscheidet, dass er hinsichtlich der Erfüllung der sog. Testgütekriterien empirisch überprüft wurde.
Helfried Moosbrugger, Augustin Kelava
3. Planung und Entwicklung von Tests und Fragebogen
Zusammenfassung
Dieses Kapitel bietet einen Überblick über den Prozess der Entstehung eines Tests oder Fragebogens, angefangen von der ersten Testplanung, über die Testentwicklung bis hin zur Erstellung und einer vorläufigen Erprobung der Testvorversion mit dem Ziel der Revision zur endgültigen Version. Es soll verdeutlichen, welche Aspekte bei der Konstruktion eines Testverfahrens zu berücksichtigen sind und dass ein psychometrischer Test mehr ist als eine Ansammlung von Aufgaben oder Fragen. Der Unterschied besteht darin, dass psychometrische Tests psychische Merkmale quantitativ auf der Basis von Testtheorien erfassen und somit eine metrisch vergleichende Diagnostik ermöglichen.
Ewa Jonkisz, Helfried Moosbrugger, Holger Brandt
4. Deskriptivstatistische Evaluation von Items (Itemanalyse) und Testwertverteilungen
Zusammenfassung
Nachdem die Planungs- und Entwicklungsphase eines psychologischen Tests oder Fragebogens (vgl. Jonkisz, Moosbrugger & Brandt 2011, ► Kap. 3 in diesem Band) abgeschlossen ist, besteht der nächste Schritt darin, die Items an einer für die Zielgruppe möglichst repräsentativen Stichprobe einer deskriptivstatistischen Evaluation zu unterziehen. Erst nach diesen unter dem Namen »Itemanalyse« zusammengefassten Untersuchungsschritten können wir eine tragfähige Testfassung erstellen.
Augustin Kelava, Helfried Moosbrugger
5. Klassische Testtheorie (KTT)
Zusammenfassung
Die »Klassische Testtheorie« (KTT) stellt jenen theoretischen Hintergrund zur Konstruktion und Interpretation von Testverfahren dar, der als theoretische Basis vieler auf dem Markt befindlicher psychodiagnostischer Tests gegenwärtig sehr wichtig ist.
Helfried Moosbrugger
6. Methoden der Reliabilitätsbestimmung
Zusammenfassung
Angenommen, Sie sollen bei einer schulpsychologischen Begutachtung entscheiden, ob ein Kind am Unterricht einer normalen Klasse teilnehmen kann oder Sonderunterricht für Lernbehinderte erhalten soll. Wenn Sie hierfür einen Intelligenztest durchführen, sollten Sie sich darauf verlassen können, dass das Testergebnis messgenau ist, d. h. dass es die »wahre« Leistungsfähigkeit operationalisiert am IQ möglichst genau widerspiegelt und nicht bei einer Testwiederholung kurze Zeit später ein deutlich anderes Ergebnis herauskäme − die Entscheidung hat schließlich zentrale Bedeutung für die Zukunft des Kindes. Messgenauigkeit ist insofern ein ausgesprochen wichtiges Gütekriterium für Tests, gerade bei der Individualdiagnostik.
Karin Schermelleh-Engel, Christina S. Werner
7. Validität
Zusammenfassung
Das Gütekriterium der Validität (vom englischen validity, »Gültigkeit«) wird häufig zusammengefasst als das Ausmaß, in dem ein Test »misst, was er zu messen vorgibt«, »misst, was er messen soll« oder schlicht »den Job tut, für den er entwickelt wurde«. Diese vereinfachenden Zusammenfassungen drücken aus, dass Validität ein umfassendes und sehr wichtiges Gütekriterium zur Beurteilung eines diagnostischen Verfahrens darstellt. Die Validität ist als den Gütekriterien der Objektivität und Reliabilität übergeordnet anzusehen: Wenn ein Test nicht »gültig« ist, weil er zum Beispiel etwas anderes erfasst, als er sollte, sind Objektivität oder Reliabilität nicht mehr von Belang. Validität ist jedoch auch das komplexeste und am schwierigsten zu bestimmende Gütekriterium.
Johannes Hartig, Andreas Frey, Nina Jude
8. Interpretation von Testresultaten und Testeichung
Zusammenfassung
Wendet man einen psychologischen Test an, so erhält man in der Regel ein numerisches Testresultat, das Auskunft über die Merkmalsausprägung der Testperson geben soll. Fragt man sich, was dieser Testwert hinsichtlich der Merkmalsausprägung aussagt, dann lässt sich diese Frage in zweierlei Weise sinnvoll beantworten: einerseits dadurch, dass der Testwert durch den Vergleich mit den Testwerten einer Bezugsgruppe interpretiert wird (nor­morientierte Interpretation), oder andererseits, dass eine genaue theoretische Vorstellung darüber besteht, wie der erzielte Testwert mit einem inhaltlichpsychologisch definierten Kriterium in Beziehung steht (kriteriumsorientierte Interpretation).
Frank Goldhammer, Johannes Hartig
9. Standards für psychologisches Testen
Zusammenfassung
Standards für psychologisches Testen beziehen sich auf verschiedene Bereiche des Testens, z.B. auf die Entwicklung und Evaluation (Testkonstruktion), auf die Übersetzung und Anpassung (Testadaptation), auf die Durchführung, Auswertung und Interpretation (Testanwendung) sowie auf die Überprufung der Einhaltung der Standards bei der Testentwicklung und -evaluation (Qualitätsbeurteilung) psychologischer Tests. Teststandards zielen in den genannten Phasen bzw. Bereichen auf größtmögliche Optimierung und wollen dazu beitragen, dass die im Rahmen psychologischen Testens getroffenen Aussagen mit hoher Wahrscheinlichkeit zutreffen.
Helfried Moosbrugger, Volkmar Höfling

Erweiterungen

Frontmatter
10. Item-Response-Theorie (IRT)
Zusammenfassung
Entgegen einer oft zu hörenden Auffassung ist die Item-Response-Theorie (IRT (Lord, 1980; Hambleton & Swaminathan, 1985; Fischer, 1996) nicht als Alternative zur Klassischen Testtheorie (KTT) (s. Moosbrugger, 2011a, ► Kap. 5 in diesem Band) aufzufassen, sondern besser als Ergänzung. Der KTT sind große Verdienste in der Psychodiagnostik zuzuschreiben: Mit ihrer Hilfe ist es möglich, auf Basis der Reaktionen in mehreren Items die wahre Ausprägung (»true score«) des zu erfassenden Merkmals zu schätzen und die Messgenauigkeit des Testergebnisses (Reliablilität, s. Schermelleh-Engel & Werner, 2011, ► Kap. 6 in diesem Band) zu bestimmen. Mit Hilfe der Reliabilität bzw. des Standardmessfehlers ist es darüber hinaus moglich, ein Konfidenzintervall für den »true score« anzugeben.
Helfried Moosbrugger
11. Adaptives Testen
Zusammenfassung
Bei den meisten Fragebogen- und Testverfahren wird allen Probanden eine festgelegte Menge von Items in einer festen Reihenfolge vorgegeben. Beim adaptiven Testen werden abweichend davon aufgrund des Antwortvehaltens des untersuchten Probanden nur solche Items zur Bearbeitung vorgelegt, die möglichst viel diagnostische Information über die individuelle Ausprägung des zu messenden Merkmals liefern.
Andreas Frey
12. Latent-Class-Analysis
Zusammenfassung
Personen unterscheiden sich hinsichtlich einer Vielzahl von Eigenschaften, zum Beispiel ihres Geschlechts, ihrer Körpergröße, oder ihres Temperaments: Manche Menschen sind eher extravertiert, andere eher introvertiert. Solche Personvariablen sind zum einen entweder direkt beobachtbar (Geschlecht, Körpergröße) oder nur indirekt über Indikatorvariablen zu erschließen (Extraversion bzw. Introversion). Zum anderen sind Personvariablen entweder dimensional oder kategorial definiert. Die Körpergröße z.B. ist eine dimensionale Personvariable: Je größer eine Person ist, desto höher ist ihr »Wert« auf dem jeweiligen Messinstrument (z.B. einem Zentimetermaß), wobei zwischen zwei Werten unendlich viele mögliche Werte liegen können. Das Geschlecht hingegen ist eine kategoriale Personvariable: Man ist entweder männlich oder weiblich. Im Falle kategorialer Variablen gibt es lediglich so viele Werte wie Kategorien; Zwischenwerte, d.h. graduelle Unterschiede zwischen Werten, gibt es hier nicht.
Mario Gollwitzer
13. Exploratorische (EFA) und Konfirmatorische Faktorenanalyse (CFA)
Zusammenfassung
Zur Konstruktvalidierung eines neu entwickelten Fragebogens oder Tests wird häufig entweder die exploratorische Faktorenanalyse oder die konfirmatorische Faktorenanalyse eingesetzt, um zu überprüfen, ob die Items hoch mit den Faktoren (Konstrukten, Dimensionen, Merkmalen) korrelieren, die mit Hilfe der Items gemessen werden sollen.
Helfried Moosbrugger, Karin Schermelleh-Engel
14. Multitrait-Multimethod-Analysen
Zusammenfassung
Unter der Bezeichnung »Multitrait-Multimethod-Analyse« (MTMM-Analyse) wird eine Gruppe von Verfahren zum Nachweis der Konstruktvalidität eines Tests oder Fragebogens verstanden. Charakteristischer Weise wird für diesen Nachweis eine systematische Kombination von mehreren Traits (Merkmalen) mit mehreren Messmethoden vorgenommen.
Karin Schermelleh-Engel, Karl Schweizer
15. Latent-State-Trait-Theorie (LST-Theorie)
Zusammenfassung
In der psychologischen Diagnostik ist man einerseits daran interessiert, stabile Merkmale zu messen (Dispositionen wie z.B. Neurotizismus oder Extraversion), deren Ausprägung bei einer Person sich nicht von Situation zu Situation ändern sollte. Andererseits ist man aber auch daran interessiert, die Veränderung von Merkmalen zu erfassen, z.B. von Schmerzintensität oder Heiterkeit, welche situationsabhängig variieren können. Konsistente, d.h. zeitlich stabile Merkmale werden in diesem Zusammenhang meist als »Traits« bezeichnet, wohingegen inkonsistente, d.h. zeitlich instabile Merkmale, als »States« bezeichnet werden.
Augustin Kelava, Karin Schermelleh-Engel
16. Konvergente und diskriminante Validität über die Zeit: Integration von Multitrait- Multimethod-Modellen und der Latent-State-Trait-Theorie
Zusammenfassung
Psychologische Messungen unterliegen einer Vielzahl von Einflussen. Die Ausprägung der Êngstlichkeit von Schulkindern beispielsweise hängt nicht nur von ihrer dispositionellen Êngstlichkeit, sondern auch von situativen Einflüssen (die bekannt oder unbekannt sind) ab, wie z.B. dem gerade wütenden Sturm oder dem Albtraum der letzten Nacht. Außerdem fallen die Messungen je nach Messmethode, z.B. ob die Schüler sich selbst einschätzen oder ob sie von ihren Lehrern oder Eltern eingeschätzt werden, unterschiedlich aus. In vorangegangenen Kapiteln wurden bereits statistische Modelle beschrieben, die verschiedene Einflussfaktoren auf Messungen trennen und in ihrer Große messbar machen können. Schermelleh-Engel und Schweizer (2011, ► Kap. 14 in diesem Band) beschreiben Modelle, die den Einfluss verschiedener Messmethoden auf die Messergebnisse untersuchen. Diese Methoden beinhalten ganz unterschiedliche inhaltliche Aspekte. So können z.B. die Einflüsse verschiedener Fragebögen, unterschiedlicher Rater, unterschiedlicher Facetten eines Konstruktes oder verschiedener Messgelegenheiten mit den vorgestellten Multitrait-Multimethod- (MTMM-) Modellen analysiert werden. Werden verschiedene Messgelegenheiten analysiert, bieten sich daröber hinaus Modelle der Latent-State-Trait-Theorie (vgl. Kelava & Schermelleh- Engel, 2011, ► Kap. 15 in diesem Band; Steyer, 1987, 1989; Steyer, Ferring, & Schmitt, 1992) an. Diese Modelle teilen viele strukturelle Bestandteile mit den MTMM-Modellen mit latenten Variablen, entstammen jedoch einer eigenständigen Forschungstradition.
Fridtjof W. Nussbeck, Michael Eid, Christian Geiser, Delphine S. Courvoisier, David A. Cole
Backmatter
Metadaten
Titel
Testtheorie und Fragebogenkonstruktion
herausgegeben von
Univ.-Prof. Dr. Helfried Moosbrugger
Prof. Dr. Augustin Kelava
Copyright-Jahr
2012
Verlag
Springer Berlin Heidelberg
Electronic ISBN
978-3-642-20072-4
Print ISBN
978-3-642-20071-7
DOI
https://doi.org/10.1007/978-3-642-20072-4