Einleitung

Die Förderung einer wissenschaftlichen Grundbildung der breiten Öffentlichkeit, als eine zentrale Bedingung für individuelle Entscheidungs‑, Handlungs- und Diskursfähigkeit in modernen Gesellschaften, wird seit langem als ein zentrales Bildungsziel betrachtet (Fischer 1998; OECD 2013; Haupt und Hempelmann 2015). Die Vermittlung wissenschaftlicher Grundbildung in der Schule wird jedoch vereinzelt als unzureichend kritisiert (Gräber und Nentwig 2002; Euler und Weßnigk 2011), da u. a. wissenschaftspropädeutische Aufgaben, die Schülerinnen und Schüler im Unterrichtsalltag bearbeiten, selten den Kernmerkmalen echter wissenschaftlicher Arbeit entsprechen (Chinn und Malhotra 2002; Capps und Crawford 2013). Über solche „simple inquiry tasks“ (Chinn und Malhotra 2002) werden den Schülerinnen und Schülern im Unterricht nicht nur ein vereinfachtes Bild wissenschaftlicher Praktiken, sondern auch wenig elaborierte epistemologische Überzeugungen vermittelt (Bromme und Kienhues 2014). Um ein angemessenes Verständnis wissenschaftlicher Denk- und Arbeitsweisen aufzubauen und der Entstehung lernhinderlicher Überzeugungen entgegenzuwirken, ist vielmehr eine authentische Wissenschaftsvermittlung erforderlich (Bauer et al. 2017).

In den letzten zwei Jahrzehnten sind unterschiedliche Konzepte entstanden, die eine authentische Wissenschaftsvermittlung möglich machen sollen. Beispielsweise bieten Schülerlabore speziell für Schülerinnen und Schüler zugeschnittene Angebote im Sinne einer guten Ergänzung zum herkömmlichen Unterricht. Das zentrale Anliegen der Schülerlabore ist es, „Wissenschaft durch erfahrungsbasierte Zugänge erlebbar zu machen“ (Euler et al. 2015, S. 761) und wissenschaftliche Arbeitsweisen im Rahmen aktiver Auseinandersetzung mit dem Lerngegenstand zu vermitteln. Dabei wird die authentische Gestaltung der Lernumgebung nach konstruktivistischen Prinzipien als wesentlicher Vorteil gegenüber traditionellem Unterricht mit seinem tendenziell transmissiven Verständnis von Lernen gewertet (Euler und Weßnigk 2011; Euler et al. 2015). Scharfenberg und Bogner (2015) schreiben der Authentizität der Lernumgebung Schülerlabor sogar eine direkte Wirkung auf die Entwicklung des aktuellen Interesses (vgl. Krapp 2001) von Schülerinnen und Schülern zu.

In der Schülerlaborforschung besteht Einigkeit über die Bedeutung und die Notwendigkeit von authentischen Lernumgebungen für gelingende Wissenschaftsvermittlung und Interessenförderung. Diese programmatische Wirkung objektiv vorliegender Authentizität kann jedoch nur erfolgen, wenn die Lernumgebung Schülerlabor von den Schülerinnen und Schülern auch subjektiv als authentisch wissenschaftlich wahrgenommen wird (Sommer et al. 2018). Für empirische Untersuchungen von Zusammenhängen der Authentizität von Lernumgebungen mit Personenmerkmalen, wie Interesse oder Fachwissen, reicht es demzufolge nicht aus, die Authentizität von Lernumgebungen objektiv anzunehmen. Vielmehr bedarf es der Möglichkeit, die subjektive Wahrnehmung der Authentizität zu erfassen und mit Personenmerkmalen in Relation zu setzen (Gulikers et al. 2006; Betz 2018).

Derzeit liegt jedoch kein Instrument vor, das eine differenzierte Betrachtung von Authentizitätswahrnehmung in der Wissenschaftsvermittlung und damit die systematische Untersuchung der Zusammenhänge von subjektiv authentischen Lernumgebungen und Personenmerkmalen erlaubt. Aus diesem Grund gibt es bislang auch nur wenige empirische Studien, die die subjektive Wahrnehmung von Authentizität berücksichtigen. Da die Bedeutung von wahrgenommener Authentizität für die Gestaltung erfolgreicher Lehr-Lernkontexte jedoch einer weiteren empirischen Überprüfung bedarf (Sommer et al. 2018), leistet die theoriegeleitete Entwicklung und Validierung eines Fragebogens zur Messung von Authentizitätswahrnehmung dazu einen wichtigen Beitrag.

Theoretischer Hintergrund

Authentizität als Merkmal von Lernumgebungen

Die Definitionen von Authentizität als Merkmal einer Lernumgebung sind vielfältig. Scharfenberg und Bogner (2015) kritisieren gar das Fehlen einer allgemein anerkannten Definition dieses zentralen Merkmals konstruktivistischer Lernumgebungen.

In diesem Beitrag wird in Anlehnung an Honebein et al. (1993) unter Authentizität die Annäherung einer Lernsituation an reale Anwendungssituationen verstanden. Dabei kann Authentizität als Kontinuum betrachtet werden, das sich zwischen zwei Endpunkten bewegt. Dies ist zum einen die echte Anwendungssituation bzw. die Realität und zum anderen eine stark didaktisierte Lernumgebung bzw. eine stark vereinfachte Darstellung der Realität (Betz et al. 2016; s. a. Chinn und Malhotra 2002; Sommer et al. 2018).

Anker-Hansen und Andrée (2019) nehmen auf Grundlage eines systematischen Literaturreviews eine klare Differenzierung verschiedener Anwendungssituationen vor. Sie unterscheiden zwischen Anwendungssituationen, die für Schülerinnen und Schüler alltäglich und nützlich sind einerseits und Anwendungssituationen im professionellen Kontext andererseits. Mit Blick auf den professionellen bzw. beruflich-wissenschaftlichen Kontext gilt eine Lernumgebung als authentisch, wenn sie den Alltag und die Arbeitsweisen einer Wissenschaftlerin oder eines Wissenschaftlers realistisch abbildet und eine spezifische Komplexität aufweist, die sich u. a. aus einer hohen Informationsdichte in spezifischen Wissensbereichen und den vielfältigen Tätigkeitsbereichen im beruflichen Alltag ergibt (Lee und Songer 2003; van Vorst et al. 2015). Dem vorliegenden Beitrag liegt dieses letztere Verständnis von Authentizität im professionellen Kontext zugrunde und ist von der Anpassung einer Lernumgebung oder eines Lerninhalts an die alltägliche Lebenswelt der Schülerinnen und Schüler abzugrenzen.

Authentizität ist ein relationales Konzept (Honebein et al. 1993). Das bedeutet, dass die Authentizität eines Gegenstands bzw. einer Tätigkeit nur in Bezug auf dessen bzw. deren Ähnlichkeit zu etwas Anderem beurteilt werden kann. Dabei beeinflussen individuelle Repräsentationen des Vergleichsgegenstands die subjektive Wahrnehmung von Authentizität. In authentischen Lernsituationen (in unserem Sinne) werden beruflich-wissenschaftliche Kontexte inszeniert, um Schülerinnen und Schülern einen Einblick in diese Bereiche zu geben und darüber hinaus den Wissenstransfer zu fördern (Mandl et al. 1995). Die subjektive Wahrnehmung der Authentizität der Lernumgebung wird nun dadurch beeinflusst, welche individuellen Repräsentationen dieses beruflich-wissenschaftlichen Kontexts bei den einzelnen Schülerinnen und Schülern vorliegen, d. h. wie hoch der Grad der Vertrautheit mit diesem spezifischen beruflich-wissenschaftlichen Kontext ist (Habig et al. 2018).

Theoretische Modellierung von Authentizität der Wissenschaftsvermittlung

Bislang gibt es zahlreiche Ansätze, die Authentizität von Lernumgebungen inhaltlich genauer zu differenzieren. Trotz verschiedener Konzeptualisierungen besteht Konsens über die Mehrdimensionalität von Authentizität. Die Lernumgebung wird stets in verschiedene Bereiche klassifiziert, die mehr oder weniger authentisch sein können. So unterscheidet Scharfenberg (2005) im Kontext der Wissenschaftsvermittlung Lernorte, Vermittler, Materialien, Methoden sowie Probleme als verschiedene Dimensionen von Authentizität. Herrington und Herrington (2006) unterscheiden neun Charakteristika authentischer Lernumgebungen, die stärker die Aktivitäten der Schülerinnen und Schüler während des Lernens beschreiben, wie etwa Reflexion und gemeinsame Wissenskonstruktion. Das Modell der Authentizität der Wissenschaftsvermittlung (Betz et al. 2016) betrachtet Authentizität ebenfalls als mehrdimensionales Konstrukt. Es geht jedoch über die bloße Klassifikation von Merkmalen der Lernumgebung hinaus und bindet die Authentizität der Lernumgebung in ein Wirkungsmodell ein. Die subjektive Wahrnehmung von Authentizität steht im Zentrum dieses Wirkungsmodells, das im Folgenden vorgestellt werden soll.

Das mehrdimensionale Modell der Authentizität der Wissenschaftsvermittlung (Betz et al. 2016) beschreibt die Entwicklung eines subjektiven Authentizitätsempfindens auf der Grundlage von Authentisierungsprozessen, die durch die Interaktion von individuellen Personenmerkmalen und Merkmalen der Lernumgebung entstehen. Authentisierung bedeutet, dass die Schülerinnen und Schüler eine objektiv (mehr oder weniger) wissenschaftlich authentisch gestaltete Lernumgebung immer vor dem Hintergrund individueller Überzeugungen, Interessen, Fähigkeiten und Wissen wahrnehmen. Die daraus resultierende Wahrnehmung von Authentizität kann Effekte auf Interesse, Motivation, Überzeugungen sowie Wissen und Kompetenzen der Schülerinnen und Schüler haben (vgl. Abb. 1).

Abb. 1
figure 1

Modell der Authentizität der Wissenschaftsvermittlung (Betz et al. 2016) mit Ergänzungen (schraffierter Kasten) durch Nachtigall et al. (2018a)

Im Modell der Authentizität der Wissenschaftsvermittlung werden sieben Merkmale der Lernumgebung unterschieden, die einen Spielraum zur Gestaltung von objektiv authentischen Lernumgebungen bieten. Zu diesen Merkmalen zählen das Material, die Methoden, der Inhalt, der Innovationsgehalt, der Lernort, der Vermittler sowie soziale Interaktionen. Vereinzelte Studien deuten darauf hin, dass bspw. authentische Materialien einen positiven Effekt auf das Interesse (Peacock 1997) und epistemologische Überzeugungen (Mierwald et al. 2018) von Schülerinnen und Schülern haben können. Auch die Variation des Lernorts (Schülerlabor vs. Schule) zeigt bei Schülerinnen und Schülern eine unterschiedlich stark ausgeprägte Wahrnehmung von Authentizität zugunsten des Schülerlabors, die die Entwicklung von situationalem Interesse beeinflusst (Betz 2018; Schüttler et al. 2021). Um die positiven Wirkungen authentischer Lernumgebungen wie eine Förderung von domänenspezifischen Kompetenzen oder die Förderung von für den Lernerfolg relevanten Variablen wie Motivation und Interesse (Mandl et al. 1995; Betz et al. 2016) zu entfalten, reicht eine objektiv authentisch gestaltete Lernumgebung jedoch nicht aus. Die Authentizität der Lernumgebung muss von den Schülerinnen und Schülern als solche wahrgenommen werden (vgl. Relationalität der Authentizität). Personenmerkmale, wie das Geschlecht, das Alter oder epistemologische Überzeugungen, sind die Grundlage für eine individuelle Empfänglichkeit gegenüber der Lernumgebung. So haben Schülerinnen und Schüler womöglich eine stereotype Vorstellung von Wissenschaft (vgl. Hagenkötter et al. 2021), die die Wahrnehmung von Authentizität beeinflusst. Zentral bleibt die Frage, ob und in welchem Ausmaß die Schülerinnen und Schüler die Situation bzw. die Lernumgebung als authentisch, d. h. als echte Wissenschaft, wahrnehmen. Durch die Fokussierung auf die subjektive Wahrnehmung von Authentizität kann die Wirkung der didaktischen Überlegungen überprüft werden. Werden Fehlkonzepte bei den Schülerinnen und Schülern deutlich, ist dies bspw. ein Zeichen für Aufklärungsbedarf über tatsächliche Wissenschaftspraktiken. Aus den Annahmen des Wirkungsmodells folgt insgesamt, dass die subjektive Wahrnehmung von Authentizität und die auf sie wirkenden Faktoren zukünftig stärker in den Blick genommen werden müssen. Zudem sind die objektive Authentizität einer Lernumgebung genauso wie ihre subjektive Wahrnehmung – in Übereinstimmung mit bisherigen Konzeptualisierungen – als mehrdimensionale Konstrukte zu betrachten.

Im Rahmen einer empirischen Überprüfung des Modells haben Nachtigall et al. (2018a) eine Adaptation vorgenommen (Abb. 1, schraffierter Kasten links). Nicht nur die individuellen Personenmerkmale, wie z. B. Vorwissen und Erfahrungen der Schülerinnen und Schüler, sind domänenspezifisch, sondern auch die Merkmale der Lernumgebung. In den vielfältigen Fachgebieten können die verschiedenen Gestaltungsmerkmale der Lernumgebung einen unterschiedlich starken Einfluss auf die Wahrnehmung von Authentizität haben. Durch die spezifische Gestaltung einer Laborumgebung in naturwissenschaftlichen Projekten könnte bspw. der Ort den größten Einfluss auf die Wahrnehmung der Authentizität ausüben. Es ist bisher jedoch nicht geklärt, ob in den verschiedenen Domänen bestimmte Gestaltungsmerkmale eine stärkere Rolle in der Wahrnehmung von Authentizität einnehmen als andere. Durch die Entwicklung eines Instruments, das die Wahrnehmung von Authentizität mehrdimensional erhebt, kann in zukünftiger Forschung unter der Berücksichtigung möglicher Interaktionen von Gestaltungs- und Personenmerkmalen u. a. der Frage nach der Einflussgröße der einzelnen Merkmale in unterschiedlichen Domänen nachgegangen werden.

Messung von Authentizitätswahrnehmung in Schülerlaboren

In Studien, die die programmatische Wirkung von Schülerlaboren auf Personenmerkmale der Schülerinnen und Schüler, wie etwa Interesse, Motivation und Fachwissen, systematisch untersuchen (Brandt 2005; Scharfenberg 2005; Guderian 2007; Brandt et al. 2008; Itzek-Greulich et al. 2015, 2017), wird die Authentizität der Schülerlabore zunehmend als wichtige unabhängige Variable betrachtet, die die Wirkung des Schülerlabors auf Personenmerkmale der Schülerinnen und Schüler maßgeblich beeinflussen kann (Engeln 2004; Pawek 2009; Damerau 2012; Betz 2018; Mierwald et al. 2018; Schüttler et al. 2021). In diesen Studien wird eine Messung der subjektiven Authentizitätswahrnehmung durchgeführt, da sich aus der Relationalität des Authentizitätskonstrukts (Honebein et al. 1993) die Notwendigkeit zur Messung subjektiv wahrgenommener Authentizität ableiten lässt.

Tab. 1 fasst zentrale Merkmale bisheriger Instrumente zur Messung von Authentizitätswahrnehmung zusammen. Eine erste Operationalisierung stammt von Engeln (2004), die Authentizität als eindimensionales Konstrukt versteht. In den Untersuchungen von Glowinski (2007), Pawek (2009) und Damerau (2012) wird Authentizität ebenfalls als eindimensionales Konstrukt erfasst. Charakteristisch für die Untersuchungen von Nachtigall et al. (2018b), Betz (2018) sowie Schüttler et al. (2021) ist, dass Authentizität der Wissenschaftsvermittlung genauer differenziert wird und sich der Umfang der Messinstrumente z. T. deutlich erhöht. Nachtigall et al. (2018b) sowie Schüttler et al. (2021) fokussieren aber lediglich einzelne Facetten von authentischen Lernumgebungen. Betz (2018) entwickelt die Items des Messinstruments zwar gemäß des Modells der Authentizität der Wissenschaftsvermittlung (Betz et al. 2016), fasst die Items der vielfältigen Dimensionen jedoch zu nicht mehr als zwei Subskalen zusammen.

Tab. 1 Übersicht bisheriger Messinstrumente zur Wahrnehmung von Authentizität der Wissenschaftsvermittlung

Erste Untersuchungen zur Rolle der Authentizität im Schülerlabor belegen – trotz unterschiedlicher und meist wenig ausdifferenzierter Operationalisierung des Authentizitätsbegriffs – kurzfristige Effekte subjektiv authentischer Lernumgebungen auf das Interesse, das Fähigkeitsselbstkonzept und epistemologische Überzeugungen von Schülerinnen und Schülern (Engeln 2004; Glowinski 2007; Pawek 2009; Damerau 2012; Betz 2018; Mierwald et al. 2018). Da bislang kein Instrument vorliegt, das eine mehrdimensionale und hinreichend umfassende Betrachtung von subjektiver Authentizitätswahrnehmung erlaubt, sind systematische Untersuchungen des Zusammenhangs von authentischen Lernumgebungen und Personenmerkmalen in der Wissenschaftsvermittlung kaum zu finden (Schüttler et al. 2021). Um diese Lücke zu schließen, ist es das Ziel der vorliegenden Arbeit, einen mehrdimensionalen Fragebogen zur Erfassung der Wahrnehmung von Authentizität in der Wissenschaftsvermittlung (FEWAW) zu entwickeln und seine psychometrische Qualität zu evaluieren. Dadurch sollen weitere empirische Überprüfungen der Wirkungszusammenhänge von objektiver Authentizität der Wissenschaftsvermittlung, subjektiver Authentizitätswahrnehmung und Personenmerkmalen, wie Interesse oder Fachwissen, in Lehr-Lernkontexten möglich werden (Sommer et al. 2018).

Entwicklung eines Testinstruments zur Messung subjektiver Authentizitätswahrnehmung

Betz et al. (2016) haben mit dem Modell der Authentizität der Wissenschaftsvermittlung bereits einen wichtigen Beitrag zur konzeptionellen Ausdifferenzierung des Begriffs der Authentizität geleistet und die Grundlage für eine angemessene Operationalisierung des Konstrukts geschaffen. Dieses Modell stellt die theoretische Grundlage für die Entwicklung des Fragebogens zur Erfassung der Wahrnehmung von Authentizität in der Wissenschaftsvermittlung (FEWAW) dar.

Differenzierung der Subdimensionen

Das Konstrukt Authentizitätswahrnehmung in der Wissenschaftsvermittlung wird über fünf Dimensionen operationalisiert, denen im Kontext des Schülerlabors eine besonders zentrale Rolle zukommt. Unabhängig von den unterschiedlichen Kategorien, in die Schülerlabore eingeordnet werden können (z. B. klassisches Schülerlabor oder Schülerlabor mit Berufsorientierung), heben bereits Haupt und Kollegen (2013) die Bedeutung des Orts bei diesen außerschulischen Lernangeboten hervor. Außerdem werden Material, Methode sowie Vermittler zu den allgemeinen Schülerlabor-Kriterien gezählt. Auch Mierwald (2020) macht auf die zentrale Rolle von fachspezifischen Materialen im Schülerlabor aufmerksam. Scharfenberg (2005) betrachtet Authentizität im Kontext der Wissenschaftsvermittlung ebenfalls als mehrdimensionales Konstrukt und differenziert authentische Lernorte, Vermittler, Materialien und Methoden sowie authentische Probleme. Authentizität wird erzielt durch die Bearbeitung realer Probleme, mit denen Wissenschaftlerinnen und Wissenschaftler konfrontiert sind (Edelson et al. 1999), unter Einbezug angemessener wissenschaftlicher Methoden (Lee und Songer 2003).

Vor diesem Hintergrund werden im FEWAW die folgenden Dimensionen differenziert: Ort, Vermittler, Material, Methode und Innovation (im Sinne von wissenschaftlich authentischen Problemen). Die Itemformulierungen ergeben sich über alle Dimensionen hinweg aus dem Verständnis von Authentizität als Kontinuum mit den Endpunkten stark didaktisiert versus real. Die Items bilden einen dieser Endpunkte des Kontinuums ab (besonders starke Annäherung der Lernumgebung an die beruflich-wissenschaftliche Realität), zu denen die Schülerinnen und Schüler Zustimmung oder Ablehnung äußern können. Die Einschätzung dieser objektiven Merkmale der Lernumgebung durch die Schülerinnen und Schüler gibt Aufschluss über die subjektive Wahrnehmung der Authentizität. Die Items sind insofern offen formuliert, als dass sie stereotype Vorstellungen von Schülerinnen und Schülern über Wissenschaft und wissenschaftliches Personal (Hagenkötter et al. 2021) nicht direkt adressieren. Gleichwohl kann die subjektive Wahrnehmung der Situation, die erfasst wird, von Stereotypen geprägt sein (vgl. Fehlkonzepte von Wissenschaft). Die Itemformulierungen basieren auf den folgenden Definitionen:

Ort

Der Ort bildet den das Lernsetting räumlich umgebenden Rahmen. Es wird abgebildet, wie authentisch die besuchten Gebäude, Räume und Orte durch die Schülerinnen und Schüler wahrgenommen werden. Dazu zählen auch Orte außerhalb eines Schülerlabors, wie ein Botanischer Garten, eine Ausgrabungsstätte oder ein Forschungsschiff. Als authentisch gilt ein Ort dann, wenn er hauptsächlich für wissenschaftliche Zwecke hergerichtet und ausgestattet wurde und wenn dort Forschung betrieben wird oder zumindest werden kann (Sommer et al. 2020). Instrumente und Materialien (wie z. B. nicht genutzte Bücher in einer Bibliothek oder nicht genutzte Messinstrumente) tragen zur wissenschaftlichen Ausstattung eines Raumes bei.

Vermittler

Vermittler sind Personen, die die Rolle der Lehrenden übernehmen. Diese Dimension bildet ab, wie authentisch diese Personen durch die Schülerinnen und Schüler wahrgenommen werden. Als authentisch gelten Vermittler dann, wenn sie in ihrem beruflichen Alltag als Wissenschaftlerin oder Wissenschaftler agieren und durch ihre Person einen direkten Zugang zur wissenschaftlichen Forschung der jeweiligen Disziplin herstellen. Euler und Weßnigk (2011) weisen in diesem Zusammenhang auf die Bedeutsamkeit von Rollenmodellen hin.

Material

Diese Dimension bildet ab, wie authentisch das eingesetzte Material durch die Schülerinnen und Schüler wahrgenommen wird. Als authentisch gilt ein Material dann, wenn es nicht (oder nur sehr wenig) didaktisch aufbereitet ist (Sommer et al. 2018). Unter Materialien werden alle Dinge verstanden, mit denen Schülerinnen und Schüler arbeiten, mit Ausnahme der Instruktionsmaterialien und Anleitungen. Dazu gehören zum einen alle Untersuchungsgegenstände, wie z. B. Substanzen, Bodenproben, Originaltexte oder Zeitzeugeninterviews. Zum anderen fallen darunter auch Geräte und Instrumente, mit denen etwas untersucht wird, wie z. B. Mikroskope, Indikatorlösungen oder Papier und Bleistift.

Methode

Frage- bzw. Problemstellungen können mit spezifischen wissenschaftlichen Methoden bearbeitet werden. Entsprechend bildet diese Dimension ab, wie wissenschaftlich die Schülerinnen und Schüler ihr Arbeiten und Vorgehen wahrnehmen. Wenngleich innerhalb wissenschaftlicher Disziplinen ein Methodenpluralismus besteht, wird im Rahmen von Schülerlaborbesuchen in den meisten Fällen auf nur eine dieser wissenschaftlichen Methoden fokussiert. Als authentisch gilt eine Methode dann, wenn sie einem wissenschaftlichen Vorgehen der jeweiligen Disziplin entspricht. Dazu gehört auch die Frage, wie groß das Ausmaß der Teilnahme am systematischen Prozess der Erkenntnisgewinnung ist.

Innovation

Die Innovation beschreibt die Aktualität der Forschungsfrage bzw. der Problemstellung, die bearbeitet wird. Als authentisch gilt eine Fragestellung dann, wenn sie in real bedeutsame Themenfelder aktueller Forschung eingebettet ist und Schülerinnen und Schüler durch ihre Forschungsergebnisse einen eigenen Beitrag zu deren Lösung leisten können. Durch die Beantwortung einer innovativen, neuartigen Forschungsfrage entsteht ein tatsächlicher Erkenntnisgewinn für die jeweilige Disziplin und nicht nur für die Schülerin oder den Schüler selbst (Sommer et al. 2020). Je zentraler im Projekt die Erforschung von etwas Neuem ist und bestehende wissenschaftliche Erkenntnisse nicht nur rezipiert bzw. repliziert werden, desto innovativer ist der dargebotene Inhalt.

Pilotierung und Überarbeitung

Um die Verständlichkeit der Items und deren Passung zu den theoretisch hergeleiteten Dimensionen empirisch zu prüfen, wurde eine erste Version des FEWAW mit 17 Items und fünfstufiger Likert-Skala (1 = völlig falsch bis 5 = völlig richtig) entwickelt und pilotiert. Im Rahmen einer Expertenbefragung sind neun Expertinnen und ExpertenFootnote 1 aufgefordert worden, die einzelnen Items den übergeordneten Dimensionen zuzuordnen. Diese Expertenbefragung erzielte eine hohe ÜbereinstimmungFootnote 2 und kann – über die theoriegeleitete Konstruktion des Fragebogens und seiner Dimensionen hinaus – als Hinweis auf Inhaltsvalidität gewertet werden (Jenßen et al. 2015). Im Rahmen der darauffolgenden Pilotierung des FEWAW an einer Stichprobe von 288 Schülerinnen und Schülern im naturwissenschaftlichen Schülerlabor (Alter M = 15,39, SD = 2,69; Anteil weiblich 50,4 %) konnte nach Ausschluss einzelner Items eine mehrfaktorielle Struktur mittels konfirmatorischer Faktorenanalyse bestätigt werden (χ2 = 48,32, df = 43, CFI = 0,987, TLI = 0,979, RMSEA = 0,034, SRMR = 0,028). Die Subskala Innovation wies mit α = 0,29 keine hinreichende interne Konsistenz auf, was eine Überarbeitung der Items erforderte. Die internen Konsistenzen der übrigen Subskalen waren zufriedenstellend (Cronbachs α ≥ 0,73). Um parallel erste Hinweise auf die Konstruktvalidität der Subskala Ort zu ermitteln, wurde eine quasi-experimentelle Feldstudie durchgeführt, die nur den Lernort variierte (Schule/Schülerlabor). Wie erwartet, war die Authentizitätswahrnehmung in Bezug auf das Gestaltungsmerkmal Ort im Schülerlabor (M = 3,94, SD = 1,00) signifikant höher als in der Schule (M = 2,73, SD = 1,25), F (1, 352) = 101,78, p < 0,001, η2 = 0,224. Der große Effekt, den die Lernumgebung im naturwissenschaftlichen Schülerlabor auf die Authentizitätswahrnehmung bzgl. des Orts hat, ist ein erster Validitätshinweis für diese Subskala.

Methode

Stichprobe

Zwischen März und November 2020 wurden in der Hauptstudie 19 Klassen unmittelbar nach ihrem Besuch im Alfried Krupp-Schülerlabor an der Ruhr-Universität Bochum befragt. An der Befragung nahmen Projekte aus acht verschiedenen Fächern teil (Anteil naturwissenschaftlich 82,5 %). Insgesamt haben an der freiwilligen Befragung 337 Schülerinnen und Schüler (Alter M = 16,61, SD = 1,63; Anteil weiblich 52,2 %) von vier unterschiedlichen Schulformen teilgenommen.

Instrumente

Erfassung von Authentizität in der Wissenschaftsvermittlung

Die Items des FEWAW (detaillierte Darstellung in Tab. 3 im Ergebnisteil) können auf einer fünfstufigen Skala von 1 = völlig falsch bis 5 = völlig richtig bewertet werden. Für den FEWAW lautet die Instruktion: „Die folgenden Aussagen beziehen sich auf das Projekt, an dem du teilgenommen hast. Bitte bewerte, ob die folgenden Aussagen bezogen auf das Projekt deiner Meinung nach richtig oder falsch sind. Kreuze bitte genau eines der fünf Kästchen an.“.

Erfassung von Außenkriterien zur Validierung

Neben dem Ziel, die angenommene Faktorenstruktur des FEWAW zu prüfen, sollen weitere Hinweise für die Konstruktvalidität des Messinstruments untersucht werden. Dazu werden mit der Statistiksoftware SPSS 26 theoretisch angenommene Zusammenhänge der Subskalen des FEWAW mit verschiedenen Außenkriterien empirisch geprüft (Tab. 2).

Tab. 2 Darstellung der externen Skalen zur Erhebung der konvergenten Außenkriterien

Zunächst erwarten wir, dass die Skala zur Erfassung von allgemeiner Authentizität (Damerau 2012) mit allen Subskalen des FEWAW eine positive Korrelation zeigt. Des Weiteren wird die Skala von Nachtigall et al. (2018b) eingesetzt, deren Verständnis von Authentizität sich darauf bezieht, „inwiefern die Aufgaben als passend für die Wissenschaftspraxis empfunden“ (S. 311) werden. Im Sinne von konvergenter bzw. diskriminanter Validität sollte diese Skala besonders hoch mit den Subskalen Methode und Material und weniger hoch mit den verbleibenden Subskalen des FEWAW korrelieren.

Weiterhin erwarten wir einen positiven Zusammenhang zwischen der Subskala Vermittler, die die Wahrnehmung der Projektleitung als echte Wissenschaftlerin bzw. als echter Wissenschaftler erfragt, und dem Ausmaß wahrgenommener Expertise der Projektleitung, gemessen mit einem adaptierten Fragebogen von Huber et al. (2009), da beide Skalen sinnverwandte Inhalte abfragen.

Zusätzlich werden zwei Skalen zur Erfassung epistemologischer Überzeugungen eingesetzt. Epistemologische Überzeugungen sind individuelle Annahmen über die Natur des Wissens sowie den Prozess des Wissenserwerbs (Hofer und Pintrich 1997; Mason 2010; Kremer und Kapitza 2020) und stellen eine individuelle Disposition dar, die die Empfänglichkeit der Lernenden für die gestaltete Lernumgebung beeinflusst (Schommer-Aikins und Hutter 2002; Mason 2010; Betz et al. 2016). Im Hinblick auf die ökonomische Umsetzbarkeit der gesamten Befragung wurde aus beiden Bereichen jeweils eine Skala eingesetzt. Die Skala Reflexivität des Wissens (Moschner und Gruber 2017) ist den Überzeugungen zur Natur des Wissens zuzuordnen und fragt individuelle Annahmen über die Veränderbarkeit des Wissens ab. Elaborierte Überzeugungen werden auf dieser Skala durch hohe Werte repräsentiert. Die Skala Herkunft des Wissens (Kremer 2010) ist den Überzeugungen zum Prozess des Wissenserwerbs zuzuordnen, wobei eine elaborierte Überzeugung durch niedrige Werte angezeigt wird. Da vor dem Hintergrund dieser individuellen Vorstellungen von Wissenschaft und wissenschaftlichen Prozessen die Authentizität der Schülerlabore subjektiv bewertet wird (vgl. Relationalität der Authentizität), nehmen wir die im Folgenden beschriebenen Zusammenhänge zwischen epistemologischen Überzeugungen und der Wahrnehmung von Authentizität an. Wir erwarten, dass die Subskala Innovation, die das Ausmaß der eigenen Beteiligung bei der Klärung einer wissenschaftlichen Forschungsfrage beschreibt, positiv mit elaborierten epistemologischen Überzeugungen zusammenhängt (positiver Zusammenhang mit der Skala Reflexivität des Wissens, negativer Zusammenhang mit der Skala Herkunft des Wissens). So schätzen Schülerinnen und Schüler den Innovationsgrad des Schülerlabors bspw. geringer ein, je fester sie der Überzeugung sind, dass sie selbst keine wissenschaftlichen Methoden anwenden oder neues Wissen generieren können.

Analysen zur Überprüfung des Messmodells

Zur Prüfung der faktoriellen Struktur des FEWAW werden konfirmatorische Faktorenanalysen in Mplus (Version 8; Muthén und Muthén 1998–2017) durchgeführt. Es werden zwei Modelle unterschiedlicher Komplexität spezifiziert und hinsichtlich ihrer Passung auf die Daten verglichen. Als erstes Modell wird ein einfaktorielles Modell getestet (Generalfaktormodell), da Authentizität in bisherigen Studien häufig als eindimensionales Konstrukt operationalisiert wurde. Um die Annahme zu prüfen, dass Authentizität vielmehr ein mehrdimensionales Konstrukt ist, wird außerdem das theoretisch angenommene fünffaktorielle Modell getestet, das auf dem Modell von Betz et al. (2016) basiert. Für die Beurteilung der Modellpassung werden verschiedene Maße herangezogen. Der χ2-Test sollte nicht als einziges Kriterium betrachtet werden, da er aufgrund seiner Sensitivität bei großen Stichproben nicht zuverlässig ist. Als Faustregel für eine gute Modellpassung gilt eher das Verhältnis von χ²/df ≤ 2 (Schermelleh-Engel und Moosbrugger 2003). Es werden außerdem der Root Mean Square Error of Approximation (RMSEA), das Standardized Root Mean Square Residual (SRMR), der Tucker-Lewis Index (TLI) und der Comparative Fit Index (CFI) herangezogen. Für RMSEA und SRMR gelten Werte unter 0,05 als Zeichen für eine gute Modellpassung und Werte zwischen 0,05 und 0,08 zeigen eine akzeptable Modellpassung an. Für TLI und CFI gelten Werte über 0,95 bzw. 0,97 als Zeichen für eine gute Modellpassung (Hu und Bentler 1999; Schermelleh-Engel und Moosbrugger 2003; Kline 2011). Des Weiteren wird Cronbachs Alpha als Maß der Reliabilität der einzelnen Subskalen bestimmt. Als Richtwert für eine hinreichend reliable Skala gilt ein Wert von α ≥ 0,80 (Gäde et al. 2020).

Der FEWAW soll entsprechend der breiten Zielgruppe von Schülerlaboren (vgl. Haupt 2015) über verschiedene Klassen hinweg genutzt werden. Deshalb wurden sowohl das Geschlecht (männlich/weiblich) als auch die Klassenstufe (Mittelstufe/Oberstufe) für die Messinvarianzprüfung ausgewählt. Die Einteilung der Variable Klassenstufe ist wie folgt: Klasse 7 bis 10 bilden die Mittelstufe und Klasse 11 bis 13 bilden die Oberstufe. Zur Überprüfung der Messinvarianz wird der step-up-Ansatz gewählt (Christ und Schlüter 2012). Das bedeutet, die Messinvarianz wird jeweils anhand zunehmend restriktiver Modelle mittels χ2-Differenztest in Mplus geprüft. Die getesteten Modelle umfassen die konfigurale Invarianz (gleiche Faktorenstruktur), die metrische Messinvarianz (invariante Faktorenstruktur und Faktorladungen) sowie die skalare Messinvarianz (invariante Faktorenstruktur, Faktorladungen und Itemintercepts), mit deren Vorliegen die Bedingung für die Berechnung von latenten Mittelwertunterschieden zwischen Gruppen erfüllt ist (Kleinke et al. 2017).

Die Betrachtung aller in die Analysen einfließenden Items des FEWAW und die Relation von leeren Datenfeldern zu allen Datenfeldern zeigt, dass fehlende Werte nur zu einem geringen Anteil vorliegen (<2 %). Die fehlenden Werte (Item-Nonresponse) in Bezug auf den FEWAW zeigen ein allgemeines Ausfallmuster und werden als ignorierbare Nichtantworten (missing at random) behandelt (Schafer und Graham 2002). Durch die Tatsache, dass ganze Klassenverbände an der Validierungsstudie teilgenommen haben, liegen kaum Unit-Nonresponses vor. Jedoch sind unterschiedliche Fragebogensets eingesetzt worden, was eine Reduktion der vorliegenden Daten bzgl. der Außenkriterien per Design bedingt. So wurden die Authentizität von Material und Aufgaben (Nachtigall et al. 2018b), die Expertise der Projektleitung (Huber et al. 2009) und Überzeugungen zur Reflexivität von Wissen (Moschner und Gruber 2017) nur in naturwissenschaftlichen Schülerlaborprojekten erhoben (vgl. Anmerkung zu Tab. 2). Da die Daten insgesamt eine Abweichung von der Normalverteilung zeigen, werden die Analysen in Mplus mit dem MLR-Schätzer durchgeführt, der bei Verletzungen der Normalverteilungsvoraussetzung empfohlen wird (Christ und Schlüter 2012).

Ergebnisse

Überprüfung des Messmodells

Die theoretisch angenommene Faktorenstruktur wurde mittels einer konfirmatorischen Faktorenanalyse geprüft. Bei der Überprüfung dieses fünffaktoriellen Modells ergab sich das Problem einer Missspezifikation (Korrelationen außerhalb des zulässigen Bereichs). Um das Problem zu identifizieren, ist außerplanmäßig eine explorative Faktorenanalyse durchgeführt worden. Das Ergebnis zeigt, dass nur vier der angenommenen fünf Faktoren extrahiert werden, bei der die Subskalen Material und Methode einen gemeinsamen Faktor bildeten (Tab. 3). Für diese vierfaktorielle Lösung ergab sich die Annäherung an eine Einfachstruktur, in der jedes Item substanziell auf dem zugehörigen Faktor lädt (λ ≥ 0,7), während die Nebenladungen nahezu alle gering sindFootnote 3. Da eingesetzte Materialien und Methoden sich in der Praxis durchaus gegenseitig bedingen können, ist eine Zusammenlegung beider Dimensionen auch inhaltlich gut begründbar. Aus diesem Grund wurde für die weiteren Berechnungen ein vierfaktorielles Modell spezifiziert, bei dem die beiden Subskalen Material und Methode zu einer Skala Vorgehen zusammengefasst sind. In Tab. 3 sind die Formulierungen der Items sowie die Itemstatistiken der finalen Fassung des FEWAW dargestellt.

Tab. 3 Itemformulierungen mit Itemmittelwerten, Standardabweichungen und Faktorladungen (λ) basierend auf den Ergebnissen der explorativen Faktorenanalyse

Für das vierfaktorielle Modell ergab sich die beste Modellpassung (siehe Tab. 4). Der χ2-Differenztest, für den eine Korrektur mit dem MLR-scaling correcting factor durchgeführt wurde (Satorra und Bentler 2010), bestätigte die signifikant bessere Passung des vierfaktoriellen Modells gegenüber eines Generalmodells (∆χ2 = 446,845; ∆df = 6; p < 0,001).

Tab. 4 Fitstatistiken der konfirmatorischen Faktoranalysen des FEWAW (N = 337)

Die Ergebnisse zur Überprüfung der Messinvarianz in Bezug auf das Geschlecht (52,2 % weiblich) und die Klassenstufe (22,9 % Mittelstufe) sind in Tab. 5 dargestellt.

Tab. 5 Statistiken zur Überprüfung der Messinvarianz in Bezug auf das Geschlecht und Klassenstufe sowie Modellvergleiche

Insgesamt wird in Bezug auf das Geschlecht die Annahme skalarer Messinvarianz gestützt, da sich für das restriktivere Modell 2 keine signifikant schlechtere Passung ergibt als für das Modell 1 (∆χ2 = 11,64; ∆df = 9; p = 0,235) und für Modell 3 keine schlechtere Passung als für Modell 2 (∆χ2 = 11,46; ∆df = 9; p = 0,246). Auch in Bezug auf die Klassenstufe stützen die Modellvergleiche von Modell 1 mit dem restriktiveren Modell 2 (∆χ2 = 13,50; ∆df = 9; p = 0,141) sowie von Modell 2 und 3 (∆χ2 = 7,09; ∆df = 9; p = 0,628) die Annahme von skalarer Invarianz. Die Überprüfung von Mittelwertsunterschieden in Bezug auf das Geschlecht zeigt, dass sich die Wahrnehmung von Authentizität zwischen Schülerinnen und Schülern lediglich in Bezug auf den Ort signifikant unterscheidet (Vorgehen: t (327) = −1,10, p = 0,272; Ort: t (328) = −2,38, p = 0,018; Vermittler: t (327) = 0,06, p = 0,949; Innovation: t (327) = 1,36, p = 0,175).

Überprüfung der Validität

Im Folgenden werden die latenten Korrelationen der Subskalen untereinander (Tab. 6) sowie die manifesten Korrelationen des FEWAW mit verschiedenen Außenkriterien dargestellt, die Aufschluss über die Konstruktvalidität des entwickelten Messinstruments geben können. Die Effektstärke der manifesten Korrelationen bewerten wir in Anlehnung an Döring und Bortz (2016). Es zeigt sich eine positive Korrelation zwischen Ort und Vermittler (r = 0,48), zwischen Ort und Vorgehen (r = 0,42) sowie Vorgehen und Vermittler (r = 0,43). Die Subskala Innovation zeigt nur bedingt einen Zusammenhang mit den anderen Subskalen, eine positive Korrelation ergibt sich zwischen Innovation und Vermittler (r = 0,21).

Tab. 6 Reliabilitäten (interne Konsistenzen), Skalenmittelwerte und Standardabweichungen sowie latente Korrelationen der Subskalen

Bei der Analyse der Zusammenhänge zwischen unterschiedlichen Außenkriterien und den Subskalen des FEWAW zeigen sich überwiegend positive Zusammenhänge (Tab. 7).

Tab. 7 Manifeste Korrelationen der Authentizitätsdimensionen mit Außenkriterien

Es bestehen erwartungskonforme, positive Zusammenhänge zwischen den einzelnen Subskalen des FEWAW und der wahrgenommenen allgemeinen Authentizität des Schülerlabors. Dabei sind die Zusammenhänge mit Vermittler (r = 0,53, p < 0,001) und Vorgehen (r = 0,67, p < 0,001) hoch, mit Ort zeigt sich eine mittlere (r = 0,44, p < 0,001) und mit Innovation eine schwache Korrelation (r = 0,18, p = 0,005). Die Skala Authentizität der Aufgaben zeigt erwartungskonform einen besonders starken Zusammenhang mit der Subskala Vorgehen (r = 0,54, p < 0,001). Die Korrelationen mit den übrigen Subskalen Ort (r = 0,37, p < 0,001), Vermittler (r = 0,42, p < 0,001) und Innovation (r = 0,25, p < 0,001) fallen hingegen geringer aus. Die Skala Expertise der Projektleitung zeigt mit einer mittleren positiven Korrelation (r = 0,33, p < 0,001) erwartungsgemäß den stärksten Zusammenhang mit der Subskala Vermittler. Es zeigen sich schwache positive Zusammenhänge mit Ort (r = 0,27, p < 0,001) und Vorgehen (r = 0,21, p = 0,003). Die epistemologischen Überzeugungen zur Herkunft des Wissens zeigen erwartungswidrig einen schwachen positiven Zusammenhang mit Innovation (r = 0,26, p < 0,001) und einen schwachen negativen Zusammenhang mit Ort (r = −0,13, p = 0,024). Die Skala zur Reflexivität des Wissens steht in einem schwachen negativen Zusammenhang zur Innovation (r = −0,20, p = 0,002), während mittlere positive Korrelationen mit Ort (r = 0,36, p < 0,001) und Vorgehen (r = 0,44, p < 0,001) sowie ein schwacher Zusammenhang mit Vermittler (r = 0,23, p < 0,001) bestehen.

Diskussion

Das Ziel der vorliegenden Studie war die Entwicklung eines Fragebogens, der die Wahrnehmung von Authentizität in der Wissenschaftsvermittlung mehrdimensional erfasst, um dem Gegensatz zwischen der vielfach betonten Bedeutsamkeit der Authentizität in Lehr-Lernkontexten (Euler et al. 2015) und ihrer tendenziell wenig ausdifferenzierten Erfassung zu begegnen. Der FEWAW wurde theoriebasiert entwickelt und beruht auf dem Modell der Authentizität der Wissenschaftsvermittlung (Betz et al. 2016), welches verschiedene Merkmale der Lernumgebung unterscheidet, die einen Spielraum zur Gestaltung von objektiv authentischen Lernumgebungen bieten. Gemäß der Differenzierung von Anker-Hansen und Andrée (2019) wurde der Begriff Authentizität in dieser Studie mit Bezug auf den professionellen, beruflich-wissenschaftlichen Kontext verstanden. Zur Überprüfung der psychometrischen Qualität des Messinstruments gehörte nicht nur die Prüfung der angenommenen Faktorenstruktur mittels konfirmatorischer Faktorenanalyse, sondern auch die Überprüfung von Messinvarianz sowie die Prüfung von Zusammenhängen mit unterschiedlichen Außenkriterien als Hinweis auf die Konstruktvalidität des Instruments.

Messmodell

Die Ergebnisse der vorliegenden Validierungsstudie schließen an theoretische Überlegungen zur Wahrnehmung von Authentizität an. Die Analysen zur Überprüfung des Messmodells zeigen eine signifikant bessere Passung des mehrdimensionalen Messmodells. Damit kann die Grundannahme des theoretischen Modells (Betz et al. 2016), das Authentizität als mehrdimensionales Konstrukt versteht, empirisch bestätigt werden. Der FEWAW, der die Wahrnehmung der Authentizität in der Wissenschaftsvermittlung misst, beinhaltet die vier Subdimensionen Ort, Vermittler, Vorgehen und Innovation, die mit Reliabilitäten von 0,81 ≤ α ≤ 0,87 gute Werte aufweisen (Gäde et al. 2020). Auch die messfehlerfreien Korrelationen der Subdimensionen untereinander (r ≤ 0,48) zeigen, dass die einzelnen Dimensionen empirisch gut voneinander trennbar sind. Die Subskala Vorgehen entstand aus einer Zusammenlegung der Skalen Material und Methode. Das zunächst angenommene fünffaktorielle Modell, bei dem die Subskalen Material und Methode getrennt voneinander bestehen, musste im Rahmen der vorliegenden Untersuchung verworfen werden. Damit können auch die theoretischen Annahmen mit Blick auf die Differenzierung von Material und Methode (Betz et al. 2016) empirisch nicht bestätigt werden. Es ist möglich, dass sich die eingesetzten Materialien und angewandten Methoden in einem Schülerlaborprojekt zu einem gewissem Grad gegenseitig bedingen und die beiden Subdimensionen von Schülerinnen und Schülern deshalb nicht genau differenziert werden können. Bereits im Rahmen der Pilotierung zeigte sich, dass beide Subdimensionen hoch korrelieren und die Zusammenlegung beider Subskalen zu einer deutlichen Verbesserung im Modellfit führt. Um das Ergebnis aus der Pilotierung abzusichern und den theoretischen Annahmen des Modells der Authentizität der Wissenschaftsvermittlung (Betz et al. 2016) zu folgen, sind im Rahmen der vorliegenden Untersuchung jedoch nochmals beide Skalen als eigenständige Dimensionen modelliert und geprüft worden. Zwischen den Subskalen Ort und Vorgehen zeigen sich in der Faktorenmatrix einer explorativen Faktorenanalyse jedoch hohe Nebenladungen. Dieses systematische Muster ergibt sich möglicherweise aus den Itemformulierungen, da Prozesse wissenschaftlichen Arbeitens und die Vorgehensweise „Forschen“ als beschreibendes Merkmal des Ortes genutzt werden („Ich war an einem Ort, an dem geforscht wird“). Zudem fragt die Subskala Vorgehen u. a. die wahrgenommene Authentizität der Materialien ab, die durchaus zur wissenschaftlichen Ausstattung eines Raumes bzw. Ortes beitragen können.

Neben der Überprüfung des Messmodells konnte in Bezug auf das Geschlecht und die Klassenstufe das Vorliegen skalarer Messinvarianz bestätigt werden, was eine wichtige Grundvoraussetzung für den Vergleich latenter Mittelwerte zwischen verschiedenen Gruppen ist (Christ und Schlüter 2012). Das Ergebnis, dass sich die Wahrnehmung von Authentizität zwischen Schülerinnen und Schülern lediglich in Bezug auf den Ort signifikant unterscheidet, steht größtenteils im Einklang mit bisherigen empirischen Befunden, die keinen Geschlechtsunterschied belegen (Engeln 2004; Damerau 2012). Die Abweichungen in Bezug auf die Wahrnehmung des Orts entstehen möglicherweise dadurch, dass bisherige Messinstrumente die Authentizität nicht differenziert erfasst haben.

Konstruktvalidität

Erste Hinweise auf konvergente Validität lieferten die positiven Zusammenhänge der Subskalen des FEWAW mit dem Fragebogen von Damerau (2012) zur eindimensionalen Erfassung allgemeiner Authentizität und dem Fragebogen von Nachtigall et al. (2018b) zur Erfassung der Authentizität von Materialien und Aufgaben. Die Formulierung der Items zur Erfassung der allgemeinen Authentizität kann dazu beigetragen haben, dass mit der Subskala Innovation nur ein schwacher Zusammenhang besteht. Um einen Einblick in die Wissenschaft erhalten zu können, ist es eventuell nicht notwendig, selbst aktiv zu sein und neues Wissen zu generieren. Der Ort oder dargebotene Materialien könnten für einen Einblick in den Arbeitsalltag einer Wissenschaftlerin bzw. eines Wissenschaftlers zentraler sein. Bisher ist die Frage nach der Gewichtung der einzelnen Merkmale authentischer Lernumgebungen ungeklärt (vgl. Nachtigall et al. 2018b). Es stehen weitere Untersuchungen aus, ob sich die Merkmale authentischer Lernumgebungen additiv summieren oder ob es ggf. eine zentrale Dimension gibt, die die Wahrnehmung der übrigen Dimensionen überlagert, sodass alle Dimensionen unabhängig von der tatsächlichen Ausgestaltung als authentisch wahrgenommen werden. Der positive Zusammenhang zwischen der Skala Expertise der Projektleitung (Huber et al. 2009) und der Subskala Vermittler zeigt sich erwartungskonform und kann ebenfalls als Hinweis auf die Konstruktvalidität des FEWAW gewertet werden.

Zudem sind Zusammenhänge des FEWAW mit epistemologischen Überzeugungen betrachtet worden. In der vorliegenden Untersuchung stehen die Überzeugungen zur Herkunft des Wissens (Kremer 2010) erwartungswidrig in einem positiven Zusammenhang mit der Innovation. Das bedeutet, dass Schülerinnen und Schüler mit tendenziell elaborierten Überzeugungen, die der Meinung sind, dass wissenschaftliches Wissen nicht nur durch Wissenschaftlerinnen und Wissenschaftler, sondern auch selbst erzeugt werden kann (Bromme und Kienhues 2014), den Innovationsgrad der Schülerlaborprojekte geringer einschätzen. Der schwache negative Zusammenhang zwischen Überzeugungen zur Herkunft des Wissens und der Subskala Ort bedeutet, dass Schülerinnen und Schüler, die selbst der Meinung sind, keine wissenschaftlichen Methoden anwenden zu können, das Schülerlabor auch nicht als einen Ort wahrnehmen, an dem echte Wissenschaft betrieben wird. Die Überzeugungen zur Reflexivität des Wissens (Moschner und Gruber 2017) stehen erwartungswidrig in einem negativen Zusammenhang zur Innovation, während positive Korrelationen mit den übrigen Subskalen bestehen. Auch hier schätzen Schülerinnen und Schüler mit tendenziell elaborierten Überzeugungen, die der Meinung sind, dass sich wissenschaftliches Wissen weiterentwickelt (Bromme und Kienhues 2014), die Innovation der Schülerlaborprojekte geringer ein. Auch wenn sich die Zusammenhänge zwischen der Skala Innovation und den epistemologischen Überzeugungen nicht in der erwarteten Richtung gezeigt haben, so bleibt das angenommene gegenläufige Muster der Korrelationen bestehen. Es zeigt sich insgesamt, dass die Innovation geringer bewertet wird, je elaborierter die Überzeugungen der Schülerinnen und Schüler sind. Unter der Annahme, dass das im Rahmen von Schülerlaborprojekten generierte Wissen meist nur für die Schülerinnen und Schüler selbst, nicht aber für die wissenschaftliche Gemeinschaft neu ist, erscheinen diese Korrelationsmuster im Nachhinein plausibel. Diese Annahme lässt sich bei retrospektiver Betrachtung der untersuchten Schülerlaborprojekte in dem Maße stützen, als dass die gewonnenen Daten bspw. nicht in wissenschaftliche Publikationen münden.

Limitationen

Eine Limitation der vorliegenden Studie ist die hierarchische Struktur der angefallenen Daten, die durch die Erhebungen im Klassenverband begründet ist. Alle teilnehmenden Schülerinnen und Schüler (Individualebene) stammen aus 19 Klassen (Kontexteinheiten). Die Anzahl der Beobachtungen pro Kontexteinheit war jedoch zu gering, um die Mehrebenenstruktur der Daten in den Analysen zu berücksichtigen (Kleinke et al. 2017). Für zukünftige Untersuchungen muss es daher das Ziel sein, eine ausreichend große Stichprobe zu generieren, um die hierarchische Struktur der Daten angemessen berücksichtigen zu können. Außerdem sollte im Rahmen folgender Untersuchungen der Zusammenhang zwischen den Subskalen des FEWAW und weiteren geeigneten konvergenten und diskriminanten Außenkriterien untersucht werden, um die Konstruktvalidität des Fragebogens weiter abzusichern. Ein geeignetes konvergentes Außenkriterium ist bspw. das Interesse am Projektthema, zu dem bereits empirische Befunde über einen positiven Zusammenhang mit der Authentizitätswahrnehmung vorliegen (Engeln 2004; Pawek 2009).

Durch das breite Fächerspektrum des Alfried Krupp-Schülerlabors und den Einsatz des FEWAW im naturwissenschaftlichen sowie im geisteswissenschaftlichen Bereich gibt es zunächst keine Beschränkung der Ergebnisse auf einzelne Fächer oder Projekte. Auch wenn die Verteilung der Schülerinnen und Schüler auf beide Bereiche sehr ungleichmäßig ist (Anteil naturwissenschaftlich 82,5 %), entspricht die vorliegende Verteilung in etwa der in deutschen Schülerlaboren vorherrschenden Präferenz für ein naturwissenschaftliches Angebot (LernortLabor 2015). In einer nachfolgenden Untersuchung wäre es dennoch empfehlenswert, stärker geisteswissenschaftliche Projekte in den Blick zu nehmen, da sie eine ebenso zentrale Rolle in der Wissenschaftsvermittlung spielen, es bisher aber kaum empirische Untersuchungen zu deren Wahrnehmung und Wirkung gibt.

Trotz einiger Limitationen der vorliegenden Untersuchung konnten die theoretischen Grundannahmen des Modells der Authentizität der Wissenschaftsvermittlung (Betz et al. 2016) zur Mehrdimensionalität der Authentizität bestätigt werden und der in dieser Studie validierte Fragebogen zur Erfassung der Wahrnehmung von Authentizität in der Wissenschaftsvermittlung (FEWAW) stellt ein geeignetes Instrument dar, um den Wirkungszusammenhang von Authentizität in Lehr-Lernkontexten weiter zu untersuchen.