Das Kapitel widmet sich den essenziellen Vorarbeiten, die vor der Durchführung einer quantitativ-empirischen Studie durchgeführt werden müssen. Es beginnt mit der Konzeptualisierung und Operationalisierung hypothetischer Konstrukte, die in Beziehung gesetzt werden. Dabei wird besonderer Wert auf die methodische Strenge und die Adressierung potenzieller Verzerrungen gelegt. Die Voruntersuchungen spielen eine zentrale Rolle, um die Validität und Reliabilität der entwickelten Messmodelle zu überprüfen. Ein Schwerpunkt liegt auf der Konzeptualisierung und Operationalisierung der hypothetischen Konstrukte wie Markensensibilität, Markenwichtigkeit und wahrgenommene Logistikdienstleistungskomplexität. Die detaillierte Analyse und die praxisnahe Anwendung der theoretischen Konzepte machen diesen Beitrag zu einem wertvollen Werkzeug für Forscher und Praktiker in der quantitativen Sozialforschung. Die umfassende Literaturrecherche und die fundierte Methodik bieten eine solide Grundlage für die Durchführung und Interpretation empirischer Studien.
KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
Zusammenfassung
Bevor das Hypothesensystem final geprüft werden kann, müssen eine Reihe von Vorarbeiten durchgeführt werden. Gemäß den Anforderungen der quantitativ-empirischen Sozialforschung erfolgt nach der Aufstellung des vorläufigen Hypothesensystems die Konzeptualisierung und Operationalisierung der in Beziehung gesetzten Größen. Im Anschluss daran werden potenzielle Verzerrungen adressiert und hierbei insbesondere Maßnahmen sowie Kontrollmöglichkeiten für diese herausgearbeitet. Aus den Ergebnissen der Voruntersuchung wird schließlich das endgültige Hypothesensystem bestimmt.
Bevor das Hypothesensystem final geprüft werden kann, müssen eine Reihe von Vorarbeiten durchgeführt werden. Gemäß den Anforderungen der quantitativ-empirischen Sozialforschung, und wie in Kapitelabschnitt 2.1.4 für FB 3a/b bestimmt, erfolgt nach der Aufstellung des Hypothesensystems die Konzeptualisierung und Operationalisierung der in Beziehung gesetzten Größen1 (Kapitelabschnitt 3.1). Im Anschluss daran sollen im Sinne der methodischen Strenge (MS 2) potenzielle Verzerrungen adressiert und hierbei insbesondere Maßnahmen sowie Kontrollmöglichkeiten für diese herausgearbeitet werden (Kapitelabschnitt 3.2). Ferner empfiehlt die Methodenliteratur bei quantitativ-empirischen Studien das Durchführen von Voruntersuchungen, vor allem mit dem Ziel die entwickelten Messmodelle hinsichtlich ihrer Validität und Reliabilität zu überprüfen (Kapitelabschnitt 3.3). Da die Voruntersuchungen zu Modifikationen der Messmodelle oder gar des Hypothesensystems führen können, wird in Kapitelabschnitt 3.4 das angepasste und damit final zu testende Hypothesensystem vorgestellt.
3.1 Konzeptualisierung und Operationalisierung der hypothetischen Konstrukte
Nach der Hypothesen- und Modellbildung jedoch vor der Durchführung der empirischen Untersuchung ist die Formulierung der Messmodelle zu vollziehen. Nachdem das Vorgehen zur Messmodellentwicklung bestimmt wurde (Kapitelabschnitt 3.1.1), folgen die Konzeptualisierung, sowie Operationalisierung der zuvor hergeleiteten hypothetischen Konstrukte „Markensensibilität“, „Markenwichtigkeit“, „wahrgenommene Logistikdienstleistungskomplexität“, „wahrgenommene Informationsüberflutung“, „wahrgenommenes Risiko“, „individuelle Risikoneigung“, „Rational-Experiential Inventory“, sowie der Kontrollvariablen (Kapitelabschnitt 3.1.2–3.1.9).
Anzeige
3.1.1 Bestimmung eines Vorgehens zur Konzeptualisierung und Operationalisierung hypothetischer Konstrukte
Bei den im Hypothesensystem in Beziehung gesetzten Größen handelt es sich um sogenannte hypothetische Konstrukte2 oder latente Variablen, d. h. Größen, die nicht direkt auf der empirischen Ebene beobachtbar sind, weshalb die Bestimmung und Zuordnung von direkt beobachtbaren (manifesten) Indikatoren – eine Messmodellentwicklung3 – notwendig wird.4Es wurde daher nachfolgend eine Systematik erarbeitet, mit Hilfe derer eine transparente und valide Konzeptualisierung und Operationalisierung dieser hypothetischen Konstrukte möglich wird. Präziser formuliert, ergibt sich die Notwendigkeit für eine solch ausführliche Vorgehensweise aus den Erkenntnissen der Literaturanalyse im Rahmen der konzeptionellen und theoretischen Grundlagen. So wurde beobachtet, dass die zu untersuchenden Phänomene wahrgenommenes Risiko und Komplexität in mehreren Forschungsfeldern bereits adaptiert wurden und dies zu einer mannigfaltigen Konzeptualisierung und Operationalisierung geführt hat. Zudem wurde deutlich, dass mehrere Konstrukte existieren, die ein der Markensensibilität ähnliches Verständnis erkennen lassen.5 Allen voran aber fordern die methodische (MS 2) und konzeptionelle (KS 2, KS 4) Strenge die sorgfältige Abgrenzung der fokalen Konstrukte von anderen in Beziehung stehenden Konstrukten, die eindeutige Definition der Konstrukte und eine ebenso theoretisch, wie methodisch fundierte Operationalisierung.6
Die erarbeite Vorgehensweise orientiert sich an den klassischen Arbeiten zur Messmodellentwicklung von MacKenzie et al. (2011), Rossiter (2002), und Churchill (1979),7 der Grundlagenarbeit von Weiber und Sarstedt (2021), sowie an den von Podsakoff et al. (2016) hervorgebrachten Empfehlungen zur verbesserten Konzeptdefinition. Das Folgen eines bestimmten Ansatzes hat sich aus mehreren Gründen als unpraktikabel erwiesen. Zum einen vernachlässigen die ursprünglichen Ansätze die Gestaltung der Konstrukt-Definition,8 welche sich für das vorliegende Forschungsvorhaben als essenziell herausgestellt hat. Zum anderen können solch umfangreichen Ansätze, wie dem von Rossiter (2002) oder MacKenzie et al. (2011) nur bedingt gefolgt werden, da wie die Autoren selbst konstatieren: „practical limitations may prevent researchers from being able to follow all of the recommendations discussed in this paper in a single study, either because of a lack of time or resources, or both.”9
Abbildung 3.1
Vorgehen bei der Konzeptualisierung und Operationalisierung hypothetischer Konstrukte10
Weiterhin gilt die Güteprüfung der Messmodelle als ein „never-ending process“.11 Daher wurde mit dem vorliegenden Vorgehen versucht einen Kompromiss aus Nutzen und Aufwand einer transparenten, sorgfältigen Konzeptualisierung und Operationalisierung der hypothetischen Konstrukte zu finden. In Referenz zu dem in Kapitelabschnitt 2.1.4 definierten Ablauf illustriert Abbildung 3.1 die drei Schritte der (a) Konstrukt-Konzeptualisierung, (b) Konstrukt-Operationalisierung sowie (c) Voruntersuchungen (ggf. Modifikation der Messmodelle) mit den ihnen unterliegenden Arbeitspaketen für die dritte Phase der quantitativ-empirischen Studie.12
Konstrukt-Konzeptualisierung
Anzeige
Die Konstrukt-Konzeptualisierung umfasst die Definition der fokalen Konstrukte einer Untersuchung. Häufig wird dieser erste Schritt in der Methodenliteratur als zentrale und weitverbreitete Fehlerquelle der Messmodellentwicklung identifiziert.13 Deutlich wird dieser Sachverhalt vor allem nach Einschätzung erfahrener Reviewer. Allen voran Locke et al. (2012) gehen davon aus, dass circa 90 % der von ihnen erhaltenen Einreichungen Mängel in der Konzeptdefinition aufweisen.14 Um die Folgen einer unklaren Konstrukt-Definition, wie beispielsweise einer mangelhaften Operationalisierung,15 frühzeitig entgegenzuwirken, wird auf die Empfehlungen und Techniken verschiedener Autoren zur verbesserten Konstrukt-Konzeptualisierung zurückgegriffen. Diesbezüglich wird zunächst eine Literaturanalyse16 durchgeführt.17 Wichtig bei der Literaturanalyse ist ebenfalls die Identifikation und Berücksichtigung semantisch verwandter Konstrukte, um die fokalen Konstrukte in ihren Definitionen von diesen trennscharf abgrenzen zu können.18 Basierend auf dem durch die Literaturanalyse generierten repräsentativen Pool an Kurzbeschreibungen und deren abgeleiteten Attribute19 wird eine eindeutige, von anderen Konstrukten klar abgrenzbare, theoretisch und sachlogisch fundierte Definition vorgenommen.20 In Übereinstimmung mit der Definition der Konstrukte sollte auch immer die Dimensionalität bestimmt werden.21 Von einem eindimensionalen Konstrukt wird dann gesprochen, wenn das Konstrukt aus einer Komponente besteht. Werden mehrere Komponenten oder Merkmale unterstellt, so handelt es sich um ein mehrdimensionales Konstrukt.22 Für die Konzeptualisierung der Dimensionen gelten dieselben Anforderungen, wie für die übergeordneten Konstrukte. Das bedeutet, dass insbesondere darauf geachtet wird, die Eigenschaften der individuellen Dimensionen herauszuarbeiten, sowie diese von verwandten Konzepten abzugrenzen.23
Konstrukt-Operationalisierung
Nach der Konstrukt-Definition und der Bestimmung der Dimensionalität erfolgt die Konstrukt-Operationalisierung. Diese basiert, wie auch die Konstrukt-Konzeptualisierung, zunächst auf einer Literaturanalyse. Denn entsprechend den Empfehlungen der einschlägigen Literatur ist bei einer Messmodellentwicklung, sofern möglich, auf bereits etablierte und erprobte Messmodelle zurückzugreifen.24 So ist es das Ziel der Literaturanalyse prinzipiell adaptierbare Operationalisierungen der fokalen, wie auch deren verwandten Konstrukte zu identifizieren und ein Set an messbaren Indikatoren zu erarbeiten.25 Darüber hinaus ermöglicht es dem Forschenden Änderungen in den Operationalisierungen von Autor zu Autor nachvollziehen und gegebenenfalls stark abweichende Operationalisierungen identifizieren und ausschließen zu können. Denn eine unreflektierte Übernahme26 als auch Adaption27 von Messmodellen kann später zu Problemen28 in der statistischen Analyse führen. Im Anschluss findet die Festlegung der Messkonzeption statt. Dabei gilt es zunächst zu entscheiden, ob die Konstrukte formativ oder reflektiv zu messen sind. Insofern wird die Beziehung zwischen den fokalen Konstrukten und seinen messbaren Indikatoren spezifiziert. Handelt es sich um ein formatives Messmodell, so definieren die Indikatoren Merkmale eines Konstruktes und Veränderungen bei den Indikatoren führen zu Veränderungen des Konstruktes. Agieren die Indikatoren als Manifestationen des fokalen Konstruktes und sorgen Veränderungen der Indikatoren zu keinen Veränderungen auf Konstruktebene, so liegt ein reflektives Messmodell vor.29 Jarvis et al. (2003) und MacKenzie et al. (2005) konnten in diesem Zusammenhang aufzeigen, dass Fehlspezifikationen von Messmodellen in veröffentlichten Studien durchaus nicht selten sind. Im häufigsten Fall werden formative Beziehungen zwischen Konstrukt und Indikatoren fälschlich reflektiv modelliert.30 Letzten Endes können solche Fehlspezifikationen zu Verzerrungen in den Parameterschätzungen führen.31 Da in der Literatur bereits Operationalisierungen für die meisten fokalen Konstrukte vorliegen und eine Fehlspezifikation vermieden werden sollte, werden die identifizierten Messmodelle in ihrer Spezifikation anhand der von Jarvis et al. (2003) empfohlenen Entscheidungsregeln32 zunächst überprüft und mit den entwickelten Konstrukt-Definitionen abgeglichen33, bevor eine solche Entscheidung für die vorliegende Untersuchung getroffen wird. Für den Fall mehrdimensionaler Konstrukte erwächst zudem die Notwendigkeit zur Argumentation einer formativen oder reflektiven Beziehung zwischen dem Konstrukt zweiter Ordnung und seinen Dimensionen erster Ordnung.34 Damit ergeben sich nach Jarvis et al. (2003) vier Typen mehrdimensionaler Messmodelle zweiter Ordnung. Die Kombination aus reflektiv gemessenen Dimensionen erster Ordnung und reflektiv gemessenem Konstrukt zweiter Ordnung stellt dabei den häufigsten Fall mehrdimensionaler Messmodelle dar.35 Im Anschluss an die Spezifikation der Messmodelle werden die Indikatoren formuliert und die Anzahl der Indikatoren festgelegt. Wiederum besteht bei den Indikatoren die Anforderung, dass diese stets mit Bezug zur Konstrukt-Definition und damit zum theoretischen Konzept ausgewählt, abgeändert oder neu formuliert werden. So ist sichergestellt, dass ein Indikator auch das misst, was er messen soll.36 Ferner erfordert dies, dass die eingesetzten Indikatoren verständlich und präzise formuliert werden.37 In der vorliegenden Untersuchung wird deshalb den Empfehlungen von Hague (2016) und Dillmann et al. (2014) Folge geleistet.38 Bei der Anzahl der Indikatoren wird generell zwischen Single-Item und Muli-Item-Messungen unterschieden. Eine Single-Item-Messung liegt vor, sobald ein Konstrukt mittels nur eines Indikators bestimmt werden soll.39 Im Gegensatz dazu wird im Falle einer Multi-Item-Messung das Konstrukt über mehrere Indikatoren erfasst. Die Tendenz zur Multi-Item-Messung in der wissenschaftlichen Praxis ist vor allem auf die Möglichkeit zur Identifikation und expliziten Berücksichtigung von Messfehlern zurückzuführen.40 Für das vorliegende Forschungsvorhaben ist festzuhalten, dass es sich um komplexe Konstrukte handelt, die über mehrere Attribute gefasst werden. Zudem bedingt die Modellherleitung eine Konzeptualisierung und Operationalisierung der Konstrukte auf individueller Ebene, sowie insbesondere der Abfrage von Wahrnehmungen, was zu starken Abweichungen im Antwortverhalten zwischen den Probanden führen kann. Um also zum einen die Vielseitigkeit der Konstrukte erfassen41, und zum anderen die individuelle Wahrnehmung der Probanden möglichst genau differenzieren42 zu können, erscheint die Verwendung von Multi-Item-Messungen angebracht43, weshalb fortfolgend, sofern möglich, auf diese zurückgegriffen wird. Hinsichtlich der Anzahl an Indikatoren bei Multi-Item-Messungen gibt es unterschiedliche Empfehlungen44 und keine allgemeingültige „hard-and-fast rule“45. Nicht an konkreten Zahlen festgemacht kann jedoch konstatiert werden, dass eine größere Anzahl zu bevorzugen ist.46 An diesem Leitprinzip orientiert sich auch die vorliegende Untersuchung. Nach Spezifikation und Formulierung der Messvariablen wird die Messvorschrift47 festgelegt. Dieser Schritt umfasst die Quantifizierung qualitativer Eigenschaften von Sachverhalten. Häufig in der empirischen Forschung eingesetzt werden Ratingskalierungen. Mit Hilfe dieser lassen sich Zustimmungen, Intensitäten oder Bewertungen der Probanden in Form von Zahlenwerten erfassen.48 Neben weiteren Aspekten, müssen hierbei vor allem die Anzahl der Skalenpunkte festgelegt werden. In diesem Zusammenhang gilt es einen Trade-off zwischen ausreichend Differenzierungsmöglichkeit und Überschaubarkeit zu finden.49 Eine Skalierung mit zehn Antwortpunkten könnte die Respondenten bereits überfordern50, während eine Skalierung mit drei Antwortpunkten nur eine geringe Differenzierung bietet.51 Hinsichtlich der Gütekriterien Reliabilität und Validität wird eine Anzahl zwischen vier und sieben Skalenpunkten als optimal angesehen.52 Einen solchen Kompromiss aus Übersichtlichkeit und Differenzierung, sowie hohem Maß an Reliabilität und Validität liefern beispielsweise die 6- oder 7-Punkt Skala, wie sie auch von Weng (2004) empfohlen werden.53 Zur endgültigen Entscheidung für eine der beiden Skalen, müssen die Vor- bzw. Nachteile von ungeraden und geraden Skalen geprüft werden. Gerade Skalen bieten keine mittlere Merkmalsausprägung, die als Ausflucht missbraucht werden könnte.54 Somit sind die Probanden gezwungen sich für eine Richtung zu entscheiden, wodurch sich allerdings die Wahrscheinlichkeit eines Item-Non-Response erhöhen dürfte.55 Schließlich fiel die Wahl auf eine endpunktbenannte 7er-Skala. Damit stimmt das Forschungsvorhaben in diesem Punkt mit den Studien zur Markensensibilität überein.56 Des Weiteren wurden bei der Umsetzung einer Endpunktbenennung negative Nummerierungen der Skalen vermieden57 und auf die Ausweisung einer „Weiß ich nicht“-Kategorie, sowie der Deklaration der mittleren Ausprägung als „neutral“ verzichtet.58 Damit ist die Entwicklung der Messmodelle abgeschlossen.
Wie in Abbildung 3.1 illustriert, erfolgen im Anschluss Voruntersuchungen.59 Auf Grundlage dessen können beispielsweise Modifikationen an den Messmodellen vorgenommen werden, bevor sie im Anschluss im Rahmen der Hauptuntersuchung final getestet werden.
3.1.2 Markensensibilität
Gemäß Forschungsbedarf FB 2a und FB 2b sollen für die Markensensibilität zwei Operationalisierungen entwickelt werden. Diesen wird in Kapitelabschnitt 3.1.2.1 und 3.1.2.2 nachgegangen. Die Markensensibilität wird entsprechend wissenschaftlichen Vorarbeiten als latentes Konstrukt behandelt.60 Bevor allerdings die beiden Konstrukt-Operationalisierungen mithilfe manifester Indikatoren vorgestellt werden können, soll nachfolgend eine für beide gültige Konstrukt-Konzeptualisierung mit der Ableitung einer Konstrukt-Definition durchgeführt werden.
Konstrukt-Konzeptualisierung
Die Markensensibilität wurde ursprünglich von Kapferer und Laurent (1988) zur Untersuchung des Konsumentenverhaltens eingeführt, bevor es dann von Hutton (1997) und später insbesondere von Brown (2007), sowie dessen Autorenkollektiv61 im Kontext der organisationalen Beschaffung erforscht wurde. Aufgrund der Notwendigkeit zur Berücksichtigung originärer Konzeptualisierungen im Sinne verbesserter Konzeptdefinitionen62, sowie aufgrund der individuellen Ebene als Untersuchungsobjekt in der vorliegenden Arbeit, sollten neben Untersuchungen aus der organisationalen Forschung, auch relevante Studien aus der Konsumentenforschung63 für die Konzeptualisierung der Markensensibilität miteinbezogen werden.64 Somit konnten als Ergebnis der Literaturrecherche mehrere Definitionen des fokalen Konstrukts identifiziert werden. Aus den Definitionen der Markensensibilität konnten wiederum zentrale Attribute abgeleitet werden (Tabelle 3.1).
Tabelle 3.1
Begriffsauffassungen zur Markensensibilität und verwandter Konstrukte65
Konstrukt-Bezeichnung/ Quelle
Definition/Begriffsverständnis
Abgeleitete Attribute
Konsumentenforschung
„(Consumer) Brand Sensitivity“
Kapferer und Laurent (1988), S. 13 f.
“The brand sensitivity appraoch to brand equity focuses not on comparisons of brand X and brand Y, but on national brands in general versus unbranded products or private labels.”
“Brand sensitivity is a psychological construct that refers to the buyer’s decision-making process. Saying that an individual is brand sensitive means that brands play an important role in the psychological process that precedes the buying act.”
Psychologisches Konstrukt
Individuelle Ebene
Rolle der Marke
Entscheidungsprozess
Zeitlich vor dem Kauf
Organisationale Forschung
„Brand Sensitivity“
Zablah et al. (2010), S. 251
“Brand sensitivity refers to the degree to which brand names and/or corporate associations are activelyconsidered in organizational buying deliberations.”
“As such, brand sensitivity reflects the extent to which the buying centerintends to rely on brand information.”
Berücksichtigung von Markeninformationen (Markennamen, Unternehmensassoziationen)
Bewusste Informationsverarbeitung
Entscheidungsprozess
Buying-Center-Ebene
Intention des Verhaltens (intention)
„Organizational Brand Sensitivity (OBS)“
Sharma und Sengupta (2020), S. 58
„Thus, we re-conceptualize OBS as the degree to which buying center members acquire, process, store, and recall brand-related information during organizational buying deliberations.“
„[…] helped us redefine it as a threedimensional construct supported by information processing theory.”
Berücksichtigung von Markeninformationen
Bewusste Informationsverarbeitung
Entscheidungsprozess
Buying-Center-Ebene
Information-processing Theorie
3-dimensional: Brand-related information acquisition, brand-related information processing, buying center memory
Verwandte Konzepte
“Brand importance”
Zablah et al. (2010), S. 251
„refers to the relative importance assigned to brand names in organizationalbuying decisions.”
Verhalten (behavior)
Entscheidung
Gewichtung der Markennamen
Buying-Center-Ebene
„Brand preference“
Zablah et al. (2010), S. 251
„refers to the extent to which an organization views a focal brand as more desirable than comparable alternatives.”
Einstellung zu Marken (attitude)
„Brand Consciousness“
Zablah et al. (2010), S. 251
„refers to the organizationalbelief that well-known brands are superior to lesser-known brands.”
Überzeugung von Marken (belief)
Buying-Center-Ebene
„Brand relevance“
Backhaus et al. (2011), S. 1083; Fischer et al. (2010), S. 824
„refers to the decision weight of a brand, in relation to other product benefits in a category.”
Verhalten (behavior)
Gewichtung der Marke
Nicht Produkt-/Anbieterspezifisch
„Mediensensibilität
(Media sensitivity)”
Large (2003), S. 87; Penley et al. (1991), S. 60
„Im Gegensatz zum Medienreichtum kann die Mediensensibiliätt als Faktor des Kommunikationsverhaltens verstanden werden. Ein Beschaffungsmanager verhält sich mediensensibel, wenn er bei Kommunikationshandlungen den Medienreichtum berücksichtigt und das Kommuikationsmedium situations- und inhaltsgerecht auswählt.“
Faktor des Kommunikationsverhaltens (behavior)
Berücksichtigung von Medienreichtum
Individuelle Ebene
„Price Sensitivity”
Wakefield und Inman (2003), S. 201
„Price sensitivity refers to the extent to which individualsperceive and respond to changes or differences in prices for products or services.“
Wahrnehmung von Preisänderungen
Reaktion auf Preisänderungen
Individuelle Ebene
Erstens handelt es sich bei der Markensensibilität um ein Konstrukt, welches anbieter- und produktunspezifisch verwendet werden kann.66 Es ermöglicht somit eine produkt-/serviceübergreifende bzw. -kategorische Untersuchung.67 Zweitens wird das Konstrukt als psychologische Variable konzeptualisiert.68 Ursprünglich wurde die Markensensibilität auf der individuellen Ebene konzeptualisiert, um auszudrücken welche Rolle die Marke für einen Konsument in seiner individuellen Kaufentscheidung spielt.69 Mit der Transition in die organisationale Forschung hat sich dann gegeben durch neue Forschungsziele das Untersuchungsobjekt entsprechend angepasst. So wird in den neueren Veröffentlichungen im Kontext der organisationalen Beschaffung eine Konzeptualisierung auf Buying-Center-Ebene implementiert.70 Sharma und Sengupta (2020) sprechen folgerichtig als Erste von einer „Organizational Brand Sensitivity“.71 Da sich das vorliegende Forschungsprojekt zum Ziel gesetzt hat, entgegen des bisher etablierten Forschungsstands zur Markensensibilität, das individuelle Entscheidungsverhalten eines Beschaffungsmanagers zu untersuchen, erfolgt demgemäß auch eine Konzeptualisierung auf individueller Ebene.
Auf inhaltlicher Ebene werden indessen Unterschiede zwischen der organisationalen Forschung und der Konsumentenforschung deutlich. Recht allgemein definieren beispielsweise Lachance et al. (2003) und Beaudoin et al. (2003) die Markensensibilität im Kontext des Konsumentenverhaltens, indem sie von der Rolle der Marke im Entscheidungsprozess sprechen.72 In der organisationalen Forschung dagegen wird die Marke, wie beispielsweise bei Brown et al. (2011) als Markennamen73 oder bei Brown et al. (2012) als Unternehmensassoziationen und markenbezogene Informationen74 spezifiziert. Eine Verknüpfung von Markennamen und Unternehmensassoziationen unter dem Begriff Markeninformationen ist währenddessen bei Zablah et al. (2010) zu finden.75 Um dieses zentrale Attribut der Markensensibilität für das vorliegende Forschungsprojekt hinreichend fassen und gleichzeitig die definitorische Divergenz beseitigen zu können, ist es zweckmäßig noch einmal auf die eingangs aufgestellte Marken-Definition Bezug zu nehmen.76 Dieser entsprechend ist die Marke eine Dyade aus tangiblen und intangiblen Markenelementen, die für ein in der Psyche der Nachfrager verankertes und unverwechselbares Vorstellungsbild sorgen. Folglich wäre eine an Brown et al. (2011) ansetzende Definition der Markensensibilität über Markennamen definitorisch unzureichend, da lediglich auf einen bestimmten wahrnehmbaren Aspekt der Marke und damit nur auf einen Teil der dyadischen Marken-Definition referenziert wird.77 Selbige Argumentation kann mit Blick auf die Definition von Brown et al. (2012) angeführt werden.78 Eine Kombination aus beiden Markenelementen, wie sie bei Zablah et al. (2010) zu finden ist, wäre daher hinsichtlich der in Kapitel 2 aufgestellten Marken-Definition als geeigneter einzustufen. Für den vorliegenden Fall wird allerdings auf eine an den Studien des Konsumentenverhalten angelehnte Verwendung des Überbegriffs „Marke“ umgesetzt. Damit sollen Restriktionen bei den Respondenten bewusst vermieden werden – schließlich ist die Verankerung der Marke in den Köpfen der Respondenten individuell und unverwechselbar gestaltet. Ferner erscheint es unerlässlich „das Bewusstsein“ als ein weiteres abgeleitetes Attribut der Markensensibilität ausführlicher zu diskutieren.79 Wie bereits in Kapitelabschnitt 2.1.1.1.2 aufgezeigt werden konnte, wird das Markenwissen explizit und implizit abgerufen.80 Während in den Arbeiten81 zur Untersuchung der Markensensibilität auf Buying-Center-Ebene eine Eingrenzung auf das Bewusstsein aufgrund der Verbalisierung des Markenwissens unter den Mitgliedern eines Buying-Centers, argumentierbar scheint, bietet dies jedoch aktuell noch keine adäquate Grundlage für eine Eingrenzung für die vorliegende Arbeit und damit für die individuelle Untersuchungsebene. Damit wird auf inhaltlicher Ebene eine Eingrenzung auf das Bewusstsein zunächst als unangebracht angesehen. Aus forschungsmethodischer Sicht zeigt sich, dass im deklarativen Gedächtnis festgehaltenes Wissen meist auch in einer Umfrage verbalisierbar und damit reproduzierbar ist, allerdings im nondeklarativen Gedächtnis gespeichertes Wissen nicht explizit wiedergegeben werden kann.82 Weshalb die Abfrage des impliziten Markenwissens und deren Berücksichtigung in der Entscheidungssituation in einer Umfrage nur schwierig umsetzbar scheint. Eine Argumentation bei der die definitorische Eingrenzung aus den Limitationen der Forschungsmethode oder aus der Komplexität der Erhebung hervorgeht, wird aber als unzulässig angesehen.83 Die Tatsache also, dass das Unbewusste nur schwierig zu erfassen ist, soll nicht als Argument dienen die Definition der Markensensibilität dahingehend einzugrenzen – ist es doch vielmehr ein forschungsmethodisches Problem.84Aufgrund dessen und im Sinne einer definitorischen Konsistenz erscheint es daher zweckmäßig bei der Definition der Markensensibilität auf eine Fokussierung des expliziten Markenwissens zu verzichten. Dies entspricht auch eher dem Markensensibilitäts-Verständnis der originären Arbeit von Kapferer und Laurent (1988), die explizit darauf verweisen, dass es sich bei der Markensensibilität um eine „psychological (perhaps individual difference) variable“85 handelt und somit ebenfalls keine definitorischen Eingrenzungen hinsichtlich des Bewusstseins vornehmen.
Neben den Definitionen des fokalen Konstruktes, sollten auch verwandte Konstrukte mit einem der Markensensibilität ähnlichem Verständnis als Ergebnis der Literaturrecherche identifiziert werden. Mit ihrer Untersuchung der Markenhierarchie, basierend auf den Ideen des Hierarchy-of-Effects Models86, liefern Zablah et al. (2010) eine Abgrenzung zu den Konstrukten Markenwichtigkeit, Markenpräferenz und Markenbewusstsein. Dieser zur Folge kann das Markenbewusstsein als „belief“ und die Markenpräferenz als „attitude“ verstanden werden, während die Markensensibilität als „intention“ diesen in der Hierarchie nachgelagert ist. Das Verhalten („behavior“) wird von der Markenwichtigkeit erfasst und folgt hierarchisch der Markensensibilität. Diese Unterscheidung ist auch der Arbeit von Lachance et al. (2003), die explizit darauf verweisen, dass die Markensensibilität dem Kaufakt vorgelagert ist, zu entnehmen.87 Zusätzlich definieren Zablah et al. (2010) die Markenwichtigkeit über die relative Wichtigkeit der Marke im Vergleich zu anderen Entscheidungskriterien.88 Deutlichere inhaltliche Überschneidungen zeigen sich hingegen zwischen der Markenwichtigkeit und der Markenrelevanz. So bezeichnen Backhaus et al. (2011) die Markenrelevanz als „decision weight of a brand, in relation to other product benefits in a category“89 und lässt sich daher ähnlich wie die Markenwichtigkeit von der Markensensibilität aufgrund ihrer Relation zu anderen Entscheidungskriterien und zusätzlich aufgrund der Spezifikation auf eine bestimmte Produktkategorie abgrenzen.90 Eine hieran ansetzende Klassifikation liefert Donneverth (2009). Er unterscheidet die beiden Konzepte Markensensibilität und Markenrelevanz anhand der Konsumentenperspektive. Demnach ist bei der Markenrelevanz der Einfluss der Marke auf alle Konsumenten in einer Produktkategorie von Interesse, während bei der Markensensibilität lediglich der Einfluss auf einen spezifischen Nachfrager betrachtet wird.91 Zur Verifikation der erarbeiteten Attribute wurde ergänzend eine Stichprobenprüfung mit verwandten Sensibilitäts-Konstrukten durchgeführt. Für die Konstrukte Preis- und Mediensensibilität kann prinzipiell ein ähnliches Verständnis von -sensibilität unterstellt werden.92 Insbesondere aber verdeutlichen sie die Abgrenzung der Markensensibilität zu Markenwichtigkeit und Markenrelevanz, da weder Preis- noch Mediensensibilität in Relation zu anderen Kriterien definiert werden.93 Dies zeigt sich auch in den jeweiligen Operationalisierungen.94
Aus den abgeleiteten Attributen und unter Berücksichtigung der Abgrenzungen zu verwandten Konstrukten, sowie vor dem Hintergrund der individuellen Untersuchungsebene und der eingangs aufgestellten Marken-Definition, lässt sich die folgende Konstrukt-Definition der Markensensibilität für das vorliegende Forschungsprojekt formulieren:
**Markensensibilität beschreibt, inwiefern Beschaffungsmanager die Marken der Logistikdienstleister in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl berücksichtigen.
Allgemein gesprochen sind Beschaffungsmanager dann markensensibel, wenn sie die Marken der Logistikdienstleister in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl berücksichtigen.
Ausgehend von dieser Konstrukt-Definition wird eine Eindimensionalität zunächst unterstellt und folgend hinlänglich dieser argumentiert. So stellt die Berücksichtigung der Marke im individuellen Entscheidungsprozess die zentrale Dimension des Konstruktes dar. Entgegen der verbreiteten Annahme der Eindimensionalität95, argumentieren Sharma et al. (2020) basierend auf der Informationsverarbeitungstheorie für eine Konzeptualisierung mit drei Dimensionen 1) „Brand-related Information Acquisition“ 2) „Brand-related Information Processing“ 3) „Buying center Memory“96 und Korai (2017) für eine Konzeptualisierung mit zwei Dimensionen 1) „Brand Attachement“ 2) „Brand Strength“97. An beiden Studien können gleichermaßen die fehlende Spezifikation und statistische Prüfung der Mehrdimensionalität kritisiert werden.98 Somit konnte die Mehrdimensionalität in beiden Fällen lediglich theoretisch hergeleitet werden. Ferner stimmen die beiden mehrdimensionalen Konzeptualisierungen nicht mit der erarbeiteten Konstrukt-Definition überein. Damit lässt sich die Eindimensionalität der Markensensibilität für die vorliegende Untersuchung hinreichend begründen.
3.1.2.1 Reflektive Messung der Markensensibilität auf Individualebene
Gemäß FB 2a soll eine direkte Messung der Markensensibilität auf Individualebene umgesetzt werden. Diesbezüglich werden zunächst die in der Literatur bereits verwendeten Messungen analysiert, bevor anschließend die Spezifikation des Messmodells bestimmt, sowie die Indikatoren formuliert werden können.
Konstrukt-Operationalisierung
Wie bereits bei der Konstrukt-Konzeptualisierung, so gilt es auch bei der Konstrukt-Operationalisierung nicht nur die Messmodelle der Markensensibilität zu prüfen, sondern auch jene der mit ihr verwandten Konstrukte. Eine Übersicht der relevanten Modelle zur Messung der Markensensibilität liefert Tabelle 3.2.
Ursprünglich präsentieren Kapferer und Laurent (1988) drei verschiedene Ansätze zur Messung der Markensensibilität. Zum einen setzten sie die Respondenten vor die Wahl zwischen einer bekannten und einer unbekannten Marke mithilfe zweier Indikatoren. Dadurch ist es möglich, die Markensensibilität direkt zu erfassen. Zum anderen versuchen sie die Markensensibilität indirekt über verschiedene Markenwahl-Entscheidungen zu berechnen. Ihr dritter Ansatz beruht auf vier Indikatoren, die über eine Likert-Skala bewertet werden. Dabei spiegeln die Indikatoren die Markensensibilität beispielsweise über die Berücksichtigung (A4, B2, C1), die Wichtigkeit (A3, B4, C2) oder die Wahrnehmung (A1, B1) der Marke wider.99 Insbesondere der dritte Messansatz fand in der Folge in weiteren Publikationen Beachtung. So erweitern Lachance et al. (2003) das Messmodell um zwei Indikatoren und führen eine Konstantsummenskala zur Messung der Markensensibilität ein,100 welche später wiederum von Zablah et al. (2010) zur Messung der Markenwichtigkeit eingesetzt wurde. Die Markensensibilität operationalisieren sie in Anlehnung an Kapferer und Laurent (1988) und Lachance et al. (2003) zum ersten Mal im organisationalen Kontext anhand von drei Indikatoren. Neu ist ein Indikator, der die Markensensibilität über die Weiterempfehlung der Marke (C3) reflektieren soll.101 Zeitlich nachgelagerte empirische Studien zur Markensensibilität greifen weitestgehend – unter kontextspezifischen Anpassungen – auf die bestehenden Indikatorformulierungen von Kapferer und Laurent (1988), Lachance et al. (2003) und Zablah et al. (2010) zurück.102 Lediglich Sharma und Sengupta (2020) schlagen aufgrund ihrer mehrdimensionalen Konzeptualisierung ein neues Messmodell der Markensensibilität vor, wobei auch sie vereinzelt Indikatoren aus den vorherigen Arbeiten einbinden.103
Die Deutlichkeit der definitorischen Abgrenzung zwischen der Markensensibilität und der mit ihr verwandten Konstrukte spiegelt sich allzu häufig nicht in der Operationalisierung der jeweiligen Konstrukte wider. So verwendet beispielsweise Donneverth (2009) in seiner expliziten, nicht komparativen Messung der Markenrelevanz, obwohl zuvor eindeutig in seinem Framework von der Markensensibilität abgegrenzt, vorwiegend jene Indikatoren, die von den Autoren Kapfer und Laurent (1988) und Lachance et al. (2003) zur Messung der Markensensibilität entwickelt wurden.104 Dasselbe gilt auch für die Messung der Markenrelevanz bei Fischer et al. (2010) oder Backhaus et al. (2011).105 Die Überschneidungen in den Messansätzen wird des Weiteren auch durch die wechselseitige Verwendung der Konstantsummenskala zur Messung der Markenwichtigkeit, Markenrelevanz als auch der Markensensibilität offenkundig.106
Tabelle 3.2
Relevante Modelle zur Messung der Markensensibilität107
Konstrukt-Bezeichnung/ Quelle
Eigenschaften
Indikatoren
„(Consumer) Brand Sensitivity“
Kapferer und Laurent (1988), S. 14
Direkte Messung
Forced choice between two items
- I prefer to buy a well-known brand
- I don’t mind buying the store brand
Likert-Skala;
Eindimensional;
Reflektiv;
Multi-Item
A1
When I buy a –-, I look at the brand
A2
I do not choose a –- according to the brand (reverse)
A3
For a –-, the brand name is not that important (reverse)
A4
When I buy a –-, I take account of the brand
Indirekte Messung
A dollametric between two well-known brands
A dollarmetric between a well-known brand a store brand
Mini-Information Display Board
„Brand Sensitivity”
Lachance et al. (2003), S. 56
Likert-Skala;
Eindimensional; Reflektiv;
Multi-Item
B1
When I buy a piece of clothing or fashion accessories (sport shoes, caps, etc.), I look at the brand.
B2
When I buy a piece of clothing or fashion accessories, I take brands into account.
B3
I don’t choose my clothes or fashion accessories according to the brand. (reverse)
B4
Brand is not important to me. (reverse)
B5
When I buy clothing products, I prefer buying well-known brands.
B6
If the store I am shopping in doesn’t offer the specific brand of clothes or fashion accessories I am looking for, I prefer to wait.
„Brand Sensitivity“
Zablah et al. (2010), S. 258
Likert-Skala;
Eindimensional; Reflektiv;
Multi-Item
C1
When we made this purchase, the brand name was considered.
C2
With this purchase, the brand name was important to us.
C3
When evaluating products like this, we prefer recommending well-known brands.
„Brand Relevance in Category”
Fischer et al. (2010), S. 836
Likert-Skala;
Eindimensional; Reflektiv;
Multi-Item
D1
When I purchase a product in the given category, the brand plays – compared to other things – an important role.
D2
When purchasing, I focus mainly on the brand.
D3
To me, it is important to purchase a brand name product.
D4
The brand plays a significant role as to how satisfied I am with the product
Im Sinne der Eindimensionalität wird das Messmodell also reflektiv spezifiziert, womit gleichzeitig der Anforderung an eine direkte Messung gemäß FB 2a erfüllt wird. Auch zeigen die zuvor aufgegriffenen Operationalisierungen überwiegend eine reflektive Spezifikation. Zwar wird in diesen Arbeiten nicht explizit hinsichtlich der Spezifikation als reflektiv oder formativ argumentiert, jedoch lässt die Anwendung der Gütekriterien zur Überprüfung der Messmodelle diesen Schluss zweifelsohne zu.108 Demnach erfolgt nun in einem nächsten Schritt die Formulierung der Indikatoren für das eindimensionale reflektive Messmodell der Markensensibilität im Einklang mit der erarbeiteten Konstrukt-Definition.
Aus den zentralen Messmodellen von Kapferer und Laurent (1988), Lachance et al. (2003) und Zablah et al. (2010) werden insgesamt sechs Indikatoren entnommen und unter bewusst inhaltlichen, sowie sprachlichen Anpassungen ins Deutsche übersetzt. Zum einen drücken sich die inhaltlichen Anpassungen in der Verwendung des „Marken“-Begriffs aus. So verwendet bspw. Zablah et al. (2010) vorwiegend den Begriff Markennamen109, während Kapferer und Laurent (1988), als auch Lachance et al. (2003) den Begriff Marke verwenden.110 Gemäß Methodenliteratur sollten die Indikatoren stets im Einklang mit der Konstrukt-Definition bestimmt und formuliert werden.111 Da dieser zufolge Beschaffungsmanager dann markensensibel sind, wenn sie die Marke im Auswahlentscheidungsprozess berücksichtigen, wird im Rahmen der Indikatoren-Formulierung auch der übergeordnete Begriff „Marke“ verwendet. Auf eine Präzisierung der Marke in Markenzeichen oder Markenwissen, bzw. auf eine Spezifikation auf einzelne ihnen zuzuordnende Elemente (e.g. Markenname) wird somit bewusst verzichtet. Zudem sollen die Indikatoren präzise, einfach und im Sinne der Klarheit formuliert werden.112 Dieser Vorgabe wird dadurch ebenfalls gefolgt. Hinsichtlich des umstrittenen Einsatzes der Konsantsummenskala, wird der Arbeit von Zablah et al. (2010) gefolgt, wonach diese primär zu Messung der Markenwichtigkeit eingesetzt werden sollte.113 Damit wird sowohl der Konzeptualisierung der Markensensibilität als auch der Markenwichtigkeit114 entsprochen.
Ansetzend an den C1- und C2- Formulierungen von Zablah et al. (2010) werden die ersten drei Indikatoren115 mit dem Wortlaut „Bei der strategischen Logistikdienstleisterauswahl“116 eröffnet, um auf die spezifische in der Vergangenheit liegende Entscheidungssituation zu referenzieren:
MSE 01
Bei der strategischen LogistikDL-Auswahl habe ich die Marken der Logistikdienstleister wahrgenommen.
MSE 02
Bei der strategischen LogistikDL-Auswahl habe ich die Marken der Logistikdienstleister berücksichtigt.
MSE 03
Bei der strategischen LogistikDL-Auswahl waren mir die Marken der Logistikdienstleister wichtig.117
Ansetzend an der C3-Indikatorformulierung von Zablah et al. (2010) werden weitere drei Indikatoren mit dem Wortlaut „Bei einer strategischen LogistikDL-Auswahl, wie dieser“ eröffnet. Somit wird indirekt auf die vergangene Entscheidungssituation Bezug genommen und es ergeben sich die folgende Ausdrucksmöglichkeiten:
MSE 04
Bei einer strategischen LogistikDL-Auswahl, wie dieser, bevorzuge ich es bekannte Marken auszuwählen.
MSE 05
Eine strategische LogistikDL-Auswahl, wie diese, treffe ich anhand der Marke.118
MSE 06
Bei einer strategischen LogistikDL-Auswahl, wie dieser, bevorzuge ich es bekannte Marken zu empfehlen.
In der nachstehenden Tabelle 3.3 ist das reflektive Messmodell der Markensensibilität – entsprechend den Anforderungen von Forschungsbedarf FB 2a – mit dem Begriffsverständnis, den Indikatorformulierungen und den Individualverweisen zu den Indikatoren zusammengefasst dargestellt.
FB 2a: Direkte Messung der Markensensibilität auf Individualebene
Markensensibilität (MSE) – reflektive Messung
Begriffsverständnis
Die Markensensibilität beschreibt, inwiefern Beschaffungsmanager die Marken der Logistik-dienstleister in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl berücksichtigen.
Allgemein gesprochen sind Beschaffungsmanager dann markensensibel, wenn sie die Marken der Logistikdienstleister in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl berücksichtigen.
Eigenschaft
Eindimensional, reflektiv, Likert-Skala
Skala
1 = „Trifft gar nicht zu“; 7 = „Trifft voll zu“
Indikatoren
MSE 01
Bei der strategischen LogistikDL-Auswahl habe ich die Marken der Logistikdienstleister wahrgenommen.
A1 – Kapferer und Laurent (1988)
B1 – Lachance et al. (2003)
MSE 02
Bei der strategischen LogistikDL-Auswahl habe ich die Marken der Logistikdienstleister berücksichtigt.
B2 – Lachance et al. (2003)
C1 – Zablah et al. (2010)
MSE 03
Bei der der strategischen LogistikDL-Auswahl waren mir die Marken der Logistikdienstleister wichtig.
A3 – Kapferer und Laurent (1988)
B4 – Lachance et al. (2003)
C2 – Zablah et al. (2010)
MSE 04
Bei einer strategischen LogistikDL-Auswahl, wie dieser, bevorzuge ich es bekannte Marken auszuwählen.
B5 – Lachance et al. (2003)
MSE 05
Eine strategische LogistikDL-Auswahl, wie diese, treffe ich anhand der Marke.
A2 – Kapferer und Laurent (1988)
B3 – Lachance et al. (2003)
MSE 06
Bei einer strategischen LogistikDL-Auswahl, wie dieser, bevorzuge ich es bekannte Marken zu empfehlen.
C3 – Zablah et al. (2010)
3.1.2.2 Formative Messung der Markensensibilität – Der Beitrag von Markenattributen zur Bestimmung der Markensensibilität
Gemäß FB 2b soll neben der direkten Messung der Markensensibilität auch eine indirekte Messung über verschiedene Markenattribute angestrebt werden. Während die Marke bei der direkten Messung der Markensensibilität ganzheitlich erfasst wurde, ist es der Anspruch bei der indirekten Messung der Markensensibilität diese in ihre verschiedenen Markenattribute herunterzubrechen. Aufgrund der permissiven Definition der Markensensibilität ist dieses Vorgehen noch im Einklang mit der Konstrukt-Konzeptualisierung. Die Berücksichtigung der Markenattribute erweitert weder die Definition der Markensensibilität noch erfasst es unterschiedliche Dimensionen der Markensensibilität – eine Eindimensionalität wird weiterhin aufrechterhalten. Dies wird bei einer Verfeinerung der Konstrukt-Definition deutlich. Demnach beschreibt die Markensensibilität, „inwiefern Beschaffungsmanager die Marke (erfasst über deren Markenattribute) der Logistikdienstleister in ihrem individuellen Entscheidungsprozess im Rahmen der organisationalen Logistikdienstleisterauswahl berücksichtigen“.
Konstrukt-Operationalisierung
Ansetzend an der Verfeinerung der Konstrukt-Definition lässt sich die Markensensibilität also als Gesamtheit der im individuellen Entscheidungsprozess berücksichtigten Markenattribute verstehen. Hieraus erwächst allerdings das Problem, dass mit einer Abfrage zur Berücksichtigung der Attribute im individuellen Entscheidungsprozess nicht sichergestellt werden kann, dass das abgefragte Attribut auch mit der Marke assoziiert wird – es sich also tatsächlich um ein Markenattribut handelt. Zwar kann zuvor durch Literaturanalysen und Interviews das Risiko minimiert werden, allerdings ist eine Assoziation stets individuell geprägt und abhängig vom vorhandenen Markenwissen der Person,120 weshalb das Problem nicht vollständig auszuschließen ist. In anderen Worten: Berücksichtigt der Beschaffungsmanager zwar das Attribut in seiner Entscheidungsfindung, assoziiert dieses aber nicht mit der Marke, wurde nicht das Markenattribut als Teil der Markensensibilität erfasst, sondern eines zur Marke alternativen Selektionskriteriums. Insofern soll ein möglicher Messansatz erwogen werden, mit Hilfe dessen sowohl die Berücksichtigung der Attribute abgefragt als auch die Assoziation zwischen den Attributen und der Marke sichergestellt werden kann.
Einen möglichen Messansatz, der die vordefinierten Anforderungen erfüllt, liefert die Risikoforschung. Hierin werden nämlich unter anderem sogenannte Zwei-Komponentenmodelle121 präsentiert.122 Beispielsweise wird die Wahrscheinlichkeit (WA) als auch die Wichtigkeit (WI)123 für verschiedene Konsequenzen erhoben. Das Produkt aus beiden ergibt dann das Risiko für die jeweilige Konsequenz.124 Überträgt man diese Idee nun auf den vorliegenden Sachverhalt, so können die identifizierten Markenattribute jeweils hinsichtlich ihrer Berücksichtigung (B) als auch hinsichtlich ihrer Assoziation (A) zur Marke abgefragt werden. Das Produkt aus beiden ergibt die Sensibilität je Markenattribut (MSE MA 01; 3.1), wohingegen die Summe der Markenattribut-Sensibilität die (Gesamt-)Markensensibilität (MSE MA) bildet (3.2):
$$\user2{MSE MA }01\user2{ } = {\varvec{B}}_{{\user2{MSE MA }01}} \user2{* A}_{{\user2{MSE MA }01}}$$
$$mit B = Ber\ddot{u} cksichtigung;A = Assoziation; i = Markenattribut$$
Dieser Messansatz kann auch wie folgt interpretiert werden: Durch die zusätzliche Abfrage des Grades der Assoziation (A) und durch die anschließende Multiplikation, wird eine Gewichtung der Berücksichtigung (B) der Markenattribute vorgenommen. Das heißt je stärker die Assoziation (A) mit der Marke, desto höher wird die Berücksichtigung (B) des Markenattributs am Ende gewichtet. Dies ist auch mit dem Verständnis für Markenassoziationen zu vereinbaren, da die Gewichtung je Respondent abgefragt und nicht beispielsweise durch den Forschenden125 ex-ante vorgegeben wird. Zusammengefasst drückt der Messansatz folgendes aus: Je höher die Berücksichtigung (B) als auch die Assoziation (A) der Markenattribute – dementsprechend die Sensibilität der Markenattribute – desto höher die (Gesamt-)Markensensibilität (MSE MA).
Anhand dessen und auch mit Verweis auf Formel (3.2) wird deutlich, dass mit Hilfe des vorgestellten Messansatzes ein Index der Markensensibilität generiert wird („Index Construction“).126 Es handelt sich hierbei also um ein formatives Messmodell – die Markensensibilität wird durch die Sensibilität der Markenattribute nicht reflektiert, sondern gebildet.127 Gemäß Methodenliteratur besteht nun die Aufgabe des Forschenden darin, möglichst alle Facetten des Konstruktes bei der Indikatorformulierung zu berücksichtigen128 oder anders ausgedrückt „omitting an indicator is omitting a part of the construct“129. Demnach sollen nun potenzielle Markenattribute auf Basis der Logistik- und Marketingliteratur identifiziert und als Indikatoren festgelegt werden.
Im Ergebnis der Literaturanalyse konnte keine konkrete und vollständige Auflistung der Markenattribute/-assoziationen bei Logistikdienstleistermarken bestimmt werden. Stattdessen wurden diverse Frameworks, Auflistungen als auch Operationalisierungen zu Markenassoziationen, Markenimage, Markenwissen oder Markenwert ermittelt, auf Basis derer sich Markenattribute für Logistikdienstleistermarken ableiten lassen. Den Arbeiten von Keller (1993) und Esch (1993) folgend wird das Markenwissen bekanntermaßen in die beiden Dimensionen Markenbekanntheit und Markenimage unterteilt. Dabei umfasst insbesondere das Markenimage sämtliche im semantischen Netzwerk repräsentierten und verknüpften Assoziationen einer Marke und wird unter anderem in die Typen von Markenassoziationen und Stärke der Markenassoziationen untergliedert.130 Angesichts dessen scheint es zweckmäßig zunächst die Operationalisierungen des Markenimages im Rahmen der Logistikforschung zu berücksichtigen, da hier direkte Rückschlüsse auf die Markenassoziationen bzw. -attribute zu ziehen sind. Beispielsweise operationalisieren Davis et al. (2008) das Markenimage anhand von fünf Indikatoren, die die Zuverlässigkeit, Leistungsfähigkeit, Qualitätsfähigkeit, Reputation und Unternehmenshistorie der Logistikdienstleister ausdrücken sollen.131 Aufgrund der inhaltlichen Relevanz des Messmodells als auch aufgrund dessen Anwendung im Logistikkontext, werden hieraus folgende Markenattribut-Indikatoren132 zur formativen Messung der Markensensibilität entnommen:
MSE MA 01
Zuverlässigkeit
MSE MA 02
Leistungsfähigkeit
MSE MA 03
Qualitätsfähigkeit
MSE MA 04
Reputation
MSE MA 05
Unternehmenshistorie
Darüber hinaus konnten in den Arbeiten von Bendixen et al. (2004), Leek und Christodoulides (2012), Syed Alwi et al. (2016), Jensen und Klastrup (2008), sowie Balmer et al. (2020) noch weitere relevante Markenattribute, wie zum Beispiel Innovationsfähigkeit, Vertrauenswürdigkeit oder Kooperationsfähigkeit, abgeleitet werden.133 Da sie eigene Facetten des Konstruktes darstellen und insofern keine maßgeblichen Überschneidungen zu den Indikatoren von Davis et al. (2008) ersichtlich waren, wurde das Messmodell folglich um jene sieben Indikatoren erweitert:
MSE MA 06
Preis
MSE MA 07
Innovationsfähigkeit
MSE MA 08
Vertrauenswürdigkeit
MSE MA 09
Kundenservice
MSE MA 10
Marktführerschaft
MSE MA 11
Kooperationsfähigkeit
MSE MA 12
Technologische Fähigkeiten
Aus den Interviewausschnitten in Kapitelabschnitt 1.1, unter Verweis auf die Arbeit von Rapp et al. (2023) wurde zudem deutlich, dass sich Logistikdienstleister zunehmend als ökologisch und sozial nachhaltig vermarkten wollen und basierend darauf anstreben eine Marke aufzubauen – sie beabsichtigen also die soziale und ökologische Nachhaltigkeit als Markenassoziation bei ihren Kunden zu etablieren. Außerdem erfährt die soziale und ökologische Nachhaltigkeit derzeit hohe theoretische als auch praktische Relevanz in der Logistik,134 weshalb ein weiterer Indikator formuliert wurde:
MSE MA 13
Soziale und ökologisch nachhaltige Orientierung
In der nachstehenden Tabelle 3.4 ist das neu-entwickelte, formative Messmodell der Markensensibilität – entsprechend den Anforderungen von Forschungsbedarf FB 2b – mit dem Begriffsverständnis und den Indikatorformulierungen zusammengefasst dargestellt.
Tabelle 3.4
Formatives Messmodell der Markensensibilität mit Markenattributen135
FB 2b: Indirekte Messung der Markensensibilität auf Individualebene anhand von Markenattributen.
Markensensibilität mit Markenattributen (MSE MA) – formative Messung
Begriffsverständnis
Die Markensensibilität beschreibt, inwiefern Beschaffungsmanager die Marken der Logistikdienstleister in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl berücksichtigen.
Allgemein gesprochen sind Beschaffungsmanager dann markensensibel, wenn sie die Marken der Logistikdienstleister in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl berücksichtigen.
3.1.3 Markenwichtigkeit – Die relative Wichtigkeit der Marke in der Auswahlentscheidung von Logistikdienstleistern
Im Sinne des Hypothesensystems und gemäß FB 1 soll die Markenwichtigkeit zunächst konzeptualisiert und anschließend kongruent operationalisiert werden.
Konstrukt-Konzeptualisierung
Wie bereits bei der Messmodellentwicklung der Markensensibilität angeschnitten, wurde die Markenwichtigkeit im organisationalen Kontext zunächst von Hutton (1997) eingeführt und später auch von Mudambi (2002) sowie Zablah et al. (2010) angewendet. Ihrem Verständnis nach drückt sich die Markenwichtigkeit in Relation zu anderen Selektionskriterien/Attributen aus.136 Sie ist damit, wie auch im Hypothesensystem modelliert, der Markensensibilität nachgelagert.137 In der wissenschaftlichen Literatur konnten kaum definitorische Anomalien für das Konstrukt selbst identifiziert werden, weshalb auf eine detaillierte Analyse unter Ableitung von Attributen verzichtet wird. Die eindeutigen inhaltlichen Überschneidungen zwischen der Markenwichtigkeit und der Markenrelevanz, wie sie bei Backhaus et al. (2011) zu finden ist, wurden wahrgenommen. Backhaus et al. (2011) stellen fest, dass die Markenrelevanz weitreichend angewendet wird und daher wenig verwunderlich selbst diverse Definitionen aufweist.138 Insofern muss der Markenrelevanz selber eine geringe Konsistenz unterstellt werden. Einen Ansatzpunkt zur Abgrenzung liefert wiederum Donnevert (2009). Ihm zufolge unterscheidet sich die Markenrelevanz von der Markenwichtigkeit hinsichtlich der Anspruchsgruppe – so gilt die Markenrelevanz für alle Konsumenten einer Produktgruppe, die Markenwichtigkeit nur für einen Konsumenten.139 Markensensibilität und Markenwichtigkeit werden folglich auf dieselbe Ebene gestellt,140 was eine gemeinsame Untersuchung der beiden Konstrukte unterstreicht. An dieser Stelle soll die in der organisationalen Forschung anerkannte Konstrukt-Definition der Markenwichtigkeit von Zablah et al. (2010) adaptiert werden:
Markenwichtigkeit beschreibt die relative Wichtigkeit, die Beschaffungsmanager der Marke als Kriterium in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl zuweisen.
Angesichts der Konstrukt-Definition wird eine Eindimensionalität des Konstruktes vertreten – die einzige Dimension bildet die relative Wichtigkeit der Marke. Sollten zur Bestimmung der relativen Wichtigkeit weitere Selektionskriterien in der Operationalisierung angeführt werden, so würden diese keine neue Dimension eröffnen, sondern lediglich zur Bestimmung des relativen Wertes der Marke beitragen. Ebenfalls wird die Eindimensionalität des Konstruktes in der einschlägigen Literatur unterstützt. Zwar wird beispielsweise bei Zablah et al. (2010) nicht explizit für eine Eindimensionalität argumentiert, jedoch wird diese durch die Konstrukt-Konzeptualisierung und – Operationalisierung impliziert.141
Konstrukt-Operationalisierung
Überwiegend werden in der wissenschaftlichen Literatur Konstantsummenskalen eingesetzt, um das Konstrukt der Markenwichtigkeit zu messen.142 Alternativ bietet es sich auch an, die Markenwichtigkeit mittels einer Conjoint-Analyse indirekt zu bestimmen.143 Beide Messungen eröffnen prinzipiell die Möglichkeit die Marke als Selektionskriterium, wie auch von der Konstrukt-Definition gefordert, im Vergleich zu anderen Kriterien zu beurteilen, was durch eine klassische Likert-Skala, wie sie zur Messung der Markensensibilität eingesetzt wird, nicht möglich wäre. Zwar scheint eine Anwendung einer Conjoint-Analyse aufgrund seiner impliziten Messung auf den ersten Blick zuverlässiger und präziser,144 jedoch muss aus forschungsmethodischer und konzeptioneller Sicht gegen dieses Vorgehen argumentiert werden. Erstens ist der Aufwand zur Bestimmung der Markenwichtigkeit mittels Conjoint-Analyse bedeutend größer, zweitens war es ein ausformuliertes Ziel von FB 1 auf ein anderes Datenanalyseverfahren als die Conjoint-Analyse zurückzugreifen und drittens ist eine Einbindung von Conjoint-Messungen in ein multivariates Analyseverfahren, wie z. B. die Strukturgleichungsmodellierung, grundsätzlich diskutabel. Freilich konnten Studien identifiziert werden, die eine Conjoint-Messung in ein Strukturgleichungsmodell integriert haben,145 allerdings würde eine Conjoint-Studie die Modellierung einer hypothetischen Auswahlentscheidung erfordern, was dem retrospektiven Charakter der vorliegenden Untersuchung146 entgegenstehen würde. In Summe der Argumente ist die Conjoint-Analyse folglich abzulehnen und es wird weiterhin auf die Konstantsummenskala, welche als Messansatz ebenfalls etabliert ist, zurückgegriffen.
Bei der Konstantsummenskala also werden die Respondenten aufgefordert, 100 Punkte zwischen verschiedenen Kriterien – eines dieser Kriterien stellt die Marke dar – zu verteilen. Als Markenwichtigkeit gilt dann lediglich die Punktzahl, die der Marke zugeordnet wird. In gleicher Wiese ließe sich potenziell auch die Wichtigkeit für die anderen Kriterien berechnen. Bei den Operationalisierungen der Markenwichtigkeit mittels Konstantsummenskala werden meistens fünf bzw. sechs unterschiedliche Kriterien abgefragt.147 Angesichts der Erkenntnisse von Miller (1956) zur kognitiven Belastung ist eine unverhältnismäßig hohe Anzahl an Selektionskriterien bei der Befragung zu vermeiden.148 Insofern sollen neben der Marke, die fünf am häufigsten gewählten Selektionskriterien abgefragt werden. Im Rahmen der Literaturanalyse konnten mehrere Studien, die Kriterien bei der Auswahl von Logistikdienstleistern untersuchen, identifiziert werden.149 Diese, aber insbesondere die Arbeit von Aguezzoul (2014), dienen folglich als Basis zur Ableitung alternativer Selektionskriterien für die komparative Messung der Markenwichtigkeit:150
MWI KS Marke
Marke (e.g. Reputation, Bekanntheitsgrad des Lieferanten, Unternehmenshistorie, gesellschaftliches Standing, Assoziationen, Loyalitätslevel)
MWI KS Kosten
Kosten (e.g. Preis, Kostenersparnisse, Fähigkeit zur Kostenreduktion)
MWI KS Techn.
Technologie (e.g. Innovativität, Kompatibilität, Aufrüstbarkeit, Tracking/Tracing-Systeme, Informationssicherheit)
MWI KS Qualität
Qualität (e.g. Commitment zu ständigen Verbesserungen, Einhalten von Standards, Risikomanagement)
MWI KS Services
Services (e.g. Charakteristiken/Spezialisierung von Services, Variabilität der angebotenen Services, Value-added-Services)
MWI KS Bezieh.
Beziehung zum Logistikdienstleister (e.g. Verlässlichkeit, Allianz, Kompatibilität, gegenseitiger Austausch)
In der nachstehenden Tabelle 3.5 ist das Messmodell der Markenwichtigkeit – entsprechend der Anforderungen von Forschungsbedarf FB 1 – mit dem Begriffsverständnis und den Indikatorformulierungen151 zusammengefasst dargestellt.
FB 1: Bestimmung der relativen Wichtigkeit der Marke als Selektionskriterium bei der strategischen Auswahl von Logistikdienstleistern – Messung der Markenwichtigkeit (Konstantsummenskala)
Markenwichtigkeit (MWI)
Begriffsverständnis
Die Markenwichtigkeit beschreibt die relative Wichtigkeit, die Beschaffungsmanager der Marke als Kriterium in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl zuweisen.
Bitte verteilen Sie 100 Punkte auf die folgenden Kriterien hinsichtlich ihrer relativen Bedeutung, die sie für Sie bei der strategischen LogistikDL-Auswahl gehabt haben. (Hinweis: Wenn Sie einem Kriterium mehr Punkte zuteilen als einem anderen, dann zeigen Sie damit, dass Ihnen das Kriterium relativ wichtiger war als das Kriterium mit weniger Punkten).
Indikatoren
MWI KS Marke
Marke (e.g. Reputation, Bekanntheitsgrad des Lieferanten, Unternehmenshistorie, gesellschaftliches Standing, Assoziationen, Loyalitätslevel)
MWI KS Kosten
Kosten (e.g. Preis, Kostenersparnisse, Fähigkeit zur Kostenreduktion)
MWI KS Techn.
Technologie (e.g. Innovativität, Kompatibilität, Aufrüstbarkeit, Tracking/Tracing-Systeme, Informationssicherheit)
MWI KS Qualität
Qualität (e.g. Commitment zu ständigen Verbesserungen, Einhalten von Standards, Risikomanagement)
MWI KS Services
Services (e.g. Charakteristiken/Spezialisierung von Services, Variabilität der angebotenen Services, Value-added-Services)
MWI KS Bezieh.
Beziehung zum Logistikdienstleister (e.g. Verlässlichkeit, Allianz, Kompatibilität, gegenseitiger Austausch)
Im Sinne des theoretisch hergeleiteten Hypothesensystems und unter Berücksichtigung vorangegangener Forschungsarbeiten, wird die „wahrgenommene Logistikdienstleistungskomplexität“ im Folgenden als latentes Konstrukt behandelt.153 Nachfolgend soll das Konstrukt daher in einem ersten Schritt konzeptualisiert und in einem zweiten Schritt mithilfe manifester Indikatoren operationalisiert werden.
Konstrukt-Konzeptualisierung
Bei einer Literaturrecherche im Bereich der Logistikforschung fällt auf, dass zwar auf den ersten Blick relevante Konzeptualisierungen für die wahrgenommene Logistikdienstleistungskomplexität existieren, diese jedoch nach einer detaillierten Analyse für ungeeignet befunden werden müssen (Tabelle 3.6). Beispielsweise entwickeln Rossiter Hofer und Knemeyer (2009) anknüpfend an der Arbeit von Rao und Young (1994) eine neue Skala zur Messung der Logistikkomplexität.154 Ihnen zufolge baut die Logistikkomplexität auf der Netzwerkkomplexität, der Prozesskomplexität und der Produktkomplexität auf.155 Kritisch für die vorliegende Untersuchung ist hierbei, dass die Logistikkomplexität durch die Inklusion der Netzwerkkomplexität und der Prozesskomplexität auf die Supply Chain ausgeweitet wird.156 Damit liegt der Fokus nicht mehr nur auf der Dienstleistung per se, wie für die vorliegende Studie intendiert. Vielmehr soll bei Rossiter Hofer und Knemeyer (2009) die Komplexität des unternehmensinternen Logistiksystems beschrieben werden: […] „reflect managerial perspectives of their firm’s logistics system“.157 Auch eine Verwendung der Logistikkomplexität-Definition von Wiedmer et al. (2021) scheint wenig zweckmäßig. Ihnen zufolge wird die Logistikkomplexität als „number of arcs in a supply network“ verstanden.158 Erneut wird also nicht, wie durch den Ansatz von Andersson und Norrman (2002) impliziert, der Komplexitätsgrad der Logistikdienstleistung beschrieben.
Auch der Forschungsstrang zur Supply Chain Komplexität ist durch verschiedene Begriffsverständnisse, Operationalisierungen und Analyseebenen charakterisiert.159 Schließlich lässt sich allein die Supply Chain Komplexität in drei Analyseebenen (internal, downstream, upstream) herunterbrechen, welche sich wiederum selbst in mehrere Dimensionen untergliedern lassen.160 So definieren Ateş und Luzzini (2023) beispielsweise die Supply Network Complexity (upstream) über die strukturelle Komplexität, die Interaktionskomplexität und die dynamische Komplexität.161 Auch innerhalb dieses Forschungsstrangs wurden nur begrenzt relevante Definitionen für die vorliegende Verwendung des Konstrukts wahrgenommene Logistikdienstleistungskomplexität identifiziert. Ursächlich hierfür scheint die Perspektive zu sein, aus der die Komplexität analysiert wird. Gemäß der Kategorisierung von Braun und Hadwich (2016) erörtern die oben angeführten Arbeiten das Management von Komplexität in Organisationen, Supply Chains und Logistiksystemen, wohingegen die vorliegende Studie zum Ziel hat, die Komplexität einer Dienstleistung aus der externen Perspektive der Kunden zu erfassen.162 Damit scheinen vor allem Studien zur Produktkomplexität163 aus der Beschaffungs- und Marketingforschung relevant zu sein, weshalb die Literaturanalyse sowohl um jene Beiträge als auch um grundlegende Arbeiten zur Komplexität erweitert wurde. Aus den gesammelten Begriffsverständnissen konnten zentrale Attribute für die Bestimmung der Konstrukt-Definition der wahrgenommenen Logistikdienstleistungskomplexität abgeleitet werden (Tabelle 3.6).
Tabelle 3.6
Begriffsauffassungen zur wahrgenommenen Logistikdienstleistungskomplexität und verwandter Konstrukte164
Konstrukt-Bezeichnung/ Quelle
Definition/Begriffsverständnis
Abgeleitete Attribute
Logistikkomplexität
„Logistics complexity“
Rossiter Hofer und Knemeyer (2009), S. 191
„[…] reflect managerial perspectives of their firm’s logistics system vis-a`-vis these three dimensions at a macro-level.”
Managementperspektive
Logistiksystem
Mehrdimensional
Marko-Ebene
„Logistics complexity“
Wiedmer et al. (2021), S. 337
„[…] the number of arcs in a supply network”
Anzahl der Bögen
Versorgungsnetz
„Komplexität einer Logistikleistung“
Kramer (2016), S. 41
„[…] kann demnach nach der Anzahl und die Unterschiedlichkeit der erbrachten Teilleistungen (Leistungskomplexität) sowie dem Ausmaß der dafür aufzuwenden Managementleistungen (Managementkomplexität) beschrieben werden.“
Anzahl der Teilaspekte
Unterschiedlichkeit der Teilaspekte
Ausmaß von Managementleistungen
“Advanced Logistics Services”
Andersson und Norrman (2002), S. 4
„What drives the degree of complexity are factors such as the number of services included (single or multiple bundled services); the tangibility of the service definition; whether focus is on handling or value adding; whether focus is on execution of activities or management; and whether the service is pre-defined and stable or if development and re-engineering is part of the scope.”
Anzahl der Teilaspekte
intangible Ergebnisanforderungen
Fokus auf Value-adding
Management
Entwicklung und Umgestaltung von Lösungen
Produkt-/Servicekomplexität
„Product complexity“
Homburg et al. (2011), S. 799
„[…] is defined as the degree to which specific expertise is necessary to be able to evaluate a supplier’s products.”
Notwendiges Expertenwissen
„Product Complexity“
Burnham et al. (2003), S. 112
„[…] is defined as the extent to which the consumer perceives a product to be difficult to understand or use. A product that offers a large number of options or that involves a large number of steps in its use will typically be seen as more complex.”
Individuelle Ebene
Schwer zu verstehen
mehrere Teilaspekte
mehrere Teilschritte
“Product/service complexity”
Stock (2005), S. 69
“[…] refers to the level of difficulty for the customer to understand a supplier’s product/service. […] this construct captures a customer’s difficulty in assessing the quality and the benefit of the product/service as well as the number and heterogeneity of the product/service components.”
Individuelle Ebene
Schwer zu verstehen
Schwierigkeit der Bewertung
Anzahl der Teilaspekte
Unterschiedlichkeit der Teilaspekte
„Perceived Service Complexity (PSC)“
Kostopoulos et al. (2019), S. 39
„[…] captures the difficulty to assimilate the service delivery process, as perceived by FLEs165.”
Schwer zu verstehen
Individuelle Ebene
„Perceived Service Complexity“
Mikolon et al. (2015), S. 514
„[…] can be defined as subjectively perceived difficulty in making sense of a service.”
Individuelle Ebene
Schwer zu verstehen
Allgemeine Komplexität
„Complexity“
Bode und Wagner (2015), S. 216
„[…] two defining qualities of complexity: structure and behavior. The former is often termed structural complexity (also static or detail complexity) and refers to the number and variety of elements defining the system. The latter is often called dynamic complexity (or operational complexity) and refers to the interactions between the elements of the system.”
Anzahl der Teilaspekte
Varietät der Teilaspekte
Interaktionen zwischen den Teilaspekten
„Complexity“
Simon (1962), S. 468
„[…] made up of a large number of parts that interact in a nonsimple way.”
Mehrere Teilaspekte
Interaktionen zwischen Teilaspekten
Erstens wird die Komplexität einer Dienstleistung (eines Produktes) dann wahrgenommen, wenn diese(s) schwierig zu verstehen ist166 und Expertenwissen zur vollständigen Erfassung und Evaluation notwendig wird.167 Zweitens entsteht die Komplexität Simon (1962) zufolge aus dem Vorhandensein mehrerer Teilaspekte und aus der Interaktion dieser.168 Dies greifen auch Bode und Wagner (2015) auf und ergänzen als dritte Ursache der Komplexität, die Varietät der Teilaspekte.169 Ebenfalls spiegeln sich in der Ableitung der Logistikdienstleistungskomplexität bei Kramer (2016) diese Ursachen wider. Während die Vielzahl und Unterschiedlichkeit der Teilleistungen die Leistungskomplexität beschreiben, eröffnet er mit der Managementkomplexität eine neue, zweite Dimension der Logistikkomplexität. Diese versteht er als das Ausmaß an Leistungen, die zum Management der Logistikdienstleistung notwendig sind.170
Im Vergleich zu den vorherigen Arbeiten zur Logistikkomplexität oder Supply Chain Komplexität zeigt sich der Unterschied maßgeblich in der Beschreibung über die notwendige Expertise zum Verstehen der Dienstleistung (des Produktes). Andererseits aber werden Ähnlichkeiten bei den Bestandteilen der Komplexität zwischen den verschiedenen Forschungssträngen und -disziplinen deutlich. So werden wiederholt die Anzahl und Varietät von Teilaspekten als jene Bestandteile oder Dimensionen diskutiert.171
Daher soll primär aus den abgeleiteten Attributen zur Produktkomplexität die folgende Konstrukt-Definition der wahrgenommenen Logistikdienstleistungskomplexität für das vorliegende Forschungsprojekt formuliert werden:
Wahrgenommene Logistikdienstleistungskomplexität beschreibt das Ausmaß, in dem die Beschaffungsmanager die nachgefragte Logistikdienstleistung als schwer zu verstehen oder zu verwenden wahrnehmen.
Demzufolge benötigen die Beschaffungsmanager bei komplexen Logistikdienstleistungen spezifische Expertise, um diese in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl adäquat bewerten zu können.
Dabei ergibt sich die Logistikdienstleistungs komplexität aus der Anzahl und Varietät der Teilleistungen.
Hinsichtlich der Dimensionalität der wahrgenommenen Logistikdienstleistungskomplexität sind beide Auffassungen vertretbar – sowohl eine Eindimensionalität als auch eine Mehrdimensionalität des Konstruktes. Die Mehrdimensionalität lässt sich über die Bestandteile/Ursachen der Komplexität argumentieren. Insofern können mit Bezug zur aufgestellten Konstrukt-Definition die zwei Dimensionen „Anzahl von Teilleistungen“ und „Varietät von Teilleistungen“ gebildet werden. Eine derartige mehrdimensionale Konzeptualisierung der Komplexität unterstützen beispielsweise Braun (2016), Braun und Hadwich (2016), Trattner et al. (2019) und Zou et al. (2019).172 Ebenso lässt sich aber auch für eine Eindimensionalität argumentieren. So stellt die Schwierigkeit zum Verstehen der Logistikdienstleistung die zentrale Dimension des Konstruktes dar. Das benötigte Expertenwissen eröffnet dagegen keine neue Dimension, sondern kann als alternative Ausdrucksform interpretiert werden. Eine eindimensionale Konzeptualisierung der Komplexität postulieren zum Beispiel Large (2008), Burnham et al. (2003), Heitmann et al. (2007) und Homburg et al. (2011).173 Da die erarbeitete Konstrukt-Definition maßgeblich die Eindimensionalität über die Schwierigkeit zum Verstehen der Logistikdienstleistungen widergibt, wird diese auch im Folgenden angenommen.
Konstrukt-Operationalisierung
Wie bereits im Rahmen der Konstrukt-Konzeptualisierung angedeutet, lassen sich kaum spezifische Konzeptualisierungen und Operationalisierung zur wahrgenommenen Logistikdienstleistungskomplexität finden. Daher sollen im Rahmen der Konstrukt-Operationalisierung auch jene der mit ihr verwandten Konstrukte aufgegriffen werden. Eine Übersicht der berücksichtigten Modelle zur Messung der wahrgenommenen Logistikdienstleistungskomplexität liefert Tabelle 3.7.
In der Vergangenheit wurden diverse Ansätze zur Messung der Komplexität in seinen verschiedenen Facetten vorgeschlagen – semantisches Differential, formative Multi-Item Messungen oder auch reflektive Multi-Item Messungen. Beispielsweise implementieren Cannon und Perreault (1999) als auch Cannon und Homburg (2001) für die Operationalisierung der „supply complexity“ ein semantisches Differenzial. Das heißt die Respondenten werden aufgefordert das zu betrachtende Produkt mit ihren üblichen zur Beschaffung stehenden Produkten anhand von vier Eigenschaftspaaren zu vergleichen.174 Eine alternative Anwendung des semantischen Differenzials für den spezifischen Fall der Logistikdienstleistungskomplexität ergibt sich aus der Gegenüberstellung von einfachen und erweiterten Logistikdienstleistungen bei Andersson und Norrman (2002).175 Mit Hilfe deren vorgeschlagenen fünf Charakteristiken hätte eine neue Operationalisierung der Logistikkomplexität mittels semantischen Differenzial umgesetzt werden können. Angesichts der Vielzahl an Operationalisierungen ist fraglich, inwiefern eine Neuentwicklung des Messmodells „wahrgenommene Logistikdienstleistungskomplexität“ über ein semantisches Differenzial gerechtfertigt ist. Darüber hinaus sieht sich der Forschende mit Unsicherheiten hinsichtlich der Validität und Reliabilität des neu-entwickelten Messmodells konfrontiert, weshalb ein solcher Ansatz für die vorliegende Arbeit nicht aufgegriffen wird.
Indessen misst Wallenburg (2009) die Logistikdienstleistungskomplexität über vordefinierte Logistikfunktionen (e.g. Reverse-Logistik oder Cross-Docking).176 Hieraus bildet er schließlich zwei Gruppen. Die erste Gruppe mit geringer Komplexität setzt sich überwiegend aus Transportdienstleistungen zusammen, während die zweite Gruppe mit hoher Komplexität maßgeblich eine Kombination von Transport- und Lagerhausdienstleistungen umfasst.177 Dieser Ansatz kann jedoch aus mehreren Aspekten kritisch gesehen werden. Zum einen erfolgt die Zuordnung der Logistikfunktionen zu den Komplexitäts-Gruppen ohne ausreichende Fundierung, zum anderen wird kein Grad der Logistikdienstleistungskomplexität erfasst. Ferner ist fraglich, ob bei der Abfrage der Logistikfunktionen tatsächlich alle potenziell nachzufragenden Logistikdienstleistungen aufgenommen werden können und inwiefern die Modellierung der Logistikdienstleistungskomplexität dann für nicht-abgefragte Logistikfunktionen generalisierbar ist.178 Auch wäre eine derartige Operationalisierung über die Aufzählung verschiedener Logistikfunktionen inhaltlich nicht mit der vorliegenden Konstrukt-Konzeptualisierung zu vereinbaren. Demzufolge wird ein solcher Ansatz für die vorliegende Arbeit nicht weiterverfolgt.
In der Logistikforschung präsentiert Large (2008) stattdessen ein eindimensionales, reflektives Modell zur Messung der Dienstleistungskomplexität.179 Hierin finden sich Ausdrucksformen zur Anzahl (B2) und Verschiedenartigkeit (B3) der Teilleistungen, zu den Koordinationskosten der Gesamt-Dienstleistung (B4) und zum Umfang der Dienstleistungsspezifikation (B5). Vervollständigt wird das Messmodell durch eine übergreifende Ausdrucksform der Komplexität (B1).180
Tabelle 3.7
Relevante Modelle zur Messung der wahrgenommenen Logistikdienstleistungskomplexität181
This 3pl-service consists of various partial services.
B3
This 3pl-service consists of diverse partial services.
B4
The coordination of these partial services is very costly.
B5
The definition of the service specification was extensive.
"supply complexity"
Cannon und Perreault (1999), S. 448
Semantisches Differential
Compared to other purchases your firm makes, this product is (respondents were asked to consider the main product your firm purchases from this supplier)
The number of people/organizations involved in the distribution process is very high.
F3
The number of people involved in the buying process is very high.
F4
Communication varies very much across different customer segments.
F5
Customer requirements vary a lot across different customer segments.
F6
There is a lot of variety in products for sale.
F7
There is a lot of variety in the type of people involved in the buying process.
F8
There are many people other than direct customers who must be influenced in order to sell.
Ebenfalls eine eindimensionale reflektive Operationalisierung nehmen Heitmann et al. (2007) und Homburg et al. (2011) für die Produktkomplexität vor. Allerdings greifen sie stärker auf Ausdrucksformen zur notwendigen Expertise für das Verständnis des Produktes (D1, D3, D4; E1-E4) zurück, welche bei Large (2008) vermisst wird.182 Insofern scheinen insbesondere diese beiden Messmodelle mit der vorliegenden Konstrukt-Definition konsistent zu sein, weshalb einem solchen Ansatz für die vorliegende Arbeit nachgegangen werden soll. Interessanterweise aber zeigen sich Überschneidungen in den Ausdrucksformen zwischen den als reflektiv spezifizierten Messmodellen von Large (2008) und Heitmann et al. (2007), und dem als formativ spezifizierten Messmodell von Stock (2005). Auch sie formuliert Indikatoren zur Erfassung der notwendigen Expertise, der Anzahl und Heterogenität der Teilaspekte und der übergreifenden Komplexität.183
Hinsichtlich der Messmodellspezifikation lässt sich also entsprechend der identifizierten Literatur prinzipiell für beide Ausprägungen – reflektiv und formativ – argumentieren. Im vorliegenden Fall wird allerdings den Arbeiten von Large (2008), Heitmann et al. (2007) und Homburg et al. (2011) gefolgt, wonach eine reflektive Konstruktauffassung vertreten wird. Dies ist auch im Einklang mit der vorher festgelegten Eindimensionalität des Konstruktes. Demnach erfolgt nun in einem nächsten Schritt die Formulierung der Indikatoren für das eindimensionale reflektive Messmodell der wahrgenommenen Logistikdienstleistungskomplexität in Übereinstimmung mit der erarbeiteten Konstrukt-Definition. Aus den Messmodellen von Heitmann et al. (2007) und Large (2008) werden insgesamt sieben Indikatoren entnommen und unter sprachlichen und kontextbedingten Anpassungen ins Deutsche übersetzt.184 Von Heitmann et al. (2007) werden Indikatoren zum Ausdruck der notwendigen Expertise, dem spezifischen Fachwissen, der Schwierigkeit des Verständnisses, der Anzahl der Teilleistungen und der Kompliziertheit formuliert:
WLK 01
Die Inhalte der Logistikdienstleistung waren schwierig zu verstehen.
WLK 02
Die Logistikdienstleistung bestand aus mehreren Teilleistungen.
WLK 03
Ich hatte das Gefühl, dass eine Person, die diese Art von Logistikdienstleistung verkauft, über sehr spezifisches Wissen verfügen muss, um einen guten Job machen zu können.
WLK 04
Die Logistikdienstleistung war ohne Expertise schwierig zu bewerten.
WLK 05
Ich hatte das Gefühl, dass diese Art von Logistikdienstleistung von Natur aus kompliziert ist.
Ergänzt werden diese durch zwei Indikatoren von Large (2008). Zum einen wird die Anzahl der Teilleistungen, wie sie bei Heitmann et al. (2007) zu finden ist, gemäß der Konstrukt-Definition um einen Indikator zum Ausdruck der Varietät der Teilleistungen erweitert. Zum anderen wird ein übergreifender Indikator zum Ausdruck der Komplexität verwendet:
WLK 06
Die Logistikdienstleistung bestand aus unterschiedlichen Teilleistungen.
WLK 07
Ich hatte das Gefühl, dass diese Art von Logistikdienstleistung von Natur aus komplex ist.
In der nachstehenden Tabelle 3.8 ist das Messmodell der wahrgenommenen Logistikdienstleistungskomplexität mit dem Begriffsverständnis, den Indikatorformulierungen und den Individualverweisen zu den Indikatoren zusammengefasst dargestellt.
Tabelle 3.8
Messmodell der wahrgenommenen Logistikdienstleistungskomplexität185
Die wahrgenommene Logistikdienstleistungskomplexität beschreibt das Ausmaß, in dem die Beschaffungsmanager die nachgefragte Logistikdienstleistung als schwer zu verstehen oder zu verwenden wahrnehmen.
Demzufolge benötigen die Beschaffungsmanager bei komplexen Logistikdienstleistungen spezifische Expertise, um diese in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl adäquat bewerten zu können.
Dabei ergibt sich die Logistikdienstleistungskomplexität aus der Anzahl und Varietät der Teilleistungen.
Eigenschaft
Eindimensional, reflektiv, Likert-Skala
Skala
1 = „Trifft gar nicht zu“; 7 = „Trifft voll zu“
Indikatoren
WLK 01
Die Inhalte der Logistikdienstleistung waren schwierig zu verstehen.
D1 – Heitmann et al. (2007)
WLK 02
Die Logistikdienstleistung bestand aus mehreren Teilleistungen.
D2 – Heitmann et al. (2007)
B2 – Large (2008)
WLK 03
Ich hatte das Gefühl, dass eine Person, die diese Art von Logistikdienstleistung verkauft, über sehr spezifisches Wissen verfügen muss, um einen guten Job machen zu können.
D3 – Heitmann et al. (2007)
WLK 04
Die Logistikdienstleistung war ohne Expertise schwierig zu bewerten.
D4 – Heitmann et al. (2007)
WLK 05
Ich hatte das Gefühl, dass diese Art von Logistikdienstleistung von Natur aus kompliziert ist.
D5 – Heitmann et al. (2007)
WLK 06
Die Logistikdienstleistung bestand aus unterschiedlichen Teilleistungen.
B3 – Large (2008)
WLK 07
Ich hatte das Gefühl, dass diese Art von Logistikdienstleistung von Natur aus komplex ist.
B1 – Large (2008)
3.1.5 Wahrgenommene Informationsüberflutung
Im Sinne des theoretisch hergeleiteten Hypothesensystems und unter Berücksichtigung vorangegangener Forschungsarbeiten wird die „wahrgenommene Informationsüberflutung“ im Folgenden als latentes Konstrukt behandelt.186 Insofern soll das latente Konstrukt in einem ersten Schritt konzeptualisiert und in einem zweiten Schritt mithilfe manifester Indikatoren operationalisiert werden.
Konstrukt-Konzeptualisierung
Seinen wissenschaftlichen Ursprung hat das Konzept der Informationsüberflutung in der Arbeit von Miller (1956).187 Durch die Studien von Jacoby et al. (1974b), Jacoby et al. (1974a) nahm es später schließlich seinen Einzug in die Konsumentenforschung,188 während parallel Galbraith (1974) und Tushman und Nadler (1978) die Grundlagen für die Organisationsforschung legten. Die Literatur zur Informationsüberflutung ist mittlerweile durch mehrere Forschungsdisziplinen (bspw. Accounting, Psychologie, Organisationsforschung, Konsumentenforschung)189, einem uneinheitlichen Verständnis190, alternativen Begriffen (bspw. infobesity, data smog, information axiety, cognitve overload)191 und diversen Analyseebenen (bspw. individuell, organisational) geprägt. Um also eine für die vorliegende Arbeit gültige Konstrukt-Definition der wahrgenommenen Informationsüberflutung erarbeiten zu können, werden aus den verschiedenen Begriffsverständnissen zentrale Attribute abgeleitet (Tabelle 3.9) und hinsichtlich Konsistenz und Abgrenzbarkeit überprüft.
Tabelle 3.9
Begriffsauffassungen zur Informationsüberflutung und verwandter Konstrukte192
Konstrukt-Bezeichnung/ Quelle
Definition/Begriffsverständnis
Abgeleitete Attribute
Individuelle Ebene
„information overload“
Roetzel (2019), S. 484
„Information overload is a state in which a decision maker faces a set of information […] comprising the accumulation of individual informational cues of differing size and complexity that inhibit the decision maker’s ability to optimally determine the best possible decision.“
Zustand
Individuelle Ebene
Entscheidung
hohe Anzahl an Informationen
Entscheidungsfähigkeit
„information overload“
Bawden und Robinson (2009), S. 182 f.
„[…] represent a state of affairs where an individual’sefficiency in using information in their work is hampered by the amount of relevant, and potentially useful, information available to them.“
Zustand
Individuelle Ebene
Arbeit
Hohe Anzahl an Informationen
Effizienz in der Informationsnutzung
„information overload“
Jacoby et al. (1974b), S. 63
„[…] there are finite limits to the ability of human beings to assimilate and process information during any given unit of time, and that once these limits are surpassed, behavior tends to become confused and dysfunctional.“
Beschränkungen der Informationsverarbeitung
Individuelle Ebene
Verwirrtes und dysfunktionales Verhalten
„information overload“
Malhotra et al. (1982), S. 27
„The information load paradigm is based on the proposition that consumers have finite limits to the amount of information they can assimilate and process during any given unit of time. If these limits are exceeded, overload occurs and consumers become confused and make poorer decisions.“
Beschränkungen der Informationsverarbeitung
Individuelle Ebene
Entscheidung
Hohe Anzahl an Informationen
Verwirrtes Verhalten
Entscheidungsfähigkeit
Organisationale Ebene
„information overload“
Schneider (1987), S. 144
„Overload is defined as a condition in which the information-processing requirementsexceed the information-processing mechanisms available so that the organization is unable to adequately process information.“
Zustand
Anforderungen an die Informationsverarbeitung > Informationsverarbeitungskapazität
Organisationale Ebene
Unfähigkeit der Informationsverarbeitung
„organizational effectiveness“
Tushman und Nadler (1978), S. 622
„[…] associated with the fit or match between the information processing requirements facing an organization (and its subunits) and the information processing capacity of its structure.“
Anforderungen an die Informationsverarbeitung > Informationsverarbeitungskapazität
Organisationale Ebene
Verwandte Konzepte
„information anxiety“
Bawden und Robinson (2009), S. 185
„[…] to be a condition of stress caused by the inability to access, understand, or make use of, necessary information.“
Zustand
Stress
Unfähigkeit der Informationssuche, -verständnis, -nutzung
„cognitive overload“
Mayer und Moreno (2003), S. 45
„A potential problem is that the processing demands evoked by the learning task may exceed the processing capacity of the cognitive system […].“
Verarbeitungsanforderung > Verarbeitungskapazität
Lernaufgabe
Erstens soll die wahrgenommene Informationsüberflutung im Sinne der Konzeption der vorliegenden Studie auf der individuellen Ebene193 und nicht wie bei Schneider (1987) oder Tushman und Nadler (1978) auf der organisationalen Ebene verortet werden. Dies wurde bereits mit der Ergänzung des Wortes „wahrgenommen“ in Kapitelabschnitt 2.3.1 initiiert. Inhaltlich wird die Informationsüberflutung häufig als ein Zustand, bei dem Individuen zu vielen Informationen ausgesetzt sind, beschrieben.194 Andere, teils präzisere Ausdrucksformen hierfür liegen im Vergleich zwischen Anforderungen und Verarbeitungskapazität,195 sowie im Hervorheben des Informationsverarbeitungslimits.196 Des Weiteren verweisen einige der Definitionsansätze auf die Auswirkungen einer Informationsüberflutung. Diesbezüglich werden exemplarisch die Entscheidungs-197, die Informationsverarbeitungsfähigkeit198 sowie ein dysfunktionales, verwirrtes Verhalten199 angeführt. Die Definitionen liefern darüber hinaus Hinweise dafür, in welchen Situationen eine subjektive Informationsüberflutung auftritt. In den meisten Fällen wird sie allgemeingültig in Entscheidungssituationen,200 teils spezifischer in Arbeitssituationen,201 verankert. In Ergänzung des Wissens um die Einflussfaktoren der Informationsüberflutung,202 kann daher davon ausgegangen werden, dass das Konstrukt situationsabhängig ist und von den Kontextfaktoren der Entscheidung beeinflusst wird.
Neben den Definitionen des fokalen Konstruktes, sollten auch verwandte Konstrukte mit einem ähnlichen Verständnis als Ergebnis der Literaturrecherche identifiziert und wenn möglich abgegrenzt werden. Nach Bawden und Robinson (2009) lässt sich die „information anxiety“ als Konsequenz der Informationsüberflutung einordnen, wodurch deren psychologische Folgen – ausgedrückt in Angst und Stress – erfasst werden.203 Jedoch ist es nicht unüblich, dass auch die Informationsüberflutung über Gefühlszustände definiert wird. Ersichtlich wird dies exemplarisch anhand der Studie von Hunter (2004). Hierin umfasst die Informationsüberflutung zwei Dimensionen. Zum einen die Affekt- und zum anderen die Fehler-Dimension. So werden im Rahmen der Affekt-Dimension eben jene psychologischen Folgen, wie Frustration, zum Ausdruck gebracht.204 Auch Gefühle der Überwältigung oder der kognitiven Überlastung werden häufig im Zusammenhang mit der Definition der Informationsüberflutung angeführt.205 Es muss also eingestanden werden, dass bei der Konzeptualisierung einer subjektiven Informationsüberflutung auch Gefühlszustände, wie Überwältigung oder Frustration, einen Sachverhalt des Konstruktes darstellen. Sie sind demnach als mit der Informationsüberflutung einhergehende Ausdrucksformen der Wahrnehmung zu verstehen. Konkrete, eigenständige psychologische Folgen, wie Stress oder Angst, sollen jedoch weiterhin Sachverhalte der information anxiety darstellen. Schwieriger gestaltet sich die Abgrenzung zu Konstrukten, wie „cognitive overload“. Denn auch die kognitive Überflutung wird inhaltlich über einen Vergleich zwischen Verarbeitungsanforderung und Verarbeitungskapazität definiert.206 Der Unterschied zur Informationsüberflutung besteht also einzig in der Spezifikation des Kriteriums hinsichtlich welchem die Individuen überflutet werden.
Aus der Analyse der Attribute und der verwandten Konstrukte, soll die folgende Konstrukt-Definition der wahrgenommenen Informationsüberflutung für das vorliegende Forschungsprojekt formuliert werden:
Wahrgenommene Informationsüberflutung beschreibt das Ausmaß in dem Beschaffungsmanager in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl durch die Anzahl an Informationen überwältigt werden.
Informationsüberflutung wird dann wahrgenommen, wenn zu viele Informationen zur Verfügung stehen und aufgrund der begrenzten Informationsverarbeitungskapazität nicht vollständig erfasst werden können.
Wahrgenommene Informationsüberflutung ist situationsgebunden und ändert sich mit den Kontextfaktoren der (organisationalen) strategischen Logistikdienstleisterauswahl.
Bezüglich der Dimensionalität der wahrgenommenen Informationsüberflutung wird für eine eindimensionale Auffassung argumentiert. Im Rahmen dessen soll zunächst herausgearbeitet werden, warum eine Mehrdimensionalität des Konstruktes abgelehnt werden sollte. Nach Hunter (2004) und Hunter und Goebel (2008) bildet die Informationsüberflutung ein Second-Order Konstrukt mit den beiden Dimensionen „Affekt“ und „Fehler“.207 Allerdings spiegeln sich diese beiden Dimensionen nicht in der vorliegenden Konstrukt-Definition wieder – insbesondere die Dimension „Fehler“ ist nicht Bestandteil des Begriffsverständnisses. Hingegen modellieren Özkan und Tolon (2015) die Informationsüberflutung in ihrem Strukturgleichungsmodell über die vier Dimensionen: „information quality“, „information quantitiy“, information processing capacity“, „available time“.208 Wie aber die Autoren selbst festhalten handelt es sich bei den Dimensionen vielmehr um Ursachen der Informationsüberflutung.209 Demnach kann hinterfragt werden, ob die vier Dimensionen tatsächlich Bestandteile der Informationsüberflutung, oder doch eher vorgelagerte Einflussfaktoren widerspiegeln. Ferner konnten Chen et al. (2009) basierend auf einer explorativen Faktorenanalyse zwei Dimensionen der Informationsüberflutung bestimmen. Der erste Faktor reflektiert den Sachverhalt zu vieler Informationen. Der zweite Faktor dagegen erfasst die Angemessenheit der Informationen. Mit dem Fortschreiten ihrer Untersuchung gaben sie jedoch die Zweidimensionalität des Konstruktes auf und definierten den wahrgenommenen Informationsüberfluss fortan nur noch über die Dimension „too much information“. Der zweite Faktor wurde aufgrund der Erkenntnisse der konfirmatorischen Faktorenanalyse ausgeschlossen.210 Schlussendlich kann festgehalten werden, dass sich die Informationsüberflutung zwar prinzipiell mehrdimensional konzeptualisieren lässt, dies aber stets zu kritisieren ist. Gleichzeitig muss die Mehrdimensionalität aufgrund der in der vorliegenden Konstrukt-Definition aufgegriffenen Sachverhalte abgelehnt werden. Weder durch die Überwältigung aufgrund der Anzahl der Informationen noch durch die begrenzte Informationsverarbeitungskapazität oder die vollständige Erfassung wird eine neue, eigenständige Dimension begründet. Stattdessen lässt sich argumentieren, dass diese drei Sachverhalte aufgrund ihrer inhaltlichen Dependenzen gemeinsam als Informationsüberflutung wirken. Auch sind in der Literatur mehrere eindimensionale Konzeptualisierungen zu finden,211 weshalb schließlich die Eindimensionalität der wahrgenommenen Informationsüberflutung für zweckmäßig befunden wird.
Konstrukt-Operationalisierung
Dem interdisziplinären Charakter der wahrgenommenen Informationsüberflutung geschuldet, liegen verschiedene Messansätzen zur kritischen Beurteilung vor. Eine Übersicht verschiedener Operationalisierungen liefert Tabelle 3.10. Nach O'Reilly (1980) und Klausegger et al. (2007) kann grundsätzlich zwischen einer objektiven und subjektiven Informationsüberflutung differenziert werden.212 In Abhängigkeit davon sollten auch die Operationalisierungen gewählt werden. Gemäß dem vorliegenden Begriffsverständnis bzw. dessen Bezeichnung („wahrgenommene […]“) sind vorrangig subjektive Messungen der Informationsüberflutung relevant, weshalb einer Abwägung zwischen verschiedenen Single-Item und Multi-Item Messungen nachgegangen werden soll.
Eine Single-Item Messung setzen beispielsweise Roberts und O'Reilly (1974) ein. Mit dem globalen Indikator wird auf den Vergleich zwischen Informationsmenge und -verarbeitungskapazität referenziert (B1).213 Eine vergleichbare Formulierung des Indikators findet sich Jahre später auch in der Multi-Item Messung von O'Reilly (1980) (C2). Zudem stellen die beiden anderen Indikatoren alternative Ausdrucksformen dieses Vergleiches dar (C1, C3).214 Eine im Gesundheitsmanagement populäre Operationalisierung der Informationsüberflutung geht auf Jensen et al. (2014) zurück. Die sogenannte „cancer information overload“-Skala bezieht sich dabei nicht nur auf den Vergleich zwischen Informationsmenge/-anforderung und -verarbeitungskapazität, sondern verwendet beispielsweise Ausdrucksformen der zeitlichen Restriktion (D2), der Gleichgültigkeit gegenüber neuen Informationen (D3), oder des Vergessens von Informationen (D6). Darüber hinaus wird ein übergreifender Indikator formuliert (D8).215 Adaptiert wurde die Skala auch bereits im Kontext der Corona-Pandemie, als „COVID-19 information overload“.216 Eine weitere Multi-Item Messung präsentiert die Arbeit von Li (2017). Die Skala der Informationsüberflutung wurde hier ursprünglich für die Untersuchung des Online-Konsumentenverhaltens entwickelt und drückt sich durch die Schwierigkeit der Informationserfassung (E1), die Überwältigung aufgrund der Informationsmenge (E2), die Unsicherheit hinsichtlich der eigenen Informationsbedürfnisse (E3), die Ungewissheit über die Informationsbeschaffung (E4), sowie durch die Auswertungsprobleme aufgrund der Informationsmenge (E5) aus.217 Hierin offenbaren sich deutliche Überschneidungen zum vorliegenden Konstrukt-Verständnis – insbesondere den Indikatoren E1, E2 und E5 ist eine angemessene Reflektion der in der Definition aufgeführten Sachverhalte zu bescheinigen. Vergleichbare Statements bietet auch Heitmann et al. (2007) für ihr Messmodell, allerdings mit der Einschränkung, dass hier eine Überflutung durch die Anzahl an verfügbaren Produkten und nicht Informationen thematisiert wird.218 Schließlich soll aufgrund der grundsätzlichen Bevorzugung von Multi-Item Messungen gegenüber Single-Item Messungen im Falle latenter Konstrukte, im Folgenden die wahrgenommene Informationsüberflutung, nach dem Vorbild von Li (2017), mittels mehrerer Likert-skalierter Indikatoren operationalisiert werden.
Tabelle 3.10
Relevante Modelle zur Messung der wahrgenommenen Informationsüberflutung219
Konstrukt-Bezeichnung/ Quelle
Eigenschaften
Indikatoren
„information overload“
Hunter (2004), S. 100; Hunter und Goebel (2008), S. 27
In a typical work week, approximately how often do you have less than the amount of information you could consistently handle for making the best possible work-related decision?
C2
Sometimes at work you may receive more information than you can efficiently use. At other times, however, you may feel that you are not receiving all the information you need. How often during a week would you say that this lack of information arises.
C3
Is the total amount of information you receive in a typical work week enough to meet the information requirements of your job?
There were so many brands to choose from that I felt confused.
F2
The more I learned about these products, the harder it seemes to chosse the best.
F3
It was difficult to obtain an overview over the products offered.
F4
With that many options to choose between, I have had a hard time identifying distinguishing product characteristics.
F5
With that many options to choose between, I found it difficult to compare competing offers.
Gemäß der Eindimensionalität des Konstruktes wird eine reflektive Spezifikation des Messmodells angenommen. Damit entspricht die vorliegende Spezifikation auch jener von Li (2017).220 Darüber hinaus hat sich insgesamt gezeigt, dass die Messmodelle zur Informationsüberflutung überwiegend reflektiv spezifiziert wurden.221 Demnach erfolgt nun im nächsten Schritt die Formulierung der Indikatoren für das eindimensionale reflektive Messmodell der wahrgenommenen Informationsüberflutung.
Da das Messmodell von Li (2017) deutliche inhaltliche Überschneidungen zu der vorliegenden Konstrukt-Definition offenbart, ebenfalls als „wahrgenommene Informationsüberflutung“ betitelt und darüber hinaus insgesamt gute Reliabilitätswerte aufweist,222 werden hieraus fünf Indikatoren entnommen und unter sprachlichen und kontextbedingten Anpassungen ins Deutsche übersetzt.
WIÜ 01
Ich hatte das Gefühl, dass es schwierig ist, alle Informationen zur strategischen LogistikDL-Auswahl zu erfassen.
WIÜ 02
Es gab zu viele Informationen zur strategischen LogistikDL-Auswahl; ich fühlte mich dadurch belastet.
WIÜ 03
Ich war unsicher, ob die Informationen zur strategischen LogistikDL-Auswahl meinen Bedürfnissen zum Treffen einer Entscheidung entsprachen.
WIÜ 04
Ich hatte keine Ahnung, wo ich die benötigten Informationen zur strategischen LogistikDL-Auswahl finden kann.
WIÜ 05
Zur strategischen LogistikDL-Auswahl gab es mehr Informationen, als ich auf Anhieb hätte interpretieren können.
In der nachstehenden Tabelle 3.11 ist das Messmodell der wahrgenommenen Informationsüberflutung mit dem Begriffsverständnis, den Indikatorformulierungen und den Individualverweisen zu den Indikatoren zusammengefasst dargestellt.
Tabelle 3.11
Messmodell der wahrgenommenen Informationsüberflutung223
Wahrgenommene Informationsüberflutung (WIÜ)
Begriffsverständnis
Die wahrgenommene Informationsüberflutung beschreibt das Ausmaß in dem Beschaffungsmanager in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl durch die Anzahl an Informationen überwältigt werden.
Informationsüberflutung wird dann wahrgenommen, wenn zu viele Informationen zur Verfügung stehen und aufgrund der begrenzten Informationsverarbeitungskapazität nicht vollständig erfasst werden können.
Wahrgenommene Informationsüberflutung ist situationsgebunden und ändert sich mit den Kontextfaktoren der (organisationalen) strategischen Logistikdienstleisterauswahl.
Eigenschaft
Eindimensional, reflektiv, Likert-Skala
Skala
1 = „Trifft gar nicht zu“; 7 = „Trifft voll zu“
Indikatoren
WIÜ 01
Ich hatte das Gefühl, dass es schwierig ist, alle Informationen zur strategischen LogistikDL-Auswahl zu erfassen.
E1 – Li (2017)
WIÜ 02
Es gab zu viele Informationen zur strategischen LogistikDL-Auswahl; ich fühlte mich dadurch belastet.
E2 – Li (2017)
WIÜ 03
Ich war unsicher, ob die Informationen zur strategischen LogistikDL-Auswahl meinen Bedürfnissen zum Treffen einer Entscheidung entsprachen.
E3 – Li (2017)
WIÜ 04
Ich hatte keine Ahnung, wo ich die benötigten Informationen zur strategischen LogistikDL-Auswahl finden kann.
E4 – Li (2017)
WIÜ 05
Zur strategischen LogistikDL-Auswahl gab es mehr Informationen, als ich auf Anhieb hätte interpretieren können.
E5 – Li (2017)
3.1.6 Wahrgenommenes Risiko
Im Sinne des theoretisch hergeleiteten Hypothesensystems und unter Berücksichtigung vorangegangener Forschungsarbeiten wird das „wahrgenommene Risiko“ im Folgenden als latentes Konstrukt behandelt.224 Insofern soll das latente Konstrukt in einem ersten Schritt konzeptualisiert und in einem zweiten Schritt mithilfe manifester Indikatoren operationalisiert werden.
Konstrukt-Konzeptualisierung
Das wahrgenommene Risiko hat in der Konsumentenforschung225 eine lange Tradition.226 Aufmerksamkeit erlangte das Konzept ursprünglich durch die Arbeiten von Bauer (1960), Cox und Rich (1964), Cox (1967a) und Bettman (1973). Im Zeitverlauf wurde das Konzept dann von mehreren Fachbereichen der betriebswirtschaftlichen Forschung – hierunter Beschaffungsmanagement,227 strategisches Management228 und Finance229 – adaptiert. Nicht nur aufgrund seiner mannigfaltigen Berücksichtigung, sondern insbesondere aufgrund seiner Latenz („risk means different things to different people“230) und dem daraus resultierenden Mangel an definitorischem Konsens, wird das wahrgenommene Risiko in der Literatur auch als „fuzzy concept“ umschrieben.231 Um also eine für die vorliegende Arbeit gültige Konstrukt-Definition des wahrgenommenen Risikos festlegen zu können, werden aus den verschiedenen Begriffsverständnissen zunächst zentrale Attribute abgeleitet (Tabelle 3.12) und anschließend hinsichtlich Konsistenz und Abgrenzbarkeit überprüft.
Tabelle 3.12
Begriffsauffassungen zum wahrgenommenen Risiko und verwandter Konstrukte232
Konstrukt-Bezeichnung/ Quelle
Definition/Begriffsverständnis
Abgeleitete Attribute
Konsumentenforschung
„perceived risk“
Conchar (2004), S. 422
„A consumer’simportance-weighted subjective assessment of the expected value of inherent risk in each of the possible choice alternatives for a given decision goal.”
Individuelle Ebene
Gewichtete Bewertung
Erwartungswert Risiko
Alternativen zur Wahl
Entscheidung
„perceived risk”
Dowling und Staelin (1994), S. 119
„[…] defines risk in terms of the consumer'sperceptions of the uncertainty and adverse consequences of buying a product (or service).
Individuelle Ebene
Unsicherheit
Nachteilige Konsequenz
Kaufentscheidung
„perceived risk”
Stone und Grønhaug (1993), S. 42
„[…] a subjective expectation of loss.”
Individuelle Ebene
Erwartung von Verlust
Organisationale Forschung
„perceived risk”
Sitkin und Pablo (1992), S. 12
„[…] as a decision maker's assessment of the risk inherent in a situation.”
Individuelle Ebene
Entscheidung
Situationsbezogen
„perceived risk“
Hawes und Barnhouse (1987), S. 287
„[…] is the anxiety or stress that is recognized by the individuals who are involved in making the buying decision.“
Angst/Stress
Individuelle Ebene
Beschaffungsentscheidung
“perceived risk”
Kohli (1989), S. 55
„[…] refers to the riskiness of a decision as perceived by buying centermembers. Perceived risk comprises two dimensions, the importance of the decision and the uncertainty about the outcome of the decision.”
Entscheidung
Individuelle Ebene
Wichtigkeit der Entscheidung
Unsicherheit des Ergebnisses
Verwandte Konzepte
„uncertainty”
Kohli (1989), S. 55
„Uncertainty is a psychological state that results primarily from a lack of adequate information or knowledge.”
Psychologischer Zustand
Mangel an Informationen/Wissen
„risk propensity”
Sitkin und Pablo (1992), S. 12
„[…] the tendency of a decision maker either to take or to avoid risks.“
Individuelle Ebene
Tendenz
eingehen/vermeiden
Risiken allgemein
Erstens wird das wahrgenommene Risiko sowohl in der Konsumenten- als auch in der organisationalen Forschung auf individueller Ebene konzeptualisiert. Das Risiko wird also beispielsweise vom Entscheider, Konsument oder Beschaffungsmanager wahrgenommen und ist daher stets subjektiv.233 Zweitens entsteht das wahrgenommene Risiko typischerweise in Entscheidungssituationen, wie in Konsumentscheidungen, Beschaffungs- oder Lieferantenauswahlentscheidungen.234 Drittens wird dem wahrgenommenen Risiko eine Situationsabhängigkeit unterstellt. Demnach verändert sich das Ausmaß des wahrgenommenen Risikos mit den Kontextfaktoren der jeweiligen Entscheidungssituation.235 Während sich die Literatur bei diesen Attributen des wahrgenommenen Risikos weitestgehend einig zeigt, herrscht indessen eine Kontroverse um den eigentlichen Inhalt des Konstruktes. Häufig wird angeführt, dass sich das wahrgenommene Risiko aus den beiden Komponenten „Konsequenzen“ und „Unsicherheit“ zusammensetzt. Ein Individuum nimmt also dann Risiko wahr, wenn die Wahrscheinlichkeit für negative Konsequenzen (Unsicherheit) und die Wichtigkeit eines Verlustes (Konsequenzen) hoch sind.236 Insofern wird das wahrgenommene Risiko maßgeblich über die subjektive Einschätzung der der Entscheidungssituation inhärenten Bedingungen (i.e. Konsequenzen, Unsicherheit) determiniert. Allerdings gibt es unterschiedliche Auffassungen für die beiden Komponenten – vor allem für die Komponente der Konsequenzen.237 Aus der Kritik an der Zwei-Komponenten Konzeptualisierung definieren schließlich Stone und Grønhaug (1993) und daraufhin Sweeney et al. (1999) das wahrgenommene Risiko lediglich als „subjective expectation of loss“.238 Mithilfe dieser Definition soll der „Expactancy Value“ Aspekt des Risikos betont werden.239 Aus der Definition leiten die Autoren verschiedene Verlustarten ab, die bereits zuvor und fortwährend als Dimensionen des Risikos bekannt sind.240 So unterscheiden Stone und Grønhaug (1993) zwischen dem finanziellen, sozialen, zeitlichen, leistungsbezogenen, physischen und psychologischen Risiko.241 Allerdings finden sich auch Abwandlungen hiervon, wie exemplarisch bei Mitchell et al. (2003), die nur drei Dimensionen242 bestimmen243 – hierunter die von Newall (1977) eingeführte psychosoziale Dimension des Risikos.244 Einen anderen Ansatz der Definition wählen Hawes und Barnhouse (1987) im Kontext der organisationalen Beschaffung. Sie bestimmen das wahrgenommene Risiko über die Angst und den Stress, den die Individuen bei der Wahrnehmung des Risikos erfahren245 – es werden also subjektiv empfundene Ausdrucksformen des wahrgenommenen Risikos in den Vordergrund gestellt. Für die vorliegende Arbeit beschreibt das wahrgenommene Risiko demnach das Ausmaß, in dem Beschaffungsmanager in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl Angst oder Stress erfahren.
Neben den Definitionen des fokalen Konstruktes, sollten auch verwandte Konstrukte mit einem dem wahrgenommenen Risiko ähnlichen Verständnis als Ergebnis der Literaturrecherche identifiziert werden. Obwohl die Unsicherheit eigentlich als Komponente des wahrgenommenen Risikos verstanden wird, ist es in der Konsumentenforschung nicht unüblich, dass Risiko und Unsicherheit auch synonym verwendet werden.246 Dies ist darauf zurückzuführen, dass eine klare Abgrenzung zwischen den beiden Konstrukten oftmals schwerfällt. Dies wird beispielsweise anhand der Definition von Kohli (1989) offenkundig. Demnach entsteht Unsicherheit aus einem Mangel an Informationen und Wissen.247 Zwar ist dieses Attribut nicht direkt aus den Definitionen des wahrgenommenen Risikos zu entnehmen, jedoch argumentiert die Risikoforschung ebenfalls anhand der Informationsversorgung, nämlich derart, dass das wahrgenommene Risiko durch Informationssuche reduziert werden kann.248 Gemäß der Definition von Kohli (1989) allerdings ist dies eine vereinfachte Argumentation und lässt außer Acht, dass durch die Informationsversorgung primär die Unsicherheit reduziert wird249 und darüber, da die Unsicherheit eine Komponente des wahrgenommenen Risikos bildet, letztlich auch das wahrgenommene Risiko.250 In anderen Worten: „Handling risk means handling of uncertainty, that is, information.“251 Knight (1921) sowie Stone und Grønhaug (1993) dagegen identifizieren als Differenzierungsmerkmal zwischen Unsicherheit und wahrgenommenen Risiko die Zuordnung von Wahrscheinlichkeiten. Ihnen zufolge wird dann von Unsicherheit gesprochen, wenn den möglichen Konsequenzen keine Wahrscheinlichkeiten zugeordnet werden können. Sobald diesen aber Wahrscheinlichkeiten beigemessen werden können, handelt es sich um das wahrgenommene Risiko.252 Allerdings ist auch diese Abgrenzung unbefriedigend. Angesichts der kognitiven Limitationen von Individuen ist eine Erfassung aller möglichen Konsequenzen, die der Entscheidungssituation folgen können, realitätsfern. Wenn der Entscheider also die Gesamtheit der Konsequenzen nicht überblicken kann, ist es für ihn auch nur schwer möglich, den wenigen von ihm berücksichtigten Konsequenzen adäquate Wahrscheinlichkeiten zuzuordnen. Im Umkehrschluss bedeutet dies, dass bei Beschaffungsentscheidungen zwar häufig eine Untersuchung des wahrgenommenen Risikos bekundet wird, aber eigentlich aufgrund der kognitiven Beschränkungen des Individuums definitorisch nur die Unsicherheit untersucht werden kann.253 Es bestätigt sich also, dass die beiden Konstrukte nicht eindeutig voneinander trennbar sind, weshalb die Unsicherheit in der vorliegenden Arbeit als Sachverhalt des wahrgenommenen Risikos gesehen werden soll. Demnach wird Risiko dann wahrgenommen, wenn Unsicherheiten vorhanden und negative Konsequenzen bevorstehen.
Des Weiteren finden sich in der Risikoforschung angrenzende Konzepte, wie Risikoneigung, Risikopräferenz oder Risikoeinstellung. Diese Konstrukte vereint, dass sie grundsätzlich versuchen eine Person zu beschreiben. Insofern wird darunter verstanden, wie Personen gegenüber Risiken eingestellt sind, inwiefern Personen dazu neigen risikoreiche Situationen zu meiden oder wie wahrscheinlich es ist, dass sie Risiken eingehen.254 Sie unterschieden sich vom wahrgenommenen Risiko also maßgeblich darin, dass sie nicht primär auf die Wahrnehmung einer Situation abzielen. Ein weiteres Unterscheidungsmerkmal zwischen diesen Konzepten und dem wahrgenommenen Risiko scheint offensichtlich – die Situationsabhängigkeit. Ließen sich die Risikoneigung, Risikoeinstellung und Risikopräferenz allesamt als unveränderliche Persönlichkeitsmerkmale klassifizieren, könnte ihnen eine situationsunabhängige Gültigkeit bescheinigt werden, wohingegen das wahrgenommene Risko situationsabhängig ist. Allerdings gestaltet sich eine solche Verallgemeinerung schwierig, da verschiedene Autoren anmerken, dass sich eine Risikoneigung mit der Situation und durch persönliche Erfahrungen im Laufe der Zeit verändern kann.255 Insofern ist eine solch pauschalisierte Differenzierung anhand der Situationsabhängigkeit schwierig. Dennoch zeigt dieser Diskurs, wie wichtig es ist offenzulegen, inwiefern Kontextfaktoren potenziell Einfluss auf das zu definierende Risiko-Konstrukt nehmen können. So heben beispielsweise Zhang et al. (2019) hervor, dass unter ihrer generellen Risikoneigung eine situationsübergreifende Tendenz verstanden werden soll.256 In diesem Sinne wird auch für die vorliegende Arbeit mit Bezug zu Attribut 3 explizit festgehalten, dass das wahrgenommene Risiko situationsgebunden ist und sich mit den Kontextfaktoren der (organisationalen) strategischen Logistikdienstleisterauswahl ändert.
Aus der Analyse der Attribute und der verwandten Konstrukte, kann die folgende Konstrukt-Definition des wahrgenommenen Risikos für das vorliegende Forschungsprojekt formuliert werden:
Wahrgenommenes Risiko beschreibt das Ausmaß, in dem Beschaffungsmanager in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl Angst oder Stress erfahren.
Risiko wird dann wahrgenommen, wenn Unsicherheiten vorhanden sind und negative Konsequenzen bevorstehen.
Wahrgenommenes Risiko ist situationsgebunden und ändert sich mit den Kontextfaktoren der (organisationalen) strategischen Logistikdienstleisterauswahl.
Hinsichtlich der Dimensionalität des wahrgenommenen Risikos sind beide Auffassungen vertretbar – sowohl eine Eindimensionalität als auch eine Mehrdimensionalität des Konstruktes. Die Mehrdimensionalität lässt sich vorwiegend aus den verschiedenen Facetten negativer Konsequenzen argumentieren. Denkbar wäre also, dass sich das wahrgenommene Risiko in Referenz zu Stone und Grønhaug (1993) aus dem finanziellen, leistungsbezogenen, zeitlichen, sozialen, physischen und psychologischen Risiko zusammensetzt. Allerdings sind die Dimensionen nicht direkt aus der vorliegenden Konstrukt-Definition abzuleiten, weshalb auf eine Konzeptualisierung über die sechs Risikodimensionen verzichtet wird. Folgt man der Zwei-Komponenten-Definition so ließen sich hieraus ebenfalls zwei Dimensionen ableiten – die Unsicherheit und die Konsequenzen. Da diese beiden Aspekte in der vorliegenden Definition nicht ausschließlich den Inhalt des Konstruktes bilden sondern primär der Definition von Hawes und Barnhouse (1987) gefolgt wird, soll einer solchen mehrdimensionalen Konzeptualisierung ebenfalls nicht nachgegangen werden. Darüber hinaus scheinen die beiden Komponenten miteinander verbunden zu sein. So kritisiert auch Ross (1975): „In some cases it is difficult to distinguish whether uncertainty or consequences is being measured.“257 Ferner kann auch angenommen werden, dass Unsicherheiten und negative Konsequenzen zu Angst und Stress in einer Entscheidungssituation führen. Dies manifestiert sich beispielsweise anhand der Definition von Angst nach Carleton et al. (2012): „Anxiety is believed to require a sense of uncontrollability focused on the possibility of future threat, danger, or other potentially negative events.”258 Insofern werden Unsicherheiten, negative Konsequenzen sowie Angst und Stress als zusammenwirkende Sachverhalte des wahrgenommenen Risikos angesehen. Folglich wird von einer Eindimensionalität des Konstruktes ausgegangen.
Konstrukt-Operationalisierung
Wenig verwunderlich führten die umfangreichen Forschungsbestrebungen um das wahrgenommene Risiko zu verschiedenen Messansätzen.259 Unter anderem werden Indexe, semantische Differenziale, Single-Item oder auch reflektive Multi-Item Messungen angewendet. Eine Übersicht der berücksichtigten Modelle zur Messung des wahrgenommenen Risikos liefert Tabelle 3.13.
Aus der Definition des wahrgenommenen Risikos über die beiden Komponenten „Unsicherheit“ und „Konsequenzen“ lassen sich auch die ersten Messungen ableiten. So wird die Unsicherheit über die Wahrscheinlichkeit der negativen Konsequenzen und die Konsequenzen über die Wichtigkeit dieser abgefragt. Durch Multiplikation der beiden Komponenten kann dann der Index des wahrgenommenen Risikos errechnet werden. Allerdings wurde der Multiplikationsansatz in der Vergangenheit in mehreren Punkten kritisiert. Erstens bestehen Zweifel darin, ob der Zusammenhang der beiden Komponenten tatsächlich multiplikativ oder vielleicht doch additiv ist.260 Zweitens gilt es zu hinterfragen, inwiefern Individuen tatsächlich eine Multiplikation der beiden Komponenten vornehmen, um ihr Ausmaß des wahrgenommenen Risikos zu bestimmen.261 Drittens kann, wie schon bei der Abgrenzung zwischen Unsicherheit und Risiko aufgegriffen, eine Bestimmung der Wahrscheinlichkeiten aller negativen Konsequenzen als realitätsfern angesehen werden.262 Aufgrund der Kritik, als auch in Abwägung der vorliegenden Konstrukt-Definition, wird ein solcher Messansatz nicht weiterverfolgt.
In Analogie zu Cannon und Perreault (1999) Messung der Komplexität, verwenden Sitkin und Weingart (1995) ein semantisches Differenzial zur Messung des wahrgenommenen Risikos. Die Eigenschaftspaare beschrieben zum einen die Entscheidung (F1-F3) und zum anderen die Wahrscheinlichkeit des Erfolgs (F4).263 Jedoch kann an diesem Modell angezweifelt werden, ob tatsächlich das wahrgenommene Risiko gemessen wird. In ihrem ausführlichen Review zur Messung von Sitkin und Weingart (1995), konnten Ganzach et al. (2008) aufzeigen, dass diese Operationalisierung mit dem Konstrukt-Verständnis nicht konform ist. Ihnen zufolge messen die Indikatoren des semantischen Differenzials eher die Konstrukte „wahrgenommene Rendite“ oder „globale Bewertung“.264 Zur Überprüfung des Modells von Sitkin und Weingart (1995) setzten Ganzach et al. (2008) dann eine Single-Item Messung ein. Im Ergebnis konnten sie dieser schließlich eine bessere Validität bescheinigen.265 Darüber hinaus werden die Indikatoren von Sitkin und Weingart (1995) beispielsweise zur Messung der Problemauslegung oder des Framingeffekts eingesetzt266 – folglich nicht zur Messung des wahrgenommenen Risikos. Aufgrund dessen wird einem solchen Ansatz im vorliegenden Fall ebenfalls nicht nachgegangen.
Eine Multi-Item Messung hingegen präsentieren Brown et al. (2011) mit Referenz zu Mudambi (2002). Die verwendeten Indikatoren spiegeln hierbei die leistungsbezogene (A1), finanzielle (A2) und soziale (A3) Risikodimensionen wider. Ergänzend wird ein Indikator für das übergreifende Risiko formuliert (A4).267 Angesichts der eingesetzten Gütekriterien zur Überprüfung des Messmodells kann auf eine reflektive Spezifikation geschlossen werden.268 Diese ist jedoch insofern zu kritisieren, als dass die einzelnen Indikatoren nicht gegenseitig austauschbar sind und jeweils eigenständige Facetten des Konstrukts darstellen, wie die Autoren selber bemerken: „[…] our measure of purchase risk is composed of four items, each of which taps a potentially different dimension of risk“.269 Dies wird auch in der Follow-up Analyse der Studie noch einmal offenkundig. Die Autoren untersuchen hierin die Effekte der einzelnen Risikodimensionen – losgelöst vom eigentlichen Messmodell.270 Demnach muss bei diesem Messmodell vielmehr von einer formativen als von einer reflektiven Spezifikation ausgegangen werden. Ferner wäre eine formative Multi-Item Messung nicht nur über die allgemeinen Risikodimensionen, sondern auch über eine Auflistung spezifischer, vordefinierter Beschaffungsrisiken (e.g. zusätzliche Kosten für den Transport aufgrund fehlender Planung) denkbar gewesen. Solche Auflistungen finden sich beispielsweise bei Zsidisin (2003), Zsidisin et al. (2004) oder Kremic et al. (2006).271 Jedoch wurde ein solcher Ansatz für die vorliegende Untersuchung verworfen, da fraglich ist, ob bei der Vordefinition der Beschaffungsrisiken tatsächlich alle potenziellen Beschaffungsrisiken aufgenommen werden können und inwiefern die Modellierung des wahrgenommenen Risikos dann für nicht-abgefragte Beschaffungsrisiken generalisierbar ist.272
Weitere, in diesem Fall als reflektiv zu spezifizierende Multi-Item Messungen finden sich hingegen bei Davis (2003), Stone und Grønhaug (1993) oder Cox und Cox (2001). Insbesondere letztere weist Parallelen zur vorliegenden Konstrukt-Definition auf. So wird das wahrgenommene Risko über die Erwartung negative Konsequenzen (B2), Unsicherheit der Konsequenzen (B3) und Angst (B4, B5) reflektiert. Auch Sie ergänzen das Messmodell um einen Indikator zur direkten Abfrage des Risikos (B1). Angesichts der Kritik an den vorherigen Ansätzen und der grundsätzlichen Bevorzugung von Multi-Item Messungen gegenüber Single-Item Messungen, soll auch in der vorliegenden Arbeit das wahrgenommene Risiko mittels mehrerer Likert-skalierter Indikatoren, ähnlich wie bei Brown et al. (2011), Davis (2003) und Cox und Cox (2001), operationalisiert werden.
Tabelle 3.13
Relevante Modelle zur Messung des wahrgenommenen Risikos273
Overall, the thought of buying a personal computer within the next 12 months causes me to be concerned with experiencing some kind of loss if I went ahead with the purchase
D2
All things considered, I think I would be making a mistake if I bought a personal computer within the next 12 months for my use at home
D3
When all is said and done, I really feel that the purchase of a personal computer within the next 12 months poses problems for me that I just don’t need.
“risk perception”
Sitkin und Weingart (1995), S. 1592
Semantisches Differenzial
How would you characterise the decision faced […]?
F1
Significant opportunity – significant threat
F2
Potential for loss – potential for gain (reverse)
F3
Positive situation – negative situation
What is the likelihood of […] succeeding at […]?
F4
Very unlikely – very likely (reverse)
Vor dem Hintergrund der Eindimensionalität des Konstruktes und des hierin argumentierten Wirkungszusammenhangs der einzelnen Sachverhalte der Konstrukt-Definition, wird eine reflektive Spezifikation des Messmodells angesetzt. Dies ist beispielsweise auch im Einklang mit dem Messmodell von Cox und Cox (2001). Zwar führen die Autoren nicht explizit an, dass es sich um eine reflektive Spezifikation handelt, jedoch wird dies anhand der Gütekriterien und der einsetzten Methode impliziert. So führen sie keine „latent variable analysis“ durch, sondern setzen aufgrund ihres experimentellen Designs und der Berechnung mittels ANOVA das „alpha and sum“ – Prinzip274 um. Das Cronbach alpha (0,77) signalisiert dabei eine angemessene interne Konsistenz des Messmodells.275 Demnach erfolgt nun in einem nächsten Schritt die Formulierung der Indikatoren für das eindimensionale reflektive Messmodell des wahrgenommenen Risikos in Übereinstimmung mit der erarbeiteten Konstrukt-Definition.
Aufgrund der eindeutigen Überschneidungen zur vorliegenden Konstrukt-Definition, werden aus dem Messmodell von Cox und Cox (2001), welches unter anderem von Kirchoff et al. (2019) angewendet wurde,276 insgesamt fünf Indikatoren entnommen und unter sprachlichen und kontextbedingten Anpassungen ins Deutsche übersetzt.277 Demgemäß wird zunächst ein übergreifender Indikator zum Ausdruck des wahrgenommenen Risikos formuliert:
WAR 01
Die strategische LogistikDL-Auswahl empfand ich als riskant.
Des Weiteren werden zwei Indikatoren mit Referenz zur Konstrukt-Definition als Manifestationen der Unsicherheit und negativen Konsequenzen formuliert:
WAR 02
Ich hatte die Befürchtung, dass es in Folge der strategischen LogistikDL-Auswahl zu Problemen kommen wird.
WAR 03
Die strategische LogistikDL-Auswahl war von Unsicherheiten geprägt.
Schließlich folgen zwei weitere Indikatoren zur Verdeutlichung der Angst und des Stresses, den der Beschaffungsmanager in seinem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl erfahren hat:
WAR 04
Die strategische LogistikDL-Auswahl hat mich nervös gemacht.
WAR 05
Die strategische LogistikDL-Auswahl hat mir Sorgen bereitet.
In der nachstehenden Tabelle 3.14 ist das Messmodell des wahrgenommenen Risikos mit dem Begriffsverständnis, den Indikatorformulierungen und den Individualverweisen zu den Indikatoren zusammengefasst dargestellt.
Das wahrgenommene Risiko beschreibt das Ausmaß, in dem Beschaffungsmanager in ihrem individuellen Entscheidungsprozess im Rahmen der (organisationalen) strategischen Logistikdienstleisterauswahl Angst oder Stress erfahren.
Risiko wird dann wahrgenommen, wenn Unsicherheiten vorhanden sind und negative Konsequenzen bevorstehen.
Wahrgenommenes Risiko ist situationsgebunden und ändert sich mit den Kontextfaktoren der (organisationalen) strategischen Logistikdienstleisterauswahl.
Eigenschaft
Eindimensional, reflektiv, Likert-Skala
Skala
1 = „Trifft gar nicht zu“; 7 = „Trifft voll zu“
Indikatoren
WAR 01
Die strategische LogistikDL-Auswahl empfand ich als riskant.
B1 – Cox und Cox (2001)
WAR 02
Ich hatte die Befürchtung, dass es in Folge der strategischen LogistikDL-Auswahl zu Problemen kommen wird.
B2 – Cox und Cox (2001)
WAR 03
Die strategische LogistikDL-Auswahl war von Unsicherheiten geprägt.
B3 – Cox und Cox (2001)
WAR 04
Die strategische LogistikDL-Auswahl hat mich nervös gemacht.
B4 – Cox und Cox (2001)
WAR 05
Die strategische LogistikDL-Auswahl hat mir Sorgen bereitet.
B5 – Cox und Cox (2001)
3.1.7 Individuelle Risikoneigung
Im Sinne des theoretisch hergeleiteten Hypothesensystems und unter Berücksichtigung vorangegangener Forschungsarbeiten wird die „individuelle Risikoneigung“ im Folgenden als latentes Konstrukt behandelt. Insofern soll das latente Konstrukt in einem ersten Schritt konzeptualisiert und in einem zweiten Schritt mithilfe manifester Indikatoren operationalisiert werden.
Konstrukt-Konzeptualisierung
Parallel zur Literatur des wahrgenommenen Risikos hat sich auch die Forschung zur Risikoneigung von Individuen entwickelt. Diese wird sowohl in psychologischen279als auch Managementstudien – beispielsweise im Bereich der Entrepreneur-280 und Finance-Forschung281 – untersucht. Nicht zuletzt ist die Risikoneigung auch Teil der deutschen sozioökonomischen Panelstudie des DIW Berlins.282 Die vielfältigen Untersuchungen im Bereich der Risikoneigung führten unter anderem zu vermeintlich ähnlichen, allerdings unterschiedlichen Verständnissen.283 Um demnach eine für die vorliegende Arbeit gültige Konstrukt-Definition der individuellen Risikoneigung festlegen zu können, werden aus den verschiedenen Begriffen und deren Verständnisse zentrale Attribute abgeleitet (Tabelle 3.15) und analysiert.
Erstens wird die Risikoneigung, wenig verwunderlich, auf der individuellen Ebene definiert.284 Zweitens drückt sie eine Tendenz aus.285 Diese ist in den meisten Fällen auf das Eingehen oder Vermeiden von Risiken ausgerichtet. Diesbezüglich sind aber auch Abweichungen beobachtbar. Während exemplarisch Sitkin und Pablo (1992) Risken nicht weiter spezifizieren,286 benutzen Meertens und Lion (2008) den Begriff „persönliche Risiken“,287 vermeiden Zhang et al. (2019) den Risikobegriff gänzlich und umschreiben die Risiken stattdessen mit negativen Konsequenzen.288Angesichts des zuvor erarbeitenden Verständnisses des wahrgenommenen Risikos, soll an dieser Stelle auf eine Präzisierung des Begriffs „Risiko“, wie bei Zhang et al. (2019) vorzufinden, bewusst verzichtet werden. Hinsichtlich einer möglichen Restriktion des Begriffsverständnisses durch die Festlegung auf persönliche Risiken wie bei Meertens und Lion (2008), kann angemerkt werden, dass hier vielmehr versucht wird die individuelle Ebene des Konstruktes hervorzuheben anstatt eine Abgrenzung zwischen persönlichen und organisationalen Risiken im Sinne von Newall (1977) zu etablieren.289 Nichtsdestotrotz wird im vorliegenden Fall, um Missverständnisse zu vermeiden, eine Formulierung wie bei Sitkin und Pablo (1992) gewählt. Insofern beschreibt die individuelle Risikoneigung die Tendenz einer Person Risiken einzugehen oder zu vermeiden.
Tabelle 3.15
Begriffsauffassungen zur individuellen Risikoneigung und verwandter Konstrukte290
Konstrukt-Bezeichnung/ Quelle
Definition/Begriffsverständnis
Abgeleitete Attribute
Individuelle Risikoneigung
„risk propensity"
Sitkin und Pablo (1992), S. 12
„[…] the tendency of a decision maker either to take or to avoid risks.“
Individuelle Ebene
Tendenz
eingehen/vermeiden
Risiken allgemein
„risk propensity“
Sitkin und Weingart (1995), S. 1575
[…] is defined as an individual’scurrenttendency to take or avoidrisk. It is conceptualized as an individual trait that can change over time and thus is an emergent property of the decision maker.
Individuelle Ebene
Tendenz
eingehen/vermeiden
Risiken allgemein
Veränderlich mit der Zeit
Persönlichkeitsmerkmal
„risk propensity"
Meertens und Lion (2008), S. 1508
„[…] the tendency to avoid or takepersonal risks.“
Tendenz
eingehen/vermeiden
Persönliche Risiken
„general risk taking propensity”
Zhang et al. (2019), S. 153
„[…] is a person'scross-situationaltendency to engage in behaviors with a prospect of negative consequences such as loss, harm, or failure.“
Individuelle Ebene
Situationsübergreifend
Tendenz
Aussicht auf negative Folgen
Verwandte Konzepte
„risk affinity”
Conchar (2004), S. 421
„A general tendency to seek or avoidrisk, other things being equal.”
Generelle Tendenz
Suchen/vermeiden
Risiken allgemein
situationsunabhängig
„perceived risk attitudes“
Weber und Milliman (1997), S. 128
„[…] a decision maker has a tendency to be attracted or repelled by alternatives that he or she perceives as more risky over alternatives perceived as less risk.”
Individuelle Ebene
angezogen/abgestoßen
Alternativen in Abhängigkeit zum Risiko
„risk preference”
Sitkin und Pablo (1992), S. 12
„[…] decision makers who enjoy the challenge that risks entail will be more likely to undertake risky actions than those individuals who do not.”
Individuelle Ebene
Genuss
Herausforderung in Abhängigkeit zum Risiko
Folge: Eingehen riskanter Aktionen
Eine langjährige Kontroverse in der Risikoforschung wird hingegen mit dem vierten Attribut adressiert – die Veränderlichkeit bzw. Stabilität des Konstruktes. Hierbei lassen sich drei Auffassungen identifizieren. Die erste Gruppe von Forschern unterstützt demnach die Annahme einer veränderlichen, von Kontextfaktoren abhängigen, individuellen Risikoneigung. Die Risikoneigung einer Person verändert sich also mit der Entscheidungssituation.291 Beispielsweise kann ein Beschaffungsmanager in einer organisationalen Beschaffungsentscheidung eher eine risikoaverse, in einer privaten Konsumentscheidung eher eine risikoreiche Neigung aufweisen – natürlich kann die Risikoneigung des Weiteren zwischen den verschiedenen organisationalen Beschaffungsentscheidungen unterschiedlich ausgeprägt sein. Unterstützung für ihre Annahme finden die Vertreter unter anderem in der Prospect Theorie, wonach Individuen bei Gewinnen risikoavers, bei Verlusten risikoreich agieren.292 In diesem Sinne bezeichnen beispielsweise Weber et al. (2002) ihr Konstrukt als „domain-specific risk-attitude“.293 Auf der anderen Seite unterstellt die zweite Forschergruppe eine stabile Risikoneigung. Sie ist insofern als beständiges Persönlichkeitsmerkmal zu verstehen und bestimmt unabhängig von der Entscheidungssituation das Verhalten von Individuen.294 Zur Klarstellung dieses Sachverhalts bezeichnen die Forscher ihre Konstrukte exemplarisch als „general risk taking propensity“ oder heben dies in ihrer Definition als „cross-situational tendency“ hervor.295 Anstatt eine klare Trennung – entweder veränderliche oder stabile Risikoneigung – vorzunehmen, argumentiert eine dritte Gruppe für eine Koexistenz dieser. Ihnen zufolge setzt sich die Risikoneigung also aus einer stabilen und einer veränderlichen Komponente zusammen.296 Jedoch führen die meisten Autoren die veränderliche Komponente auf Aspekte wie Alter oder Erfahrungen und weniger auf die Entscheidungssituation zurück.297 Tatsächlich vertritt auch die Persönlichkeitsforschung ein solches Verständnis: „Personality trait development is not a continuity-versus-change proposition. Rather, continuity and change coexist due to the corresponsive principle […]“.298 Die Psychologie geht davon aus, dass Individuen dazu neigen sich soziale Cluster oder Umgebungen zu suchen, die mit ihrer Persönlichkeit korrelieren („social selection“), weshalb kaum weitreichende Persönlichkeitsveränderungen zu erwarten sind. Stattdessen werden die bereits vorhandenen persönlichen Merkmale („continuity) durch eigenschaftsbezogene Erfahrungen, die innerhalb dieser sozialen Cluster oder Umgebungen gesammelt werden („social influence“), vertieft („change“). Auf den Fall der individuellen Risikoneigung übertragen bedeutet dies exemplarisch: Eine risikoreiche Person wird sich eher risikoreiche Sportarten suchen und ausüben, wodurch sich schließlich die individuelle Risikoneigung durch die sportlichen Erfahrungen und den Umgang mit ähnlich eingestellten Personen neu abstimmt (e.g. verstärkt).299 In Anlehnung an die dritte Forschergruppe versteht die vorliegende Arbeit die individuelle Risikoneigung als weitestgehend stabiles Persönlichkeitsmerkmal, erkennt aber an, dass sich diese, wie für die meisten Persönlichkeitsmerkmale üblich, mit dem Alter, wie auch mit Erfahrungen verändern kann, sich jedoch über verschiedene Entscheidungssituationen und deren Kontextfaktoren hinweg konstant verhält. Basierend auf diesem Verständnis kann das Konstrukt auch als „situationsübergreifende, individuelle Risikoneigung“ konkretisiert werden.
Neben den Definitionen des fokalen Konstruktes, sollten auch verwandte Konstrukte mit einem der individuellen Risikoneigung („risk propensity“) ähnlichen Verständnis als Ergebnis der Literaturrecherche identifiziert und wenn möglich abgegrenzt werden. Dies betrifft insbesondere die Konstrukte „risk taking“, „risk preference“ „risk affinity“ als auch „risk attitude“. Auf der einen Seite lassen sich vereinzelt Unterschiede zwischen den verschiedenen Konstrukten identifizieren. So verstehen beispielsweise Sitkin und Pablo (1992) die Risikopräferenz als Determinante der Risikoneigung300 oder Conchar (2004) die Risikoaffinität als stabilen Teil der Persönlichkeit, woraus schließlich die Risikoneigung bestimmt wird.301 Auf der anderen Seite aber werden auch deutliche Überschneidungen zwischen den Begriffen sichtbar. Vergleicht man nämlich die Definitionen, so muss festgestellt werden, dass in vielen Fällen eine Tendenz angegeben wird, die beschreiben soll, inwiefern Individuen Risiken suchen oder vermeiden, bzw. von diesen angezogen oder abgestoßen werden.302 Ferner ist zu beobachten, dass sich die Autoren zu „risk preference“, „risk taking“ oder „risk propensity“ häufig wechselseitig zitieren, die Erkenntnisse jeweils in ihre Untersuchungen einfließen lassen und die Begriffe in ihren Arbeiten synonym verwenden303 – eine klare Trennung wird selten erarbeitet. Des Weiteren sind die Zusammenhänge, die zwischen den Konstrukten aufgestellt werden, widersprüchlich. So gehen beispielsweise Dyer und Sarin (1982) von einem Einfluss der Risikopräferenz auf die Risikoeinstellung aus und nicht, wie im Modell von Sitkin und Pablo (1992) präsentiert, auf die Risikoneigung.304 Angesichts dieser Begriffsvielfalt und der hieraus entstandenen Intransparenz ist eine eindeutige Abgrenzung zwischen den verschiedenen Konstrukten nicht zu leisten. Stattdessen wird darauf geachtet, dass das vorliegende Verständnis für die individuelle Risikoneigung möglichst präzise offengelegt wird. Aus der Analyse der Attribute wird demnach die folgende Konstrukt-Definition der individuellen Risikoneigung für das vorliegende Forschungsprojekt formuliert:
Individuelle Risikoneigung beschreibt die Tendenz einer Person Risiken einzugehen oder zu vermeiden.
Individuelle Risikoneigung wird als ein Persönlichkeitsmerkmal verstanden, ist situationsübergreifend gültig und stabil gegenüber den Kontextfaktoren der (organisationalen) strategischen Logistikdienstleisterauswahl.
Hinsichtlich der Dimensionalität der individuellen Risikoneigung wird eine eindimensionale Auffassung vertreten. Zwar ließe sich prinzipiell auch eine Mehrdimensionalität über die Koexistenz einer stabilen und veränderlichen Komponente argumentieren, jedoch sind diese nicht direkt aus der vorliegenden Konstrukt-Definition abzuleiten. Die Konstrukt-Definition selbst bietet ebenfalls nicht ausreichend unterschiedliche Sachverhalte, um eine Mehrdimensionalität annehmen zu können. Zudem zeigen vergleichbare Studien eine Eindimensionalität der Risikoneigung auf.305
Konstrukt-Operationalisierung
In der Literatur konnten verschiedene Operationalisierungen der individuelle Risikoneigung als auch der mit ihr verwandten Konstrukte identifiziert werden. Eine Übersicht der berücksichtigten Modelle zur Messung der individuellen Risikoneigung liefert Tabelle 3.16.
Einen ersten Messansatz liefern Forlani et al. (2002). Sie verwenden eine dichotome Messung, bei der der Respondent zwischen zwei Ausprägungen wählen muss. Hieraus kann dann geschlussfolgert werden, ob es sich um eine risikoaverse oder risikosuchende Person handelt.306 Kritisiert werden kann an diesem Ansatz, dass, wie die Autoren selber anmerken, eine Fokussierung auf den finanziellen Kontext vorgenommen wird: „it deals with pesonal propensities toward financial risk taking […]“.307 Ferner deutet die Faktorenanalyse auf eine Zwei-Dimensionalität (A2, A4 und A1, A3, A5) des Konstruktes hin,308 was erneut im Widerspruch zur vorliegenden Konzeptualisierung steht. Insofern wurde ein solcher Messansatz für ungeeignet befunden.
Im Rahmen des sozioökonomischen Panels wird die Risikoneigung als Single-Item abgefragt.309 In einer Prüfung der globalen Messung konnten Dohmen et al. (2011) dieser schließlich eine gute Performance nachweisen und bescheinigen ihr insgesamt eine zufriedenstellende Validität.310 In Anbetracht dessen scheint eine solche globale Abfrage durchaus zweckmäßig. Im Gegensatz dazu präsentieren beispielsweise Kull et al. (2014), Meertens und Lion (2008) und Zhang et al. (2019) unterschiedliche Multi-Item Messungen. Insbesondere bei Kull et al. (2014) kann allerdings kritisch angemerkt werden, dass eine situationsbezogene Risikoneigung gemessen wird. Dies wird dadurch deutlich, dass er bei der Abfrage der Indikatoren einführend auf eine bestimmte Lieferantenauswahlentscheidung Bezug nimmt. Insofern ist dieses Multi-Item Messmodell mit dem vorliegenden Konstrukt-Verständnis nicht konform. Anders verhält sich dies bei den Messmodellen von Meertens und Lion (2008), sowie Zhang et al. (2019). Bei ihnen ist jeweils eindeutig eine situationsunabhängige Operationalisierung zu erkennen. Dies wird durch die allgemein formulierten Indikatoren (bspw. C1-C7; D1-D8) deutlich. Beispielsweise nutzen sie die Regelmäßigkeit risikobehafteter Entscheidungen als eine Reflektion der individuellen Risikoneigung (CC4, E6). Angesichts der Kritik an den vorherigen Ansätzen und der grundsätzlichen Bevorzugung von Multi-Item Messungen gegenüber Single-Item Messungen, soll auch in der vorliegenden Arbeit die individuelle Risikoneigung mittels mehrerer Likert-skalierter Indikatoren, wie exemplarisch bei Meertens und Lion (2008) und Zhang et al. (2019) zu finden, operationalisiert werden.
Vor dem Hintergrund der Eindimensionalität der individuellen Risikoneigung, wird eine reflektive Spezifikation des Messmodells für angebracht angesehen. Dies ist auch im Einklang mit den zuvor als relevant eingestuften Messmodellen von Meertens und Lion (2008) sowie Zhang et al. (2019). Demnach erfolgt nun in einem nächsten Schritt die Ableitung der Indikatorformulierungen für das eindimensionale reflektive Messmodell der individuellen Risikoneigung in Übereinstimmung mit der erarbeiteten Konstrukt-Definition.
Tabelle 3.16
Relevante Modelle zur Messung der individuellen Risikoneigung311
Konstrukt-Bezeichnung/ Quelle
Eigenschaften
Indikatoren
„risk propensity“
Forlani et al. (2002), S. 978
Dichotome Messung
Mehrdimensional;
The following questions will help us better understand your personal feelings about risk. Please answer the following 5 items by circling the alternative (“a” or “b”) you would feel most comfortable with.
I would take a risk even if it meant I might get hurt.
E5
Taking risks is an important part of my life.
E6
I commonly make risky decisions.
E7
I am a believer of taking chances.
E8
I am attracted, rather than scared, by risk.
Für die vorliegende Arbeit werden die Indikatorformulierungen von Meertens und Lion (2008) übernommen, da diese mit dem eigenen Konstrukt-Verständnis konform sind und insbesondere situationsunabhängig formuliert wurden. Die zuvor eingeräumte Veränderlichkeit der Risikoneigung mit dem Alter bzw. mit den Erfahrungen sorgt jedoch in Kombination mit der retrospektiven Konzeption der Untersuchung prinzipiell für ein Dilemma. So besteht einerseits die Möglichkeit, die Risikoneigung ebenfalls retrospektiv zu messen, d. h. zum Zeitpunkt der Auswahlentscheidung abzufragen. Fraglich ist hierbei, inwiefern Individuen überhaupt in der Lage sind ihre Persönlichkeit zu einem vergangenen Zeitpunkt widerzugeben – somit potenzielle Persönlichkeitsveränderungen wahrnehmen bzw. eingestehen zu können.
Andererseits besteht die Möglichkeit, die Risikoneigung auf den Zeitpunkt der Erhebung festzusetzen und eine mögliche Veränderung der Risikoneigung im Zeitraum zwischen Auswahlentscheidung und Befragung bewusst zu vernachlässigen. Eine dritte Möglichkeit ergibt sich, indem die Risikoneigung generell abgefragt wird, d. h. kein bestimmter Zeitpunkt der Messung festgelegt wird. Da dem Konstrukt gemäß Definition weitestgehend Stabilität unterstellt wird, soll an dieser Stelle eine generelle Messung der individuellen Risikoneigung umgesetzt werden. Demnach werden die Respondenten aufgefordert einzuschätzen „inwieweit die nachfolgenden Aussagen auf Sie persönlich zutreffen“.
Ferner bescheinigt die Güteprüfung von Meertens und Lion (2008) dem gesamten Messmodell eine angemessene Reliabilität.312 Demzufolge werden insgesamt sieben Indikatoren313 von Meertens und Lion (2008) entnommen und unter sprachlichen Anpassungen ins Deutsche übersetzt.314
IRN 01
Sicherheit geht vor. (reverse)
IRN 02
Ich gehe kein Risiko mit meiner Gesundheit ein. (reverse)
IRN 03
Ich bevorzuge es Risiken zu vermeiden. (reverse)
IRN 04
Ich gehe regelmäßig Risiken ein.
IRN 05
Ich mag es, nicht zu wissen, was passieren wird.315
IRN 06
Für gewöhnlich sehe ich Risiken als Herausforderung.
IRN 07
Ich sehe mich selbst als… (risikoavers, risikoaffin).
In der nachstehenden Tabelle 3.17 ist das Messmodell der individuellen Risikoneigung mit dem Begriffsverständnis, den Indikatorformulierungen und den Individualverweisen zu den Indikatoren zusammengefasst dargestellt.
Individuelle Risikoneigung beschreibt die Tendenz einer Person Risiken einzugehen oder zu vermeiden.
Individuelle Risikoneigung wird als ein Persönlichkeitsmerkmal verstanden, ist nicht situationsgebunden und stabil gegenüber den Kontextfaktoren der (organisationalen) strategischen Logistikdienstleisterauswahl.
Eigenschaft
Eindimensional, reflektiv, Likert-Skala
Skala
1 = „Trifft gar nicht zu“; 7 = „Trifft voll zu“
Indikatoren
IRN 01
Sicherheit geht vor. reverse item
C1 – Meertens und Lion (2008)
IRN 02
Ich gehe kein Risiko mit meiner Gesundheit ein. reverse item
C2 – Meertens und Lion (2008)
IRN 03
Ich bevorzuge es Risiken zu vermeiden. reverse item
C3 – Meertens und Lion (2008)
IRN 04
Ich gehe regelmäßig Risiken ein.
C4 – Meertens und Lion (2008)
IRN 05
Ich mag es, nicht zu wissen, was passieren wird.
C5 – Meertens und Lion (2008)
IRN 06
Für gewöhnlich sehe ich Risiken als Herausforderung.
C6 – Meertens und Lion (2008)
IRN 07
Ich sehe mich selbst als… (risikoavers, risikoaffin).
C7 – Meertens und Lion (2008)
3.1.8 Rational Experiential Inventory – „Need for Cognition“ und „Faith in Intuition“
Im Sinne des theoretisch hergeleiteten Hypothesensystems und unter Berücksichtigung vorangegangener Forschungsarbeiten zum REI werden Need for Cognition und Faith in Intuition im Folgenden als latente Konstrukte behandelt. Insofern sollen die beiden latenten Konstrukte in einem ersten Schritt konzeptualisiert und in einem zweiten Schritt mithilfe manifester Indikatoren operationalisiert werden.
Konstrukt-Konzeptualisierung
Das Rational Experiential Inventory mit den beiden Konstrukten Need for Cognition und Faith in Intuition geht maßgeblich auf die Arbeit von Epstein et al. (1996) zurück.317 Alleinstehend erfuhr das Konstrukt Need for Cognition jedoch bereits zuvor durch die Studie von Cohen et al. (1955) und dann einige Zeit später wieder durch die Psychologen John T. Cacioppo und Richard E. Petty wissenschaftliche Aufmerksamkeit.318 Seitdem wurden die beiden Konstrukte in einer Vielzahl von Forschungsbeiträgen untersucht.319 Auffällig ist hierbei, dass sich das Verständnis für die Konstrukte seit den ersten Arbeiten kaum verändert hat – es gelten weitestgehend die ursprünglichen Konstrukt-Definitionen. Dies wird auch aus den abgeleiteten Attributen (siehe Tabelle 3.18), sowie durch Nachverfolgung der Zitationen320 ersichtlich. In Anbetracht dessen scheint es im vorliegenden Fall – anders als bei den Messmodellen zuvor – nicht nötig zu sein, den Schwerpunkt der Konstrukt-Konzeptualisierung auf die Analyse der Attribute zu legen.
In Anlehnungen an die CEST wird Need for Cognition als Neigung beschrieben, eine deliberative kognitive Informationsverarbeitung zu nutzen.321 Zur Umschreibung der Nutzung verwenden die Autoren unterschiedliche Ausdrucksformen, wie Motivation, Verlassen, Genuss oder Vertrauen.322 Ergänzend werden Personen mit einer hohen Ausprägung der Need for Cognition auch darüber charakterisiert, dass sie Freude am Denken haben und sich gerne auf kognitive Anstrengungen einlassen.323 Der Terminus „Need“ soll nach Cohen et al. (1955) nicht als Reaktion auf einen Zustand der Entbehrung verstanden werden. Vielmehr soll dadurch zum Ausdruck gebracht werden, dass es zu Spannungen kommen kann, wenn ein Ziel nicht erreicht wird. Aus diesen Spannungen erwächst schließlich der Need for Cognition.324 Faith in Intuition dagegen bezieht sich auf die erfahrungsbasierte, automatische Form der Informationsverarbeitung und beschreibt Personen über ihre Tendenz diese zu nutzen.325 Wiederum werden hier die Begriffe Vertrauen oder Verlassen eingesetzt, um die Nutzung zu umschreiben.326
Tabelle 3.18
Begriffsauffassungen zu den Konstrukten der Rational Experiental Inventory327
Konstrukt-Bezeichnung/ Quelle
Definition/Begriffsverständnis
Abgeleitete Attribute
Need for Cognition
„need for cognition“
Cacioppo und Petty (1982), S. 116
„[…] tendency to engage in and enjoythinking.“
Tendenz
Beschäftigung/Genuss
Kognitive Anstrengung – Denken
„need for cognition“
Zimmerman et al. (2011), S. 293
„[…] the degree to which the participanttrusts and relies on more deliberative cognitive processing.“
Ausmaß
Individuelle Ebene
Vertrauen/Verlassen
Deliberative kognitive Verarbeitung
„need for cognition“
Shestowsky et al. (1998), S. 1318
„[…] intrinsic motivation for, and enjoyment of, effortful cognitive activities.“
Motivation/Genuss
Kognitive Anstrengung
Faith in Intuition
„faith in intuition“
Alós-Ferrer und Hügelschäfer (2012), S. 183
„[…] reflects an individual’strust in his or her own intuition, i.e. reliance on the experiential system.“
Individuelle Ebene
Vertrauen
Intuition
erfahrungsbasierte automatische Verarbeitung
„faith in intuition“
Zimmerman et al. (2011), S. 293
„[…] the degree to which the participanttrusts and relies upon his or her intuition.“
Tendenz
Individuelle Ebene
Vertrauen/Verlassen
Intuition
Verwandte Konzepte
„cognitive style“
Cox (1967c), S. 381
„[…] is a measure of the individual’scharacteristicsway of dealing with ambiguity.“
Individuelle Ebene
Typischer Umgang
Reaktion auf Ambiguität
„need for cognitive clarity“
Cox (1967c), S. 381
„[…] is a measure of the individual’sability to tolerate ambiguity.“
Individuelle Ebene
Fähigkeit
Reaktion auf Ambiguität
Wichtig für die Konzeptualisierung der beiden Konstrukte im Rahmen des Rational Experiential Inventory ist, dass die beiden Konstrukte keine Gegensätze darstellen, wodurch auch den Annahmen der CEST328 entsprochen wird. In anderen Worten gilt eine Person mit geringem Need for Cognition nicht notwendigerweise gleichzeitig als Person mit hoher Faith in Intuition. Die Ausprägungen des einen Konstruktes lassen also keine unmittelbaren Schlussfolgerungen auf die Ausprägungen des anderen Konstruktes zu.329 Die Studienergebnisse von Epstein et al. (1996) unterstreichen eine solche Unabhängigkeit der beiden Konstrukte.330 Jedes Konstrukt ist also für sich eigenständig. Des Weiteren gilt für beide Konstrukte gleichermaßen, dass sie auf der individuellen Ebene definiert sind und als Persönlichkeitsmerkmale klassifiziert werden. Hinsichtlich der Stabilität bzw. Veränderlichkeit der Konstrukte geben die Definitionen kaum Hinweise. Daher wird analog zur individuellen Risikoneigung und für Persönlichkeitsmerkmale üblich,331 grundsätzlich von einer Stabilität der beiden Konstrukte ausgegangen, wobei eine Veränderung mit dem Alter und mit Erfahrungen eingeräumt wird. Eine durch die Entscheidungssituation bedingte Veränderlichkeit wird hingegen erneut ausgeschlossen.
Zudem sollen auch verwandte Konstrukte mit einem ähnlichen Verständnis analysiert und abgegrenzt werden. Dies betrifft im vorliegenden Fall speziell das Konstrukt Need for Cognition. So führen beispielsweise Kelman und Cohler (1959) und später auch Cox (1967c) die beiden Konstrukte Need for Cognitive Clarity und Cognitive Style ein. Das Bedürfnis einer Person nach kognitiver Klarheit wird ausgelöst, wenn eine Person einen Zustand der Ambiguität332 oder Inkonsistenz erfährt und diesen aufheben möchte. In anderen Worten beschreibt das Konstrukt, in welchem Ausmaß Personen geneigt sind, inkonsistente, dissonante, mehrdeutige Sachverhalte zu beseitigen und inwiefern sie die Fähigkeit dazu besitzen.333 Darauf aufbauend wird unter Cognitive Style die Art und Weise verstanden, wie der Zustand der kognitiven Klarheit typischerweise erreicht wird. Die Literatur unterscheidet hierbei zwei Typen – die „simplifiers“ und die „clarifiers“.334 Zwar lassen sich in den beiden Typen des Cognitive Styles Parallelen zu den Dual-Processing Modellen ziehen, allerdings entspringen die beiden Persönlichkeitsmerkmale grundsätzlich der kognitiven Dissonanztheorie.335 Insofern sind beide Konstrukte, wie auch Need for Cognition im Kontext der Informationssuche einzusetzen und tragen demnach zur Erklärung des individuellen Informationssuchverhaltens bei, jedoch beschreiben sie inhaltlich zwei unterschiedliche Aspekte – auf der einen Seite die Art der Informationsverarbeitung und auf der anderen Seite die Fähigkeit (Art) zum (des) Umgang(s) mit kognitiver Dissonanz.336
Andererseits werden in der Beschaffungsforschung zunehmend die Konstrukte prozedurale Rationalität, sowie automatische/emotionale und erfahrungsbasierte Verarbeitung untersucht. Sie spiegeln, wie das Rational-Experiential Inventory, die zwei Formen der Informationsverarbeitung wider. Ein wesentlicher Unterschied liegt jedoch in der Stabilität bzw. Situationsabhängigkeit. So sind die prozedurale Rationalität, sowie automatische und erfahrungsbasierte Verarbeitung stets an die Situation gebunden und damit nicht als individuelle Charakteristiken zu verstehen.337
Aus der Analyse der Attribute und nach erfolgter Abgrenzung von verwandten Konstrukten werden demnach die folgenden Definitionen Need for Cognition und Faith in Intuition abgeleitet:
Need for Cognition beschreibt die Tendenz einer Person, sich auf seine deliberative kognitive Form der Informationsverarbeitung zu verlassen und ihr zu vertrauen. Sie genießen dabei die kognitive Anstrengung, wie z. B. das Denken.
Need for Cognition wird als ein Persönlichkeitsmerkmal verstanden, ist situationsübergreifend gültig und stabil gegenüber den Kontextfaktoren der (organisationalen) strategischen Logistikdienstleisterauswahl.
Faith in Intuition beschreibt die Tendenz einer Person, sich auf seine erfahrungs- und emotionsbasierte, automatische Form der Informationsverarbeitung zu verlassen und ihr zu vertrauen.
Faith in Intuition wird als ein Persönlichkeitsmerkmal verstanden, ist situationsübergreifend gültig und stabil gegenüber den Kontextfaktoren der (organisationalen) strategischen Logistikdienstleisterauswahl.
Aufgrund der Tatsache, dass das Rational Experiential Inventory kein eigenständiges Konstrukt darstellt, sondern lediglich ein Überbegriff für die beiden unabhängigen Konstrukte Need for Cognition und Faith in Intuition, kann an dieser Stelle für beide jeweils eine eindimensionale Auffassung argumentiert werden. Bei Faith in Intuition bildet die Tendenz zur Nutzung des erfahrungs-, emotionsbasierten und automatischen Systems der Informationsverarbeitung den zentralen Inhalt des Konstruktes. In Anlehnung an die ursprünglichen Dual-Processing Modelle, wie auch die Cognitive-Experiential Self-Theory, beschreiben die Adjektive „erfahrungsbasiert“, „emotionsbasiert“ und „automatisch“ einen gemeinsamen Sachverhalt, weshalb prinzipiell von einer Eindimensionalität ausgegangen werden kann. Jedoch nehmen Kaufmann et al. (2017) jene Beschreibungen, sowie neue Erkenntnisse in der SCM-Forschung338 zum Anlass die intuitive Form der Informationsverarbeitung zweidimensional zu konzeptualisieren. Die erste Dimension bildet somit die emotionsbasierte Informationsverarbeitung, wohingegen die zweite Dimension die erfahrungsbasierte Informationsverarbeitung darstellt.339 Trotz der empirischen Substanz ihrer Zweidimensionalität soll an dieser Stelle der Konzeptualisierung des Rational-Experiential Inventory gefolgt werden und der Faith in Intuition eine Eindimensionalität unterstellt werden.340 Bei Need for Cognition stellt die Tendenz zur Nutzung des deliberativen kognitiven Systems der Informationsverarbeitung den zentralen Inhalt dar und begründet gleichzeitig die Abgrenzung zu Faith in Intuition. Der Genuss kognitiver Anstrengungen, wie das Denken, bildet indessen keine neue Dimension des Konstruktes, sondern präzisiert lediglich die Nutzung des rationalen Systems der Informationsverarbeitung. Insofern findet eine Mehrdimensionalität in diesem Fall keine Unterstützung. Darüber hinaus konnten keine vorangegangenen Forschungsarbeiten identifiziert werden, die Need for Cognition mehrdimensional konzeptualisieren.341
Konstrukt-Operationalisierung
In der Literatur konnten verschiedene Operationalisierungen für die beiden Konstrukte des Rational Experiential Inventory identifiziert werden. Allerdings weichen diese in den meisten Fällen lediglich hinlänglich der Anzahl der Indikatoren voneinander ab. Grundlegend verschiedene Messansätze konnten nicht registriert werden. Eine Übersicht zu den Messmodellen liefert Tabelle 3.19.
Tabelle 3.19
Relevante Messmodelle der Rational Experiential Inventory342
I knew almost instantly what the best course of action was
E2
I immediately knew which supplier was the right one for the company’s requirements
E3
I directly knew what to do
E4
I immediately was sure about which supplier to choose
Die erste Operationalisierung des Konstrukts Need for Cognition stammt von Cacioppo und Petty (1982) mit 34 Indikatoren. Die hierin verwendeten Indikatoren reflektieren dabei die Tendenz eines Individuums nachzudenken und dieses zu genießen (bspw. A4: „I would prefer complex to simple problems“).343 In einer späteren Fassung reduzieren sie das Messmodell dann bewusst auf 18 Indikatoren, um eine bessere interne Konsistenz zu erzielen.344 Ebenfalls greifen Epstein et al. (1996) auf das originale Messmodell von Cacioppo und Petty (1982) zurück und entnehmen 19 Indikatoren. Gleichzeitig entwickeln sie das Messmodell zu Faith in Intuition. Die 12 Indikatoren reflektieren dabei das Vertrauen in die eigene Intuition (bspw; B1: „I trust my initial feelings about people“).345 In einem zweiten Schritt ihrer Untersuchung verkürzen sie das Rational Experiential Inventory von ursprünglich 31 Indikatoren auf insgesamt 10 Indikatoren. Die Kurzskala umfasst also jeweils 5 Indikatoren für die beiden Messmodelle. Diese ist ebenfalls reliabel und valide, weist allerdings leicht geringere Cronbach Alpha Werte im Vergleich zum ursprünglichen Rational Experiential Inventory auf.346 In einer Überarbeitung der Messmodelle werden schließlich jeweils 20 Indikatoren formuliert.347 Im Ergebnis zeichnen sich insgesamt bessere Reliabilitäten sowie eine stärkere Balance zwischen den beiden Messmodellen ab.348 Eine deutsche Version des Rational Experiential Inventory ist der Arbeit von Keller et al. (2000) zu entnehmen. Hierbei orientieren sich die Autoren für Faith in Intuition an der Arbeit von Epstein et al. (1996) und für Need for Cognition an der Arbeit von Bless et al. (1994).349 Eine deutschsprachige Kurzskala für Need for Cognition wurde darüber hinaus vom Leibniz Institut für Sozialwissenschaften (GESIS) vorgestellt und umfasst vier Indikatoren.350 Die verschiedenen Abwandlungen der Messmodelle der Rational-Experiential Inventory sind in Tabelle 3.20 zusammengefasst. In den bisher analysierten Operationalisierungen des Rational-Experiential Inventory werden die beiden Konstrukte jeweils separat gemessen. Denkbar wäre allerdings auch gewesen, die beiden Konstrukte mittels einer gemeinsamen bipolaren Skala zu messen. Demnach ist eine hohe Ausprägung bei Need for Cognition gleichbedeutend mit einer geringen Ausprägung bei Faith in Intuition (bspw. „I am more of a "thinking-type' person than a 'feeling-type' person“).351 Da dies aber in der Konstrukt-Konzeptualisierung bereits abgelehnt wurde und eine Unabhängigkeit der beiden Messmodelle festgestellt werden konnte, werden die Messmodelle, wie auch in den vorherigen Arbeiten, jeweils mittels unipolarer Skalen abgefragt.
Tabelle 3.20
Abwandlungen des Rational Experiential Inventory352
Konstrukt-Bezeichnung/ Quelle
Messmodell
Cacioppo und Petty (1982), S. 123
„Need for Cognition“
34 Indikatoren, Originalfassung
Epstein et al. (1996), S. 394
„Need for cognition“
19 Indikatoren der Originalfassung von Cacioppo und Petty (1982)
„Faith in Intuition“
12 Indikatoren, Originalfassung
Epstein et al. (1996), S. 399
„Need for cognition“
5 Indikatoren der Orginalfassung (Kurzfassung
„Faith in Intuition“
5 Indikatoren der Originalfassung (Kurzfassung)
Pacini und Epstein (1999), S. 976
„Rationality Scale“
20 Indikatoren, Neufassung basierend auf den Subskalen „Rational Engagement“ und „Rational Ability“
„Experientiality Scale“
20 Indikatoren, Neufassung basierend auf den Subskalen „Experiential Engagement“ und „Experiential Ability“
Keller et al. (2000), S. 93
„Need for Cognition“
14 Indikatoren, deutsche Fassung
„Faith in Intuition“
15 Indikatoren, deutsche Fassung; inkl. 5 neue Indikatoren353
Alternative Operationalisierungen der beiden Konstrukte lassen sich den Arbeiten von Kaufmann et al. (2014) und Kaufmann et al. (2017) entnehmen, wobei hier erneut die Einschränkung der Situationsabhängigkeit anzuführen ist. Dies wird insbesondere anhand der Operationalisierung der erfahrungsbasierten Informationsverarbeitung und deren Vergleich zwischen vergangener und aktueller Entscheidungssituationen offenkundig (D2, D4). Angesichts des vorliegenden Konstrukt-Verständnisses werden die Messmodelle demnach abgelehnt und nicht weiter berücksichtigt.
In Anbetracht vorherrschender Multi-Item Messungen, soll also auch in der vorliegenden Arbeit Need for Cognition wie auch Faith in Intuition unabhängig voneinander mittels mehrerer Likert-skalierter Indikatoren operationalisiert werden. Hierzu bieten sich dem Forscher ein Pool an Indikatoren und möglicher Zusammensetzungen an. Eine begründete Auswahl dieser soll im Rahmen der Indikatorformulierung erfolgen.
In Anbetracht der Eindimensionalität der beiden Konstrukte Need for Cognition und Faith in Intuition, wird in beiden Fällen eine reflektive Spezifikation der Messmodelle für angebracht angesehen. Dies ist auch im Einklang mit den zuvor vorgestellten Messmodellen. Zwar wird eine ausführliche Argumentation hinsichtlich der Spezifikation vermisst, jedoch lässt sich dieser Schluss aus den für die Messmodellprüfung angewandten Gütekriterien ziehen.354 Auf inhaltlicher Ebene reflektieren die verschiedensten Indikatoren entweder das Vertrauen auf die eigene Intuition und damit das erfahrungsbasierte, automatische System oder auf das Nachdenken und der Genuss, der dabei empfunden wird, und damit das deliberative kognitive System der Informationsverarbeitung. Insofern erklären die Indikatoren der jeweiligen Messmodelle einen gemeinsamen Sachverhalt. Demnach erfolgt nun in einem nächsten Schritt die Ableitung der Indikatorformulierungen für die beiden eindimensionalen reflektiven Messmodelle in Übereinstimmung mit der erarbeiteten Konstrukt-Definition.
In Referenz zur Methodenliteratur wurde zuvor die Maxime abgeleitet, bei Multi-Item Messungen möglichst viele Indikatoren zu nutzen.355 Im vorliegenden Fall wäre es demnach möglich die Konstrukte mit 34 Indikatoren bzw. 15 Indikatoren zu messen. Auf der anderen Seite müssen allerdings auch die Auswirkungen einer solch umfangreichen Abfrage beleuchtet werden. Es ist anzunehmen, dass umfangreichere Skalen umso mehr zu Abbrüchen und einem verzerrt konsistenten Antwortverhalten führen.356 Insofern scheint eine Kurzskala für die vorliegende Arbeit zweckmäßiger zu sein. Letztendlich wurden die Indikatoren für beide Konstrukte von Epstein et al. (1996) adaptiert.357 Wie bei der Messmodellentwicklung der individuellen Risikoneigung erörtert, werden auch die beiden, gemäß Konstrukt-Konzeptualisierung weitestgehend als stabil geltende Persönlichkeitsmerkmale Need for Cognition und Faith in Intuition mit folgendem einleitenden Satz abgefragt: „inwieweit treffen die nachfolgenden Aussagen auf Sie persönlich zu“.
Demzufolge werden insgesamt fünf Indikatoren358 von Epstein et al. (1996) zur Messung der Need for Cognition entnommen und unter sprachlichen Anpassungen ins Deutsche übersetzt.359
Ich suche Situationen, in denen gründlich nachgedacht werden muss.361
NFC 03
Ich mache lieber etwas, das meine Denkfähigkeiten herausfordert, als etwas, das wenig Nachdenken erfordert.
NFC 04
Ich ziehe komplexe Probleme einfachen vor.
NFC 05
Langes und intensives Nachdenken über etwas stellt mich sehr zufrieden.362
Ebenfalls werden insgesamt fünf Indikatoren363 von Epstein et al. (1996) zur Messung der Faith in Intuition entnommen und unter sprachlichen Anpassungen ins Deutsche übersetzt.364
FII 01
Ich vertraue meinen anfänglichen Gefühlen gegenüber Menschen.
FII 02
Ich glaube daran, dass ich meinen Ahnungen vertrauen kann.
FII 03
Mein erster Eindruck von Menschen ist fast immer richtig.
FII 04
Wenn es darum geht, Menschen zu vertrauen, kann ich mich meist auf mein "Bauchgefühl" verlassen.
FII 05
Ich spüre normalerweise, ob eine Person richtig oder falsch liegt, auch wenn ich nicht erklären kann, woher ich das weiß.
Tabelle 3.21 fasst die Messmodelle Need for Cognition und Faith in Intuition mit den Begriffsverständnissen, den Indikatorformulierungen und den Individualverweisen zu den Indikatoren zusammen.
Tabelle 3.21
Messmodelle Need for Cognition und Faith in Intuition365
Need for Cognition (NFC)
Begriffsverständnis
Need for Cognition beschreibt die Tendenz einer Person, sich auf seine deliberative kognitive Form der Informationsverarbeitung zu verlassen und ihr zu vertrauen. Sie genießen dabei die kognitive Anstrengung, wie z. B. das Denken.
Need for Cognition wird als ein Persönlichkeitsmerkmal verstanden, ist situationsübergreifend gültig und stabil gegenüber den Kontextfaktoren der (organisationalen) strategischen Logistikdienstleisterauswahl.
Eigenschaft
Eindimensional, reflektiv, Likert-Skala
Skala
1 = „Trifft gar nicht zu“; 7 = „Trifft voll zu“
Indikatoren
NFC 01
Ich mag es, viel nachdenken zu müssen.
A1 – Epstein et al. (1996)
NFC 02
Ich suche Situationen, in denen gründlich nachgedacht werden muss.
A2 – Epstein et al. (1996)
NFC 03
Ich mache lieber etwas, das meine Denkfähigkeiten herausfordert, als etwas, das wenig Nachdenken erfordert.
A3 – Epstein et al. (1996)
NFC 04
Ich ziehe komplexe Probleme einfachen vor.
A4 – Epstein et al. (1996)
NFC 05
Langes und intensives Nachdenken über etwas stellt mich sehr zufrieden.
A5 – Epstein et al. (1996)
Faith in Intuition (FII)
Begriffsverständnis
Faith in Intuition beschreibt die Tendenz einer Person, sich auf seine erfahrungsbasierte, automatische Form der Informationsverarbeitung zu verlassen und ihr zu vertrauen.
Faith in Intuition wird als ein Persönlichkeitsmerkmal verstanden, ist situationsübergreifend gültig und stabil gegenüber den Kontextfaktoren der (organisationalen) strategischen Logistikdienstleisterauswahl.
Eigenschaft
Eindimensional, reflektiv, Likert-Skala
Skala
1 = „Trifft gar nicht zu“; 7 = „Trifft voll zu“
Indikatoren
FII 01
Ich vertraue meinen anfänglichen Gefühlen gegenüber Menschen.
B1 – Epstein et al. (1996)
FII 02
Ich glaube daran, dass ich meinen Ahnungen vertrauen kann.
B2 – Epstein et al. (1996)
FII 03
Mein erster Eindruck von Menschen ist fast immer richtig.
B3 – Epstein et al. (1996)
FII 04
Wenn es darum geht, Menschen zu vertrauen, kann ich mich meist auf mein "Bauchgefühl" verlassen.
B4 – Epstein et al. (1996)
FII 05
Ich spüre normalerweise, ob eine Person richtig oder falsch liegt, auch wenn ich nicht erklären kann, woher ich das weiß.
B5 – Epstein et al. (1996)
3.1.9 Kontrollvariablen
Zur Messung der Kontrollvariablen wurde soweit möglich auf bestehende Operationalisierungen zurückgegriffen.366 Da bei der Entwicklung des Hypothesensystems zahlreiche potenzielle alternative Einflussfaktoren ermittelt wurden, die als Multi-Item Messungen den Fragebogen maßgeblich verlängern und gleichzeitig die Wahrscheinlichkeit von Abbrüchen erhöhen würden, wurde der Einsatz von Single-Item bzw. Global Item Messungen als zweckmäßiger befunden.367 Auch in publizierten internationalen Zeitschriften ist es üblich bei Kontrollvariablen Single-Item Messung zu verwenden. Gemäß einer Literaturanalyse von Boyd et al. (2005) beträgt der Anteil an Single Item Messungen bei Kontrollvariablen ca. 80 %.368 So wurden beispielsweise für die Messung der Verfahrenskontrolle nicht die reflektiven Multi-Item Messungen von Bunn (1993) mit 10 Indikatoren369 oder von Munnukka und Järvi (2015), Moon und Tikoo (2002) und Hunter et al. (2006) mit jeweils 4 Indikatoren übernommen,370 sondern jene Global-Item Messung von Zablah et al. (2010).371 Auch bei der Operationalisierung der Kontrollvariable „Umfang der Wahlmöglichkeiten“ wurde statt auf die Multi-Item Messungen von Bunn (1993) oder Hunter et al. (2006) zurückzugreifen,372 ein globales Item aus diesen abgeleitet. Die Definitionen sowie die Operationalisierungen der zehn Kontrollvariablen373 sind in Tabelle 3.22 zusammengefasst.
Tabelle 3.22
Definitionen und Operationalisierungen der Kontrollvariablen374
Konstrukt
Definition
Operationalisierung
Umfang der Wahlmöglichkeiten (UMW)
Der Umfang der Wahlmöglichkeiten beschreibt die vom Beschaffungsmanager wahrgenommene Breite der Alternativen, die ihm in der strategischen Logistikdienstleisterauswahl zur Verfügung stehen.375
Es gab viele Logistikdienstleister, die die Dienstleistung hätten erbringen können.376
Verfahrenskontrolle (VKO)
Die Verfahrenskontrolle beschreibt das Ausmaß, in dem der individuelle Entscheidungsprozess im Rahmen der strategischen Logistikdienstleisterauswahl durch vorherige Erfahrungen bestimmt wird. Dies umfasst etablierte Richtlinien, Vorgänge und Transaktionsnormen.377
Wir hatten klare Regeln, wie diese strategische LogistikDL-Auswahl durchgeführt werden sollte.378
Wichtigkeit der strategischen Lieferantenauswahl
(WSL)
Die Wahrnehmung der finanziellen und strategischen Wichtigkeit der strategischen Logistikdienstleisterauswahl durch den Beschaffungsmanager.379
Im Vergleich zu anderen strategischen Lieferantenauswahlentscheidungen ihres Unternehmens war diese in Erinnerung gerufene strategische LogistikDL.Auswahl… [überhaupt nicht wichtig – äußerst wichtig]380
Selbst-wahrgenommenes Involvement (SWI)
Das Involvement der Beschaffungsmanager an der Lieferantenauswahl.381
In welchem Ausmaß waren Sie an der strategischen LogistikDL-Auswahl beteiligt?… [sehr schwach – sehr stark]382
Lieferantenerfahrung (LEF)
Die Erfahrung der Beschaffungsmanager mit den zur Auswahl stehenden Logistikdienstleistern.383
Wie viel Erfahrung hatten Sie mit den Logistikdienstleistern, die damals zur Auswahl gestanden haben?… [sehr wenig – sehr viel]384
Erfahrung mit der Logistikdienstleistung (ELD)
Die Erfahrung der Beschaffungsmanager mit der zu beschaffenden Logistikdienstleistung.385
Wie viel Erfahrung hatten Sie mit der von Ihnen in Erinnerung gerufenen Logistikdienstleistung vor der strategischen Lieferantenauswahl?… [sehr wenig – sehr viel]386
Buying Center Größe (BCG)
Die Größe des Buying Centers als Anzahl der Personen die an der strategischen Logistikdienstleisterauswahl beteiligt waren.387
Wie viele Personen waren an der strategischen LogistikDL-Auswahl beteiligt? __________ Personen388
Dauer der strategischen Lieferantenauswahl
(DLA)
Die Zeitdauer der strategischen Logistikdienstleisterauswahl; von Bedarfsfeststellung bis Lieferantenauswahl.389
Bitte schätzen Sie, wie viele Wochen, die von Ihnen in Erinnerung gerufene strategische LogistikDL-Auswahl andauerte. __________ Wochen.390
Gesamtumsatz (UMS)
Bitte schätzen Sie den weltweiten Gesamtumsatz (GU) des Unternehmens, in dem die strategische LogistikDL-Auswahl stattfand.391
Mitarbeiterzahl (MAZ)
Bitte schätzen Sie die Mitarbeiterzahl (weltweit) des Unternehmens, in dem die strategische LogistikDL-Auswahl stattfand.392
3.2 Potenzielle Verzerrungen in der quantitativen Umfrageforschung – Maßnahmen und Kontrollmöglichkeiten
Wurden die Daten einer Untersuchung gemäß den vorgegeben Gütekriterien für Messmodelle und Strukturmodelle geprüft und die Ergebnisse als robust verifiziert, so kann es dennoch sein, dass den Ergebnissen potenzielle Verzerrungen unterliegen. Sofern solche Verzerrungen vorliegen, besteht die Gefahr, dass die Ergebnisse und die hieraus abgeleiteten Schlussfolgerungen wenig aussagekräftig sind. Das Kapitel verfolgt also das Ziel die methodische Strenge (MS 2) der Untersuchung zu gewährleisten. Entstehen können solche Verzerrungen nach Döring und Bortz (2016) aufgrund des Tests, der Testanwendung oder der Testperson393 selbst.394 Podsakoff et al. (2003) dagegen sehen den Prozess auf Seiten des Befragten, die Eigenschaften der Fragen, die Eigenschaften des Fragenkontextes, sowie die Eigenschaften zum Kontext der Messung als ursächlich für derartige Verzerrungen.395 Um die Wahrscheinlichkeit verzerrter Ergebnisse und Schlussfolgerungen zu reduzieren, sollten frühzeitig in einem Forschungsprojekt die potenziellen Verzerrungen einer Untersuchung adressiert werden.396 Im Rahmen der vorliegenden Arbeit wurden anlehnend an die Klassifizierung von Vomberg und Klarmann (2022) der Non-Response Bias und der Non-Sampling Bias als Fehler der Repräsentativität (Kapitelabschnitt 3.2.1), der Informant Bias, der Common Method Bias, der Social-Desirability Bias, die Antworttendenzen und Ausreißer, sowie der Recall Bias als Fehler der Messung (Kapitelabschnitt 3.2.2) als besonders kritisch eingestuft. Die Begründung hierfür liegt in der Art und Weise der Datenerhebung (Umfrage397, Teilerhebung398) sowie in der Spezifikation des Forschungskontextes (retrospektiv, verhaltenswissenschaftliche Untersuchung, spezifische Erfahrungen mit Logistikdienstleisterauswahl399).
In einem nächsten Schritt galt es dann zu prüfen, wie mit den potenziellen Verzerrungen umgegangen wird. Zum einen besteht die Möglichkeit verschiedene Maßnahmen bereits bei der Fragebogengestaltung und bei der Datenerhebung zu ergreifen. Diese zielen primär darauf ab das Auftreten der Verzerrungen möglichst frühzeitig zu verhindern. Da dies allerdings nicht vollumfänglich garantiert werden kann, erscheint es zusätzlich erforderlich, die erhobenen Daten auf Verzerrungen zu kontrollieren. Hierbei können Kontrollen vor (ex-ante) und nach (ex-post) der Hauptuntersuchung durchgeführt werden.400 Diese Dreiteilung in generelle Maßnahmen, Ex-ante Checks und Ex-post Checks bildet im Folgenden auch die Struktur der Unterkapitel.401
3.2.1 Fehler der Repräsentativität
Im Rahmen quantitativer Umfragestudien ist es nicht immer möglich alle Einheiten der Grundgesamtheit (Vollerhebungen) zu befragen. Forschende sehen sich dabei Problemen der Quantifizierung und Erfassung von Grundgesamtheiten, sowie potenziell hohen Kosten konfrontiert.402 Aus diesem Grund sind häufiger Studien anzutreffen bei denen eine Teilmenge der Grundgesamtheit, die sogenannte Stichprobe, gebildet und befragt wird.403 Unabhängig davon, ob es sich um Voll- oder Teilerhebungen handelt, ist nicht sichergestellt, dass auch alle kontaktierten Einheiten tatsächlich an der Umfrage teilnehmen. Insofern bezeichnet die effektive Stichprobe diejenige Anzahl an Einheiten, von denen tatsächlich Informationen eingeholt werden konnten.404 Da angestrebt wird auf Basis der Datenauswertung einer effektiven Stichprobe Schlussfolgerungen für die Grundgesamtheit ziehen zu können, sollten diese beiden auch in zentralen Merkmalen (e.g. Berufserfahrung, Einkaufvolumen, Umsatz) übereinstimmen; im Idealfall sich exakt entsprechen. Anders ausgedrückt sollte die effektive Stichprobe für die Grundgesamtheit repräsentativ sein.405
Abbildung 3.2
Einordnung des Non-Sampling Bias und des Non-Response Bias406
Damit ergeben sich aufgrund der Diskrepanzen zwischen Grundgesamtheit, Stichprobe und effektiver Stichprobe mögliche Fehlerquellen für die Repräsentativität der effektiven Stichprobe (siehe Abbildung 3.2). Zum einen kann der sogenannte Non-Sampling Bias (Stichprobenfehler) zwischen der Grundgesamtheit und der Stichprobe (Kapitelabschnitt 3.2.1.1), und zum anderen der Non-Response Bias (Fehler durch ungleichmäßige Antwortverweigerung) zwischen der Stichprobe und der effektiven Stichprobe auftreten und die Repräsentativität gefährden (Kapitelabschnitt 3.2.1.2).407 Daher sollen nachfolgend die Maßnahmen zur Reduktion, sowie Kontrollmöglichkeiten dieser beiden Fehler diskutiert werden.
3.2.1.1 Non-Sampling Bias
Gemäß Abbildung 3.2 lässt sich der Non-Sampling Bias, auch genannt Selection Bias408, als Fehler der Unter- oder Übergewichtung von Teilsegmenten der Grundgesamtheit in der Stichprobe definieren. Der Fehler entsteht demnach proaktiv durch den Forschenden, während er seine Stichprobe bildet.409 Hierfür können zwei grundsätzliche Ursachen ausgemacht werden: Zum einen kann die Unkenntnis des Forschenden über seine Grundgesamtheit zu einem Non-Sampling Bias führen.410 Zum anderen stehen den Forschenden nicht immer repräsentative Stichproben zur Verfügung oder die Bildung einer solchen ist durch fehlende Informationen über Unternehmen, Individuen oder mangels Datenbanken erschwert.411
Eine erste Maßnahme, um dem Non-Sampling Bias entgegenzuwirken betrifft zunächst die Grundgesamtheit. Diese sollte vor der Datenerhebung bestimmt und offengelegt werden (siehe Tabelle 3.23).412 Bei der Bildung der Stichprobe sollte der Forschende dann die Selektionskriterien zur Generierung der Stichprobe stets an die Definition, bzw. den Merkmalen der Grundgesamtheit anlehnen.413 Beispielsweise kann dies entlang der Berufsbezeichnung, der Nationalität oder der Berufserfahrung erfolgen. In einem nächsten Schritt fordert die Methodenliteratur dann, dass die Ziehung der Stichprobe in der Niederschrift transparent gemacht wird.414 Auf diese Forderungen wird in Kapitelabschnitt 4.1.1 im Detail eingegangen und diesen damit auch gleichzeitig entsprochen.
Zur Kontrolle bietet sich eine Untersuchung auf Strukturgleichheit von Grundgesamtheit und Stichprobe an.415 Hierzu eigenen sich Merkmale wie Mitarbeiterzahl, Umsatz oder Branchenzugehörigkeit. Voraussetzung hierfür ist allerdings das Vorliegen von Daten der Stichprobe, als auch der Grundgesamtheit.416 Liegen diese nicht vor, ist eine interferenzstatistische Prüfung auf Strukturgleichheit nur schwer möglich.417
Tabelle 3.23
Maßnahmen und Kontrollmöglichkeiten des Non-Sampling Bias418
Beschreibung
Generelle Maßnahmen
Ex-ante Checks
Ex-Post-Checks
Non-Sampling Bias
Fehler der Unter- oder Übergewichtung von Teilsegmenten der Grundgesamtheit bei der Bildung der Stichprobe.419
Grundgesamtheit bestimmen und offenlegen.
Bildung der Stichprobe transparent machen.
Datenerhebung:
Selektionskriterien zur Generierung der Stichprobe an Grundgesamtheit anlehnen.
Untersuchung auf Strukturgleichheit von Grundgesamtheit und Stichprobe anhand zentraler Merkmale.
3.2.1.2 Non-Response Bias
Ein grundsätzliches Problem in der quantitativen Umfrageforschung besteht darin, dass nicht alle Personen der Stichprobe tatsächlich aktiv an der Studie teilnehmen oder diese abbrechen und damit auch nicht Teil der effektiven Stichprobe sind.420 Man spricht dabei auch von Unit-Non-Responses. Zu Fehlern kann dies dann führen, wenn sich der Datensatz maßgeblich von der Stichprobe unterscheidet. Beispielsweise dadurch, dass eine bestimmte relevante Personengruppe mit der Umfrage nicht erreicht (Nichterreichbarkeit) oder zur Teilnahme motiviert werden konnte (Teilnahmeverweigerung). In Folge kann eine Personengruppe in der effektiven Stichprobe unterrepräsentiert oder eine andere überrepräsentiert sein.421 Zur Minimierung des Risikos für einen Non-Response Bias sollte daher neben der Maximierung der Rücklaufquote auch eine Steigerung der Repräsentativität der effektiven Stichprobe angestrebt werden. Die zu diesem Zweck durchgeführten Maßnahmen bei der Fragebogengestaltung und der Datenerhebung, sowie Kontrollmöglichkeiten sind in Tabelle 3.24 aufgelistet.
Eine erste Maßnahme zur Steigerung des Rücklaufs und der Repräsentativität betrifft den Titel der Umfrage. So wurde zum einen vermieden den Untersuchungsgegenstand „Marke“ offenzulegen und zum anderen versucht bei den Probanden Interesse zu wecken und Relevanz zu signalisieren.422 Daher wurde folgender Titel für die Befragung gewählt: „Einflussfaktoren bei der strategischen Auswahl von Logistikdienstleistern“. Ferner wurde beim Anschreiben als auch im Fragebogen darauf geachtet, die Wichtigkeit der Forschung und der Teilnahme herauszustellen, um eine moralische Verpflichtung gegenüber der Befragung und des Forschenden aufzubauen.423 Eine weitere Möglichkeit zur Steigerung des Rücklaufs bietet das Angebot von Incentives.424 Zwar ist der Einsatz und deren Nutzen umstritten425, dennoch wurde es für die vorliegende Untersuchung als sinnvoll erachtet. So wurde den Probanden ein Ergebnisbericht426 in Aussicht gestellt, eine gemeinnützige Spende für jeden ausgefüllten Fragebogen, sowie die Verlosung von Gutscheinen427 versprochen. Schließlich wurde auf die Datenschutzbestimmungen und die generelle Anonymität der Probanden hingewiesen428, sowie eine angemessene Länge des Fragebogens umgesetzt.
Während der Datenerhebung wurde darauf geachtet, dass die Probanden persönlich angesprochen werden und falls nötig zeitnah individuelle Nachrichten und Informationen erhielten.429 Eine weitere Möglichkeit zur Steigerung der Rücklaufquote und späteren Kontrolle des Non-Response Bias bieten Erinnerungsschreiben.430 Beispielsweise geht Kittleson (1997) davon aus, dass sich der Rücklauf durch den Einsatz von Erinnerungsschreiben verdoppeln lässt.431 Für die Kontakthäufigkeit sollte aber ein geeignetes Maß gefunden werden, um zu verhindern, dass die potenziellen Teilnehmer resistent gegenüber den Erinnerungen werden. Laut den Empfehlungen von Kittleson (1997) wurde den Probanden letztendlich ein Erinnerungsschreiben zugeschickt.432
Zur Kontrolle (ex-ante checks) des Non-Response Bias und damit zur Sicherstellung der Repräsentativität der effektiven Stichprobe bieten sich insbesondere zwei Möglichkeiten an. So können nach Berechnung der Netto-Rücklaufquote und der Größe der effektiven Stichprobe diese mit themenkongruenten Studien aus der Vergangenheit auf Plausibilität kontrolliert werden. Eine zu geringe Rücklaufquote oder Größe der effektiven Stichprobe erhöht dabei die Gefahr, dass Non-Response Bias vorliegen könnte.433 Zur tatsächlichen Prüfung, ob Non-Response Bias vorliegt, bietet sich dann eine Vergleichsanalyse an. Demnach können die Teilnehmer und Nicht-Teilnehmer miteinander verglichen werden oder aber die Strukturgleichheit von Stichprobe und effektiver Stichprobe anhand zentraler Merkmale (e.g, Berufsbezeichnung) geprüft werden. Da für die Stichprobe als auch für die Nicht-Teilnehmer nur selten Daten für derartige Kontrollen vorliegen bzw. erhoben werden können, schlagen Armstrong und Overton (1977) dagegen einen Vergleich von früh Antwortenden und spät Antwortenden vor. Die Annahme besteht darin, dass sich die spät Antwortenden und die Nicht-Teilnehmer ähnlich sind.434 Zur Bestimmung der spät Antwortenden können beispielsweise die Zeitpunkte der Erinnerungsschreiben herangezogen werden. Alternativ können auch die Incentivenehmer und die Nicht-Incentivenehmer mit Hilfe eines Mittelwerttests oder einer MANOVA435 auf signifikante Unterschiede kontrolliert werden und so ein Non-Response Bias ausgeschlossen werden Hierbei gelten die Incentivenehmer als vergleichbar mit den Nicht-Teilnehmern.436
Tabelle 3.24
Maßnahmen und Kontrollmöglichkeiten des Non-Response Bias437
Beschreibung
Generelle Maßnahmen
Ex-ante Checks
Ex-post Checks
Non-Response Bias
Fehler der Unter- oder Überrepräsentation von Teilsegmenten der Stichprobe in der effektiven Stichprobe ausgelöst durch ungleichmäßige Antwortverweigerungen.438
Fragebogen:
Interessanter und ansprechender Titel der Befragung.:
Moralische Verpflichtung und Wichtigkeit der Forschung und der Teilnahme ausdrücken.
Incentives.
Länge des Fragebogens.
Hinweis auf Datenschutz/Anonymität.
Datenerhebung:
Personalisierte Anrede.
Häufige Kontaktaufnahme – Erinnerungsschreiben.
Berechnung von Netto-Rücklaufquote sowie Größe der effektiven Stichprobe und Vergleich mit themenkongruenten Studien.
Untersuchung auf Strukturgleichheit von Stichprobe und effektiver Stichprobe anhand zentraler Merkmale.
Vergleich von frühen und späten Umfrageteilnehmern oder Incenticenehmern und Nicht-Incentivenehmern mittels Mittelwerttest oder MANOVA.
Item Non-Response (Missing Values)
Missing Values treten auf, wenn Respondenten einzelne Fragen nicht beantworten können oder wollen.439
Datenerhebung:
Fortschreiten der Befragung nur nach vollständigem Ausfüllen (bei den Modellvariablen).
Missing Value Analyse.
Damit wurde bisher nur das vollständige Fehlen von Fragebögen thematisiert, jedoch tritt auch häufig der Fall auf, dass lediglich einzelne Fragen nicht beantwortet wurden. Hierbei handelt es sich um Item-Non-Response oder um sogenannte Missing Values. Diese können auftreten, wenn die Respondenten einzelne Fragen nicht beantworten können bzw. wollen.440 Auch hier stellt sich die Frage, wie diese verhindert werden können und wie mit diesen umzugehen ist. Zur Reduktion von Missing Values kann in der Umfragesoftware das vollständige Ausfüllen des Fragebogens oder eines Teils des Fragebogens als notwendige Bedingung festgelegt werden. Dies wurde insbesondere für die Modellvariablen als sinnvoll erachtet. Zum Umgang mit fehlenden Werten bieten sich Forschenden verschiedene Möglichkeiten. Zum einen können all jene Datensätze mit fehlenden Werten ausgeschlossen werden, zum anderen können sogenannte Imputationsverfahren eingesetzt werden.441 Die Gefahr beim Löschen von ganzen Datensätzen (listwise deletion) aufgrund einzelner fehlender Werte, besteht darin, dass systematisch bestimmte Gruppen gelöscht werden und damit unterrepräsentiert sind. Schließlich kann dies zu einer aktiven Verzerrung der Schätzparameter führen.442 Bei den Imputationsverfahren hingegen können unter anderem Maximum-Likelihood Schätzungen, Mittelwertersetzungen (mean replacement) oder Ersetzungen durch ähnliche Antwortverhalten angewendet werden.443 Diese Vorgehen sind allerdings auch nicht ohne Kritik. So soll die Mittelwertersetzung für eine geringere Varianz bei den Variablen sorgen und die Gründe, weshalb es zu den fehlenden Werten gekommen ist, vernachlässigen.444 Daher wird vorgeschlagen, die Wahl des Verfahrens nicht vor der Datenerhebung festzusetzen, sondern erst bei der Identifikation und Beurteilung der Missing Values (siehe Kapitelabschnitt 4.1.2.2).445
3.2.2 Fehler der Messung
Neben den Fehlern der Repräsentativität, können auch Fehler der Messung auftreten. Diese bedingen Unterschiede zwischen den wahren Werten der Teilnehmer und den erfassten Werten im Datensatz. So können beispielsweise die Teilnehmer selbst, Kontextfaktoren, wie Zeitdruck, oder die eingesetzte Methodik und deren Umsetzung dafür sorgen, dass die Probanden nicht den wahren Wert, sondern einen zufälligen oder systematisch verzerrten Wert angeben.446 Im Folgenden werden daher der Informant Bias (Kapitelabschnitt 3.2.2.1), der Common Method Bias (Kapitelabschnitt 3.2.2.2), der Social Desirability Bias (Kapitelabschnitt 3.2.2.3), die Antworttendenzen (Kapitelabschnitt 3.2.2.4) und der Recall Bias (Kapitelabschnitt 3.2.2.5) als solche Fehler der Messung definiert und erläutert, bevor im Anschluss für jeden dieser Fehler generelle Maßnahmen, ex-ante und ex-post Checks diskutiert werden.
3.2.2.1 Informant Bias
In der Managementforschung ist es nicht unüblich, dass einzelne Personen zu Sachverhalten auf Unternehmens- oder Gruppenebene befragt werden.447 So wird beispielsweise die Performance bei Studien zur Lieferantenauswahl häufig nicht mit Hilfe objektiver Unternehmensdaten erfasst, sondern basierend auf den Einschätzungen eines einzelnen Unternehmensrepräsentanten.448 Problematisch bei diesem Vorgehen ist allerdings, dass die Befragung über Schlüsselinformanten des Unternehmens zu systematischen Verzerrungen aufgrund der Charakteristiken des Informanten führen kann. Es gilt demnach zu klären, inwiefern die Antworten bzw. Einschätzungen des befragten Schlüsselinformanten korrekt und verlässlich sind.449 Zwar wird in der vorliegenden Studie kein organisationaler Sachverhalt, sondern das individuelle Verhalten im organisationalen Kontext (Selbstauskunft) untersucht, wonach die Problematik eines „Key Informant Bias“ gemäß der ursprünglichen Definition eigentlich zu vernachlässigen wäre450, dennoch gilt auch für die vorliegende Studie sicherzustellen und zu kontrollieren, dass und inwiefern die Informanten für den Untersuchungsgegenstand aussagefähig und relevant sind.451 Insofern sollen im Rahmen dieses Unterkapitels mögliche Verzerrungen aufgrund der Charakteristiken der Informanten adressiert werden.452
Bereits bei der Durchführung der Befragung sollte sichergestellt werden, dass nur relevante Informanten den Fragebogen erhalten und ausfüllen. Zusätzlich zu den bereits in Kapitelabschnitt 3.2.1.1 thematisierten Maßnahmen bei der Bildung der Stichprobe453, wurde zu Beginn des Fragebogens eine Filterfrage eingebaut.454 Mit Hilfe derer sollen all jene Teilnehmer exkludiert werden, die keine Erfahrungen mit der strategischen Auswahl von Logistikdienstleistern aufweisen.455 Zudem wurde in den versendeten Anschreiben auf die Notwendigkeit dieser Erfahrung explizit hingewiesen. Im Rahmen der Datenbereinigung kann dann die Auswertung der Filterfrage erfolgen.456
Tabelle 3.25
Maßnahmen und Kontrollmöglichkeiten des Informant Bias457
Beschreibung
Generelle Maßnahmen
Ex-ante Checks
Ex-post Checks
Informant Bias
Systematische Verzerrungen durch die Verwendung von Schlüsselinformanten bei der Studie von Sachverhalten auf einer höheren Untersuchungsebene (e.g. Unternehmen). Diese ergeben sich beispielsweise aufgrund der Charakteristiken (e.g. Position im Unternehmen) des Schlüsselinformanten.458
Fragebogen:
Selektionsfragen zur Eignung der Person.
Exklusion nicht-relevanter Personen.
Teilen des Samples gemäß der Funktionsbereiche und Durchführung einer Multi-Gruppen Analyse des Strukturmodells.
Teilen des Samples gemäß der Berufserfahrung und Durchführung einer Multi-Gruppen Analyse des Strukturmodells.
Teilen des Samples gemäß der Entscheidungsbefugnis und Durchführung einer Multi-Gruppen Analyse des Strukturmodells.
Wie bei der Definition des Informant Bias erwähnt, ist dieser vornehmlich auf die Charakteristiken der Respondenten zurückzuführen. Beispielhaft machen dies verschiedene Autoren an der Funktionszugehörigkeit459 oder an der Berufserfahrung460 fest. Daher bietet es sich an, das Antwortverhalten der Informanten insbesondere entlang dieser beiden Charakteristiken zu kontrollieren. Ferner wurden bei der Befragung keine Restriktion hinsichtlich der Entscheidungsverantwortung vorgenommen. Es wurde davon ausgegangen, dass auch ein Nicht-Entscheidungsverantwortlicher die Marken von Logistikdienstleistern wahrnimmt und diese in seiner Informationsverarbeitung berücksichtigt.461 Um zu kontrollieren, inwiefern die Verantwortlichkeiten der Respondenten zu Verzerrungen führen, scheint es sinnvoll, das Antwortverhalten der Entscheider und der Nicht-Entscheider ebenfalls miteinander zu vergleichen.462 Zu diesem Zweck wurden in einem ersten Schritt die entsprechenden Variablen im Fragebogen eingebaut. In einem zweiten Schritt werden dann, wie in Tabelle 3.25 dargestellt, nach der Strukturmodellprüfung drei Multigruppen-Vergleiche entlang der Funktionsbereiche, der Berufserfahrung und der Entscheidungsverantwortung durchgeführt.463 Das übergeordnete Ziel dabei ist es, systematische Unterschiede zwischen den verschiedenen Informanten auszumachen und dadurch die Gefahr eines Informant Bias beurteilen zu können.
3.2.2.2 Common Method Bias
Neben dem Informant Bias stellt der Common Method Bias die zweite Hauptfehlerquelle quantitativ-empirischer Forschungsarbeiten dar.464 Während Podsakoff et al. (2003) eine sehr umfassende Definition des Common Method Bias präsentieren, wobei sowohl der Social Desirability Bias, die Antworttendenzen oder der Recall Bias diesem zugeordnet werden können,465 existieren auch Definitionen, die den Common Method Bis in einem engeren Sinne beschreiben. Diesen zufolge entsteht der Common Method Bias dadurch, dass zur Messung der abhängigen und unabhängigen Variable dieselbe Quelle (Respondent) befragt wird. Dies führt in Folge zu einer Verzerrung der Kovarianzstruktur der betrachten Variablen.466 Wie auch bei Vomberg und Klarmann (2022) oder Klarmann (2008) soll für die vorliegende Arbeit eine solche eng gefasste Definition des Common Method Bias Anwendung finden. Infolgedessen werden der Social Desiraibility Bias, die Antworttendenzen und der Recall Bias in separaten Kapiteln betrachtet.467
Gemäß der Definition des Common Method Bias ist eine offensichtliche Maßnahme zur frühzeitigen Reduktion möglicher Verzerrungen, die Befragung unterschiedlicher Datenquellen oder das Verwenden von Sekundärdaten.468 Ein solches Vorgehen wurde allerdings aufgrund des verhaltenswissenschaftlichen Charakters der Studie grundsätzlich als nicht sinnvoll eingestuft.469 Insbesondere die Intention einer Person (Markensensibilität) kann von einer außenstehenden Partei, zum Beispiel eines Geschäftspartners auf Seiten der Logistikdienstleister, nur bedingt beurteilt werden. Auch die derart gestaltete Abfrage der Logistikdienstleistungskomplexität scheint aufgrund divergenter Wissensstände und Wahrnehmungen hinsichtlich der Logistikleistungen unpraktikabel.470 Hingegen wäre eine Bewertung der Persönlichkeitsmerkmale durch Kollegen471 oder eine Abfrage der Markenwichtigkeit durch Geschäftspartner bei den Logistikdienstleistern denkbar gewesen. Nichtsdestotrotz musste dieses Vorhaben aufgrund des Aufwands zur Identifikation geeigneter Respondenten verworfen werden.472
Tabelle 3.26
Maßnahmen und Kontrollmöglichkeiten des Common Method Bias473
Beschreibung
Generelle Maßnahmen
Ex-ante Checks
Ex-post Checks
Common Method Bias
Verzerrungen der Kovarianzstruktur, welche aufgrund der Verwendung derselben Datenquelle zur Messung der der abhängigen und unabhängigen Variablen auftreten.474
Fragebogen:
Titel der Umfrage sollte kein Hinweis auf Marke als Untersuchungsgegenstand geben.
Verwendung unterschiedlicher Skalen bei der Messung der Markensensibilität und Markenwichtigkeit.
Trennung der abhängigen und unabhängigen Variablen im Fragebogen.
Harmans Ein-Faktor-Test.
Vollständiger Kollinearitätstest.
Die Markenwichtigkeit jedoch betreffend, konnte eine andere Skala, wie zur Messung der Markensensibilität, eingesetzt werden. Der Verwendung unterschiedlicher Skalen wird ebenfalls eine Reduktion des Common Method Bias zugesprochen.475 In Anlehnung an Kaufmann et al. (2017), sowie Kaufmann et al. (2014) soll auch das eigentliche Forschungsinteresse nicht im Titel der Umfrage476 preisgegeben werden.477 Da verhindert werden soll, dass Probanden Rückschlüsse auf die Kausalitäten der Untersuchung ziehen können, wurden zudem kritische und inhaltlich verwandte Variablen im Fragebogen bewusst durch „Puffer-Variablen“ voneinander getrennt (siehe Tabelle 3.26).478
Bei der post-hoc Kontrolle des Common Method Bias bieten sich den Forschenden verschiedene Möglichkeiten.479 Ein häufig eingesetztes Verfahren geht auf die Autoren Lindell und Whitney (2001) zurück. Hierbei wird eine Variable in den Fragebogen aufgenommen, die in keinem kausalen Zusammenhang zu den Modellvariablen steht – eine sogenannte „Marker“-Variable.480 Diesem Verfahren wurde allerdings angesichts einer Verlängerung des Fragebogens durch Inklusion eines weiteren Multi-Item Konstruktes nicht gefolgt.481 Während den Vorarbeiten der Erhebungen konnten derweilen auch andere Möglichkeiten identifiziert werden, die mit weniger Aufwand und mit geringerem Abbruchrisiko umsetzbar waren. Hierzu zählt beispielsweise Harmans Ein-Faktor-Test. Dieser wird mittels einer explorativen Faktorenanalyse/Hauptkomponentenanalyse berechnet. Dabei wird überprüft, ob ein Faktor mehr als 50 % der gesamten Kovarianz der Modellvariablen erklärt. Übertrifft dieser eine Faktor den kritischen Wert, kann auf das Vorliegen eines Common Method Bias geschlussfolgert werden.482 Trotz der weit verbreiteten Anwendung des Harmon Ein-Faktor-Tests ist dieser nicht frei von Kritik.483 Aufgrund dessen soll ergänzend noch der von Kock und Lynn (2012) eingeführte vollständige Kollinearitätstest angewendet werden.484 Zunächst wird hierbei eine zufällige „Dummy“-Variable generiert. Die Modellvariablen wirken dann als unabhängige Variablen auf die „Dummy“-Variable ein. Schließlich können zur Beurteilung des Common Method Bias die VIF-Werte der unabhängigen latenten Variablen herangezogen werden. Als kritisch definieren Kock und Lynn (2012) VIF-Werte größer 3,3.485
3.2.2.3 Social-Desirability Bias
Bei Befragungen zu besonders sensiblen Konstrukten wird in der Forschung häufig eine Kontrolle des Social-Desiabiliy Bias gefordert. Bei diesen Konstrukten handelt es sich beispielsweise um Persönlichkeitsmerkmale, Einstellungen oder Verhalten.486 Hier wird angenommen, dass Probanden die Antworten geben, von denen sie glauben sie sind sozial erwünscht. Letzten Endes wird damit nicht deren wahre(s) Einstellung (Verhalten) erfasst, sondern jene(s), welche(s) die geringste soziale Ablehnung erfährt.487 Das Ziel des Probanden ist es also sich selbst besser darzustellen. Weshalb auch alternativ die plakative Beschreibung von Pauls und Stemmler (2003) herangezogen werden kann: „[…] a tendency to respond in a way that makes the respondent look good.“488 Die Antworten unterliegen also einer Tendenz zur übermäßig positiven Selbstbeschreibung.489
Tabelle 3.27
Maßnahmen und Kontrollmöglichkeiten des Social Desirability Bias490
Beschreibung
Generelle Maßnahmen
Ex-ante Checks
Ex-post Checks
Social Desirability Bias
Die Tendenz von Befragungsteilnehmern auf Fragen sozial erwünscht und nicht wahrheitsgetreu zu antworten.491
Fragebogen:
Hinweis auf Vertraulichkeit und Anonymität.
Hinweis darauf, dass es keine richtigen oder falschen Antworten gibt.
Titel der Umfrage sollte kein Hinweis auf Marke als Untersuchungsgegenstand geben.
Berechnung des Strukturmodells unter Einbindung der Indexe „Impression Management“ und „Self-Deceptive Enhancement“.
Da mit der abhängigen Variablen „Markensensibilität“ die Intention des Verhaltens abgefragt wird, und damit Rückschlüsse auf das tatsächliche Verhalten des Probanden möglich werden, ist prinzipiell davon auszugehen, dass auch in der vorliegenden Untersuchung eine solche Verzerrung auftreten kann. Verstärkend wirkt das in den Köpfen der Probanden verankerte berufliche Selbstbild als rational agierende Person. Demnach ist anzunehmen, dass sich Beschaffungsmanager selbst als rational und stets zum Besten des Unternehmens handelnd beschreiben würden. Die Marke als vereinfachendes Entscheidungskriterium würde daher nicht in dieses Selbstbild passen. So kann die Abfrage der Markensensibilität bzw. die Unterstellung einer Berücksichtigung der Marke im Entscheidungsprozess von den Probanden unter Umständen als Kritik oder Affront an ihrer eigenen Arbeitsleistung aufgefasst werden. Daher wird vermutet, dass die Probanden zur Aufrechterhaltung des eigenen Selbstbildes und zur Signalisierung ihrer sorgfältigen Arbeitsleistung gegenüber dem Management die Fragen zur Markensensibilität nicht wahrheitsgemäß beantworten werden – die Ergebnisse wären somit verzerrt.492
Um dem Social-Desirability Bias bereits frühzeitig entgegenzuwirken, wurde zum einen darauf geachtet, dass der Titel der Umfrage nicht den Untersuchungsgegenstand, die Rolle der Marke in Entscheidungen zur Logistikdienstleisterauswahl, preisgibt.493 Zum anderen wird einer Reihe von Autoren gefolgt, die eine geringere Verzerrung durch soziale Erwünschtheit prognostizieren, wenn die Probanden auf die Anonymität der Umfrage und die Vertraulichkeit der Daten hingewiesen werden (siehe Tabelle 3.27).494 Eine Bitte um ehrliche Antworten, sowie ein Hinweis darauf, dass es keine richtigen oder falschen Antworten gibt, wird ein solcher Effekt ebenfalls attestiert.495
Zur ex-post-Kontrolle des Social-Desirablity Bias stehen Forschenden ebenfalls unterschiedliche Möglichkeiten zur Verfügung.496 Eine davon stützt sich auf den Einsatz eines Social-Desirability Bias Konstruktes. Die Methodenliteratur wird diesbezüglich von zwei divergenten Skalen dominiert497 – der Social Desirability Scale von Crowne und Marlowe (1960) und der Balanced Invenory of Desirable Responding (BIDR) von Paulhus (1991). Die Skala von Crowne und Marlowe (1960) umfasst insgesamt 33 Items.498 Im Laufe der Zeit wurden häufig Änderungen499 und Überprüfungen500 vorgenommen, hauptsächlich um deren Anwendbarkeit in Fragebögen zu optimieren.501 Als noch umfassender erweist sich die Skala von Paulhus (1991) mit insgesamt 40 Items.502 Zur Erklärung der sozialen Erwünschtheit unterscheidet er zwischen den beiden Dimensionen „Self-Deceptive Enhancement“ und „Impression Management“.503 Unter „Self-Deceptive Enhancement“ wird die unbewusste Selbsttäuschung zum Schutz des eigenen Selbstbildes und Selbstwertgefühls verstanden. Der Respondent glaubt hierbei tatsächlich an die positive Selbstdarstellung. Beim „Impression Management“ handelt es sich um die bewusste Fremdtäuschung, um sich selbst gegenüber anderen in einem besseren Bild präsentieren zu können.504
Aus der zuvor ausgearbeiteten Begründung zur Kontrolle sozialer Erwünschtheit im Rahmen dieses Forschungsprojektes lässt sich gleichzeitig auch die Argumentation zur Wahl der Social-Desirability Bias Skala ziehen. Insbesondere konnte die Selbsttäuschung der Manager als kritisch identifiziert werden. Da die BRID-Skala neben der Fremdtäuschung auch die Selbsttäuschung berücksichtigt, fällt die Wahl zunächst auf die von Paulhus (1991) entwickelte Skala.505 Die Abfrage der ursprünglichen 40 Items wird allerdings als äußerst unpraktikabel angesehen.506 Deshalb wird im Folgenden eine verkürzte (6 Indikatoren) und ins Deutsche übersetzte Version von Winkler et al. (2006) angewendet (siehe Tabelle 3.28). Dadurch wird zum einen eine einfache Integration der beiden Dimensionen in den Fragebogen ermöglicht und zugleich die Anwendbarkeit im deutschsprachigen Raum gewährleistet. Zudem hat sich die Kurzskala von Winkler et al. (2006) als „[…] reliabel und intern sowie extern valide erweisen und erfüllt die gleichen theoretischen und empirischen Bedingungen wie die Original-BIDR-Skala.“507
Analog zu den Kontrollvariablen, soll demnach auch unter Berücksichtigung des Social Desirability Bias (Impression Management und Self-Decptive Enhancement) die Hypothesen H1 bis H10 weiterhin gültig sein.
Tabelle 3.28
Messmodelle Self-Deceptive Enhancement und Impression Management508
Self-Deceptive Enhancement (SDE)
Begriffsverständnis
Self-Deceptive Enhancement beschreibt die Selbsttäuschung zum Schutz des eigenen Selbstbildes und Selbstwertgefühls.
Eigenschaft
Eindimensional, reflektiv, Likert-Skala
Skala
1 = „Trifft gar nicht zu“; 7 = „Trifft voll zu“
Indikatoren
SDE 01
Mein erster Eindruck von Menschen stellt sich gewöhnlich als richtig heraus.
Winkler et al. (2006)
SDE 02
Ich bin mir oft unsicher in meinem Urteil. (revers)
Winkler et al. (2006)
SDE 03
Ich weiß immer genau, wieso ich etwas mag.
Winkler et al. (2006)
Impression Management (IPM)
Begriffsverständnis
Impression Management beschreibt die bewusste Fremdtäuschung, um sich selbst gegenüber anderen in einem besseren Bild präsentieren zu können.
Eigenschaft
Eindimensional, reflektiv, Likert-Skala
Skala
1 = „Trifft gar nicht zu“; 7 = „Trifft voll zu“
Indikatoren
IPM 01
Ich habe schon mal zu viel Wechselgeld zurückbekommen und nichts gesagt. (revers)
Winkler et al. (2006)
IPM 02
Ich bin immer ehrlich zu anderen.
Winkler et al. (2006)
IPM 03
Ich habe gelegentlich mal jemanden ausgenutzt. (revers)
Winkler et al. (2006)
Einen weiteren Ansatz zur Kontrolle des Social-Desirability Bias liefern Fisher (1993) und Jo (2000). Diesen zufolge soll der Proband die Fragenbatterien sensibler Konstrukte direkt, als auch indirekt beantworten. Bei der indirekten Abfrage wird der Proband aufgefordert dieselbe Situation aus der Perspektive einer anderen Person zu bewerten.509 Personen neigen dazu das eigene Verhalten auf die fremde Person zu übertragen. Die Idee dahinter ist also, dass die Probanden unter dem Schein der indirekten, unpersönlichen Abfrage den Fragebogen wahrheitsgemäß und unverzerrt beantworten werden.510 Dem Ansatz liegt somit die Annahme zu Grunde, dass die Verzerrung der sozialen Erwünschtheit, wie sie bei der direkten Abfrage zu erwarten ist, bei der indirekten Abfrage in dieser Form nicht auftritt.511 Jedoch ist auch bei der Verwendung dieses Ansatzes Vorsicht geboten. Wie Jo (2000) eindrücklich hervorhebt, kann auch die indirekte Befragung zu Validitätsproblemen führen. Nämlich dann, wenn die Probanden bewusst die anderen Personen über- oder unterbewerten, sodass sie sich dadurch wiederum besser präsentieren können. Das heißt auch diese Kontrollmöglichkeit kann dem Social-Desirability Bias unterliegen.512 Aufgrund dessen und auch weil eine erhöhte Abbruchquote durch wiederholende Abfragen zu erwarten war, wurde auf diese Methode verzichtet und lediglich die Skala von Winkler et al. (2006) zur Kontrolle der Self-Deceptive Enhancement und des Impression Management angewendet.513
3.2.2.4 Antworttendenzen und Ausreißer
Antworttendenzen stellen eine Gefahr für die Ergebnisinterpretation dar, da die Antworten nicht gemäß des Frageninhalts, sondern anhand favorisierter Antwortkategorien gegeben werden.514 Respondenten greifen unter anderem aufgrund von Zeitdruck auf solche Antworttendenzen zurück.515 Damit ist die Bearbeitungszeit der Respondenten ein erstes Anzeichen, das es zu kontrollieren gilt. Um typische Tendenzen, wie Straight-Lining, Diagonal-Lining oder alternierende Extremantworten zu identifizieren, bietet sich darüber hinaus eine deskriptive Analyse, beispielsweise der Verteilung der Werte entlang den Antwortkategorien, an.516 Die Konzeptualisierungen einzelner Kontrollvariablen als offene Fragen, erfordert zusätzlich eine Plausibilitätsprüfung. Beispielsweise kann für den vorliegenden Datensatz die Anzahl der Buying Center Mitglieder mit der Angabe zur Entscheidungsbefugnis gegengeprüft werden. Konnten Antworttendenzen nachgewiesen werden, empfiehlt es sich, gemäß Hair et al. (2022), die entsprechenden Datensätze zu löschen.517
Gleichermaßen sollte der Datensatz auch auf Ausreißer untersucht werden. Ausreißer sind extreme Antworten entweder bei einer spezifischen Frage oder über einen gesamten Fragebogen hinweg.518 Demnach können sowohl auf bivariater, univariater als auch auf multivariater Ebene Verfahren zur Identifikation von Ausreißern umgesetzt werden.519 Tabelle 3.29 zeigt beispielhaft solche Verfahren. Eine anschließende kollektive Löschung aller identifizierten Ausreißer bzw. Datensätze ist nicht zu empfehlen, da extreme Antworten auch einen Teil der Realität repräsentieren können. Wenn jedoch davon ausgegangen werden kann, dass die Ausreißer aufgrund von Eingabefehlern – bewusst oder unbewusst – entstanden und folglich unplausibel sind, sollten diese Werte gelöscht werden.520
Tabelle 3.29
Maßnahmen und Kontrollmöglichkeiten von Antworttendenzen und Ausreißern521
Beschreibung
Generelle Maßnahmen
Ex-ante Checks
Ex-post Checks
Antworttendenzen
Antworttendenzen beschreiben das Phänomen, dass Respondenten ungeachtet der Fragestellung, bestimmte Antworttypen/-kategorien favorisieren.522
Antwortzeiten.
Häufigkeiten der Werte.
Analyse der offenen Fragen auf Plausibilität.
Ausreißer
Ausreißer sind extreme Antworten entweder zu einer einzelnen Frage oder zum gesamten Fragebogen.523
Aufgrund des retrospektiv angelegten Untersuchungsdesigns der Studie, ist es grundsätzlich angebracht einen Recall Bias524 zu überprüfen bzw. die Ergebnisse auf potenzielle Erinnerungsverzerrungen zu untersuchen.525 Zudem besteht die Vermutung, dass Entscheidungen der Vergangenheit in der Gegenwart stets rationaler eingeschätzt und wiedergegeben werden.526 Da im vorliegenden Forschungsprojekt mit der Markensensibilität ein Konstrukt abgefragt wird, das die Rationalität der Manager in Frage stellt, gilt der Verdacht, dass insbesondere die Markensensibilität nicht korrekt geschätzt, sondern tendenziell unterschätzt wird.
Als frühzeitige Maßnahme gegen das Auftreten eines Recall Bias wurde im Fragebogen ausdrücklich darauf hingewiesen, dass die Teilnehmer sich bei der Beantwortung der Fragen auf die am besten zu erinnernde Auswahlentscheidung beziehen sollen.527
Tabelle 3.30
Maßnahmen und Kontrollmöglichkeiten des Recall Bias528
Beschreibung
Generelle Maßnahmen
Ex-ante Checks
Ex-post Checks
Recall Bias
Da sich die Informanten auf eine vergangene Entscheidung beziehen sollen, ist es notwendig eine Verzerrung der Ergebnisse aufgrund der retrospektiven Befragung auszuschließen.529
Fragebogen:
Minimierung der vergangenen Zeit zwischen tatsächlicher Entscheidung und Abfrage der Entscheidung –Hinweis auf die am besten zu erinnernde Entscheidung.
Teilen des Samples in frühe und späte Zeitpunkte, in der die Entscheidung stattgefunden hat. Durchführung einer Multi-Gruppen Analyse des Strukturmodells.
Da damit nicht ausreichend sichergestellt werden kann, dass die Retrospektive nicht zu verzerrten Ergebnissen führt, wurde die Variable „Zeitpunkt der Lieferantenauswahl“ in den Fragebogen eingebaut. Durch sie wird die Zeit erfasst, die zwischen der Auswahlentscheidung und der Teilnahme an der Umfrage vergangen ist.530 In einem zweiten Schritt wird dann, wie in Tabelle 3.30 dargestellt, nach der Strukturmodellprüfung ein Multigruppen-Vergleich mit Hilfe der Variable „Zeitpunkt der Lieferantenauswahl“ durchgeführt.531 Das übergeordnete Ziel dabei ist es, systematische Unterschiede entlang der Zeitdauer zwischen Auswahlentscheidung und Umfrageteilnahme auszumachen und dadurch die Gefahr eines Recall Bias beurteilen zu können.
3.3 Voruntersuchungen – Modifikation der Messmodelle und Exklusion der wahrgenommenen Informationsüberflutung
Bevor die Hauptuntersuchung angegangen werden kann, sollten, gemäß dem in Kapitelabschnitt 3.1.1 erarbeiteten Vorgehen, Voruntersuchungen, beispielsweise zur Überprüfung der Messmodelle, durchgeführt werden.532 Wie Abbildung 3.3 illustriert wurde zu diesem Zweck ein dreistufiges Vorgehen umgesetzt. Es soll allen voran dabei helfen, die methodische Strenge (MS 2) der Untersuchung sicherzustellen.
Im ersten Schritt wurden die Messmodelle an fünf wissenschaftliche Experten mit Erfahrung in der Messmodellentwicklung geschickt und um Anmerkungen hinlänglich Vollständigkeit, Verständlichkeit und Eindeutigkeit gebeten.534 Nach Erhalt der Rückmeldungen wurden vereinzelt Formulierungen aufgrund ihrer Komplexität vereinfacht535 sowie die Relevanz weniger Indikatoren erneut vor der Literatur kritisch reflektiert. Bedenken wurden hinsichtlich der beiden Konstrukte des Rational-Experiential Inventory geäußert. Es wurde vermutet, dass diese bei der Befragung als gegensätzlich interpretiert und damit nicht wie operationalisiert unabhängig voneinander gemessen werden. Dennoch wurden beide Konstrukte für den Sorting-Pre-Test zunächst unverändert beibehalten.
Darüber hinaus wurde das Konstrukt der wahrgenommenen Informationsüberflutung in Frage gestellt. Es wurde angezweifelt, ob das Konstrukt für die Studie generell Relevanz besitzt. Im Detail wurden Bedenken an der Diskriminanzvalidität geäußert. So wurden die Ähnlichkeiten einzelner Indikatoren zwischen den Messmodellen der wahrgenommenen Logistikdienstleistungskomplexität und der wahrgenommenen Informationsüberflutung kritisiert (WLK 01 – WIÜ 01; WLK 04 – WIÜ 05; WLK 05 – WIÜ 04). Angeregt durch die Kritik wurde die Literatur zur Markensensibilität erneut studiert. Tatsächlich wird, sofern der Einfluss von Beschaffungskomplexität auf die Markensensibilität untersucht wird, ein direkter Effekt unterstellt. Die Argumentation fußt jedoch ebenfalls maßgeblich auf den Aussagen der Informationsverarbeitungstheorie und der Informationsüberflutung.536 In anderen Worten wird dem direkten Effekt von Beschaffungskomplexität auf Markensensibilität eine Informationsüberflutung unterstellt, jedoch nicht explizit durch einen indirekten Effekt über das Konstrukt der wahrgenommenen Informationsüberflutung analysiert. Gleichermaßen greifen Sharma und Sengupta (2020) zur Herleitung des Zusammenhangs zwischen Involvement und den Dimensionen der Markensensibilität auf die Annahmen der Informationsüberflutung zurück, ohne diese jedoch als Konstrukt zu berücksichtigen.537 Angesichts der durch die Experten geäußerten Zweifel und dem vorherrschenden Paradigma in den Untersuchungen zur Markensensibilität, wurde an dieser Stelle der Entschluss gefasst das Konstrukt der wahrgenommenen Informationsüberflutung nicht weiter zu berücksichtigen und damit das Kausalmodell um einen mediierenden Effekt zu reduzieren. Die Anpassungen werden im endgültigen Hypothesensystem festgehalten.538
Sorting-Pre-Test
Nach Vorlage von Schriesheim (1978) und Anderson und Gerbing (1991) wurde im zweiten Schritt ein Sorting-Pre-Test durchgeführt.539 Ziel dessen ist es die inhaltliche Validität der Messmodelle sicherzustellen.540 Zu diesem Zweck bekommen die Probanden die Definitionen der Konstrukte sowie die einzelnen Indikatoren zufällig angeordnet präsentiert. Die Aufgabe der Probanden besteht darin, die Indikatoren den richtigen Konstrukten anhand deren Definitionen zuzuordnen.541 Zur Beurteilung der Güte schlagen Anderson und Gerbing (1991) die Berechnung zweier Maße vor. Das Maß für die Eindeutigkeit der Zuordnung \({p}_{sa}\) beschreibt die Anzahl der Probanden, die einen Indikator dem ihm gemäß Messmodellentwicklung zugehörigen Konstrukt richtig zugeteilt haben \({n}_{c}\), im Verhältnis zur Gesamtzahl an Probanden \(N\) (\({p}_{sa}=\frac{{n}_{c}}{N}\)). Beim Maß der inhaltlichen Relevanz \({c}_{sv}\) wird vom Wert \({n}_{c}\) die Anzahl der Probanden \({n}_{o}\) abgezogen, die den Indikator am häufigstem einem falschen Konstrukt zugeordnet haben (\({p}_{sa}=\frac{{n}_{c}-{n}_{O}}{N}\)). Je näher die \({p}_{sa}\)- und \({c}_{sv}\)-Werte bei 1 liegen, desto stärker ist die inhaltliche Relevanz des Indikators für das Konstrukt. Sind die \({p}_{sa}\)- und \({c}_{sv}\)-Werte aller Indikatoren eines Konstruktes hoch, so kann von einer inhaltlichen Validität ausgegangen werden. Negative \({c}_{sv}\)-Werte dagegen deuten darauf hin, dass der Indikator möglicherweise eine höhere inhaltliche Relevanz für ein bestimmtes fremdes Konstrukt besitzt.542 Als Grenzwerte können die Anspruchsniveaus von MacKenzie et al. (1991) mit >0,8543 oder Hinkin und Schriesheim (1989) mit >0,6544 identifiziert werden. Da die Konstrukte grundsätzlich Ähnlichkeiten aufweisen, wurde das „weichere“ Anspruchsniveau von Hinkin und Schriesheim (1989) gewählt.
Der Pret-Test wurde im Zeitraum zwischen dem 28.08.2021 und 06.09.2021 durchgeführt. Da es sich bei dem Sorting-Pre-Test um eine vornehmlich kognitive Aufgabe handelt und spezifische berufliche Erfahrungen nicht benötig werden, können auch nicht mit der Grundgesamtheit kongruente Probanden befragt werden.545 Insofern wurden 21 wissenschaftliche Experten und Personen mit akademischem Hintergrund zur Teilnahme an der Vorstudie per E-Mail angefragt. Die Befragung erfolgte web-basiert über Unipark. Insgesamt 15 Probanden beendeten den Pre-Test. Damit ergibt sich eine Rücklaufquote von 71,4 %. Angeregt durch die Studie von Brown et al. (2011)546 wurden zusätzlich zu den in der Hauptuntersuchung abgefragten Messmodellen, die fünf Risikodimensionen nach Stone und Grønhaug (1993)547 in die Vorstudie mitaufgenommen. Vor dem Pre-Test war beabsichtigt, dass der indirekte Effekt über das wahrgenommene Risiko auf die Markensensibilität hinsichtlich der fünf Risikodimensionen spezifiziert wird.548 Die formativen Indikatoren der indirekten Markensensibilität-Messung wurden nicht miteinbezogen, da der Sorting-Pre-Test primär zur Prüfung der reflektiven Messmodelle eingesetzt wird. Folglich hatten die Probanden die Aufgabe 50 zufällig präsentierte Indikatoren zu 11549 Konstrukt-Definitionen zuzuordnen.550 Die Ergebnisse des Sorting-Pre-Tests mit den hieraus abgeleiteten Maßnahmen sind in Tabelle 3.31 dargestellt.
Entfernen der Risikodimensionen (FIR, ZER, PER, PSR, SOR).
WAR 02
0,53
0,33
PER
WAR 03
0,80
0,73
WAR 04
0,47
0,07
PSR
WAR 05
0,27
-0,33
PSR
Risikodimensionen
Finanzielles
FIR 01
0,93
0,87
Entfernen der Risikodimension FIR.
FIR 02
0,93
0,87
FIR 03
0,67
0,40
PER
Zeitliches
ZER 01
1,00
1,00
ZER 02
0,87
0,80
ZER 03
0,93
0,87
Performance
PER 01
0,80
0,67
Entfernen der Risikodimension PER.
PER 02
0,80
0,67
PER 03
0,67
0,47
WLK
Psychologisches
PSR 01
0,87
0,73
Entfernen der Risikodimension PSR.
PSR 02
0,53
0,20
WAR
PSR 03
0,67
0,40
WAR
Soziales
SOR 01
1,00
1,00
SOR 02
0,93
0,87
SOR 03
1,00
1,00
Individuelle Risiko-
bereitschaft
IRN 01
0,80
0,67
Keine Maßnahmen hinlänglich NFC.
Entfernen der Risikodimension PSR.
IRN 02
0,93
0,87
IRN 03
0,80
0,60
IRN 04
0,80
0,67
IRN 05
0,53
0,40
NFC/PSR
IRN 06
0,53
0,20
NFC
IRN 07
0,93
0,87
REI
Need for
Cognition
NFC 01
0,47
0,07
FII
Positivformulierung der revers-kodierten Items.
Separation von NFC und FII im Fragebogen.
NFC 02
0,53
0,33
FII
NFC 03
0,80
0,73
NFC 04
0,87
0,73
NFC 05
0,40
0,00
FII
Faith in
Intuition
FII 01
0,60
0,40
Sonstiges
Keine Maßnahmen hinlänglich „Sonstiges“.
Separation von NFC und FII im Fragebogen.
FII 02
0,67
0,53
Sonstiges
FII 03
0,60
0,33
Sonstiges
FII 04
0,73
0,53
Sonstiges
FII 05
0,73
0,60
Für die Konstrukte Markensensibilität und wahrgenommene Logistikdienstleistungskomplexität liegt der Anteil der richtigen Zuordnungen \({p}_{sa}\) über dem Anspruchsniveau von 0,6. Auch das Maß der inhaltlichen Relevanz \({c}_{sv}\) zeigt für die ihnen zugeteilten Indikatoren zufriedenstellende Werte an. Demzufolge kann inhaltliche Validität unterstellt werden. Indessen werden Probleme zwischen den Risikodimensionen und dem wahrgenommenen Risiko sowie der individuellen Risikoneigung offensichtlich. Die Indikatoren WAR 02, WAR 04 und WAR 05 werden in mehreren Fällen dem psychologischen und Performance Risiko zugeteilt. Umgekehrt werden auch einige Indikatoren der Risikodimensionen (FIR 03, PSR 02, PSR 03) fälschlicherweise für Reflektionen des wahrgenommenen Risikos angesehen. Es scheint, dass das übergeordnete Risikokonstrukt und die Risikodimensionen konzeptionell sehr eng zusammenliegen und es den Probanden schwer fällt diese zu unterscheiden. Zur Sicherstellung der inhaltlichen Validität und in Anbetracht der Länge des Fragebogens, wurde daher der Entschluss gefasst die Risikodimensionen aus dem Fragebogen zu entfernen und nicht weiter zu berücksichtigen. Des Weiteren werden die Anspruchsniveaus bei den Indikatoren des Rational-Experiential Inventory unterschritten. So werden die Indikatoren NFC 01, NFC 02 und NFC 05 in mehreren Fällen dem Konstrukt Faith in Intuition zugeteilt. Nach einer detaillierteren Analyse der betroffenen Indikatoren konnte festgestellt werden, dass es sich bei diesen um die von Epstein et al. (1996) revers-kodierten Indikatoren handelt.552 Daher wird als erste Maßnahme eine positive Formulierung der Indikatoren von Need for Cognition umgesetzt.553 Zudem erscheint es sinnvoll, die beiden Konstrukte im Fragebogen bewusst voneinander zu trennen. Denn die Operationalisierung des Rational-Experiential Inventory erfolgte mittels zweier unipolarer Dimensionen und nicht mittels einer bipolaren Dimension. Dies entspricht auch der Auffassung, dass die beiden Systeme der Informationsverarbeitung parallel und unabhängig voneinander arbeiten.554 Somit kann durch die Trennung der Konstrukte im Fragebogen verhindert werden, dass die beiden Konstrukte fälschlicherweise als gegensätzlich interpretiert werden.555 Mit Hilfe dieser vorgestellten Maßnahmen soll die inhaltliche Validität in der Hauptuntersuchung sichergestellt werden.
Fragebogengestaltung
Die erste Überprüfung der Messmodelle ist damit abgeschlossen. Die Messmodelle wurden folglich nach den oben definierten Anpassungen final in Unipark eingepflegt. Als letzten Schritt wurden erneut vier wissenschaftliche Experten gebeten, die Fragebogengestaltung in Unipark zu beurteilen. So konnten kleine Änderungen vorgenommen werden.556 Nach mehreren testweisen Durchläufen wird die Zeitdauer zur Beantwortung des Fragebogens auf ca. 20 Minuten festgesetzt.557
3.4 Endgültiges Hypothesensystem
Angesichts der Erkenntnisse aus den Voruntersuchungen werden Anpassungen für das Hypothesensystem erforderlich. Allen voran die Exklusion der wahrgenommenen Informationsüberflutung bedingt die Formulierung einer neuen Hypothese für den direkten Einfluss der wahrgenommenen Logistikdienstleistungskomplexität auf die Markensensibilität. Gleichzeitig wird der indirekte Effekt über die wahrgenommene Informationsüberflutung ersetzt.
Wie zuvor der indirekte Effekt über die wahrgenommene Informationsüberflutung lässt sich auch der direkte Einfluss der wahrgenommenen Logistikdienstleistungskomplexität auf die Markensensibilität aus den Abhandlungen zur Informationsverarbeitungstheorie ergründen. Daher soll an dieser Stelle eine Kurzfassung der Argumentation dargeboten werden.558 Handelt es sich bei dem Beschaffungsobjekt um eine einfache Logistikdienstleistung, wie zum Beispiel die Ausführung eines Transports, so wird der Beschaffungsmanager, aufgrund der damit einhergehenden geringen Informationsmenge, fähig sein, die verfügbaren Informationen zu verarbeiten. Das heißt er wird nur in einem geringen Umfang auf Marken und ihre Informationseffizienzfunktion559 zurückgreifen. Die Markensensibilität ist also gering. Anders verhält es sich bei hoher Logistikdienstleistungskomplexität, wie zum Beispiel bei Kontraktlogistikgeschäften. Mit steigender Komplexität geht bekanntermaßen auch eine erhöhte Informationsmenge einher, wodurch die Wahrscheinlichkeit einer Informationsüberlastung zunimmt.560 Das heißt der Beschaffungsmanager ist nicht mehr in der Lage sämtliche verfügbaren Informationen zu verarbeiten. Schließlich führt dies dazu, dass der Beschaffungsmanager Gegenmaßnahmen durchführt, um die Informationsüberflutung zu bewältigen. Solche Maßnahmen sind beispielsweise die selektive Informationssuche oder Satisficing,561 wobei häufig Heuristiken oder Information Chunks, wie Marken, aufgrund deren Informationseffizienz berücksichtigt werden. In den Worten von Payne (1976) zusammengefasst: „[…] increases in the complexity of a decision situation will result in decision makers resorting to choice heuristics in an effort to reduce cognitive strain […].“562 Die Markensensibilität dürfte also steigen.
Bestätigt wird der positive lineare Zusammenhang zudem durch die Marksensibilitätsliteratur563, repräsentativ hierfür Brown et al. (2011).564 Insofern wird auch für den Kontext der strategischen Logistikdienstleisterauswahl ein positiver Zusammenhang zwischen wahrgenommener Logistikdienstleistungskomplexität und Markensensibilität vermutet, weshalb nachfolgende Hypothese H1Neu formuliert wird:
H1Neu:
Die wahrgenommene Logistikdienstleistungskomplexität hat einen positiven Einfluss auf die Markensensibilität.
Abbildung 3.4 veranschaulicht die notwendige Anpassung durch die Exklusion der wahrgenommenen Informationsüberflutung.
Abbildung 3.4
Notwendige Anpassung des Hypothesensystems durch die Exklusion der wahrgenommenen Informationsüberflutung565
Schließlich illustriert Abbildung 3.5 das endgültige Hypothesensystem unter Einarbeitung der voruntersuchungsbedingten Anpassungen (Exklusion der wahrgenommenen Informationsüberflutung, Ergänzung der Social Desirability Konstrukte).
Ferner können der Tabelle 3.32 noch einmal die Formulierungen der endgültigen statistischen Hypothesen entnommen werden. Sie bietet einen Überblick über Forschungsinteresse 3, und seine hierarchische Strukturierung in Forschungsbedarf FB 3a und FB 3b, Forschungshypothesen FH 1 und FH 2 und statistische Hypothesen H1-H7. Damit steht nun das final zu testende Hypothesensystem fest und die quantitativ-empirische Studie kann im nächsten Schritt mit der Datenerhebungen angegangen werden.
Tabelle 3.32
Zusammenfassung und Hierarchie von Forschungsinteresse 3, Forschungsbedarf 3, Forschungshypothesen und statistische Hypothesen des endgültigen Hypothesensystems567
FI3: Wann wird die Marke bei der Auswahl von Logistikdienstleistern berücksichtigt? d. h. inwiefern wird die Berücksichtigung der Marke bei der Auswahl von Logistikdienstleistern durch verschiedene Faktoren beeinflusst?
FB3a: Untersuchung des Einflusses der Logistikdienstleistungskomplexität als organisationales Charakteristikum auf die Markensensibilität bei der strategischen Auswahl von Logistikdienstleistern.
FH1: Die Informationsüberflutung und das wahrgenommene Risiko wirken als Bindeglied – im statistischen Sprachgebrauch als Mediator – zwischen Logistikdienstleitungskomplexität und Markensensibilität.
H1Neu
Die wahrgenommene Logistikdienstleistungskomplexität hat einen positiven Einfluss auf die Markensensibilität.
H2
Die wahrgenommene Logistikdienstleistungskomplexität hat einen positiven Einfluss auf das wahrgenommene Risiko in einer strategischen Logistikdienstleisterauswahl.
H3
Das wahrgenommene Risiko in einer strategischen Logistikdienstleisterauswahl hat einen positiven Einfluss auf die Markensensibilität.
H4Med
Das wahrgenommene Risiko in einer strategischen Logistikdienstleisterauswahl mediiert die Beziehung zwischen wahrgenommener Logistikdienstleistungskomplexität und Markensensibilität.
FB3b: Untersuchung des Einflusses von individuellen Charakteristiken auf die Markensensibilität bei der strategischen Auswahl von Logistikdienstleistern.
FH2: Die individuelle Risikoneigung, Faith in Intuition und Need for Cognition bestimmen die Markensensibilität.
H5
Die individuelle Risikoneigung eines Beschaffungsmanagers hat einen negativen Einfluss auf die Markensensibilität.
H6
Die Faith in Intuition eines Beschaffungsmanagers hat einen positiven Einfluss auf die Markensensibilität.
H7
Die Need for Cognition eines Beschaffungsmanagers hat einen negativen Einfluss auf die Markensensibilität.
Markenhierarche – Konsequenzen der Markensensibilität
H8
Die Markensensibilität hat einen positiven Einfluss auf die Markenwichtigkeit.
Open Access Dieses Kapitel wird unter der Creative Commons Namensnennung 4.0 International Lizenz (http://creativecommons.org/licenses/by/4.0/deed.de) veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.
Die in diesem Kapitel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen.
Der Begriff „Konstrukt“ wird in der Fachliteratur zur Verdeutlichung der Konstruktion einer messbaren Variablen verwendet [vgl. Nunnally und Bernstein (1994), S. 85; Anderson und Gerbing (1982), S. 453].
Unter einem Messmodell wird die Gesamtheit der zur Messung einer latenten Variablen benötigen Indikatoren („Items“ wird häufig synonym verwendet) verstanden [vgl. MacKenzie et al. (2011), S. 294].
Vgl. Anderson und Gerbing (1982), S. 453; Backhaus et al. (2016), S. 583; Weiber und Sarstedt (2021), S. 114. Im Gegensatz dazu ist bei direkt messbaren (manifestesten) Variablen, ein solcher Schritt nicht erforderlich.
Siehe Kapitelabschnitt 1.3. Im Detail betrifft dies die Beurteilungskriterien „Aufmerksamkeit bei Definitionsproblemen“, „Objektivität im Umgang mit komplementären und konkurrierenden Perspektiven“, sowie „Aufmerksamkeit für messbezogene Probleme“. Auch die Arbeiten zur Messmodellentwicklung heben diese Aspekte hervor [vgl. Podsakoff et al. (2016), S. 166; MacKenzie et al. (2011), S. 295; Netemeyer et al. (2003), S. 89; Gerring (1999), S. 375 f.; Churchill (1979), S. 67].
Einer der ersten Vorschläge zur systematischen Entwicklung neuer Messmodelle stammt von Likert (1967), bevor sich vor allem in der Marketingliteratur der Ansatz von Churchill (1979) über Jahre durchgesetzt hat. Eine Erweiterung dessen Verfahrens lieferte dann Rossiter (2002) unter dem Akronym COARSE (Concept Definition, Object Classification, Attribute classification, Rater identification, Scale formation, and Enumeration and Reporting). Vor allem MacKenzie et al. (2011) kritisieren an den vorangegangenen Ansätzen, dass nur wenige Vorschläge präsentiert werden, wie eine angemessene Konzeptdefinition realisiert werden kann. Des Weiteren betonen sie eine bis dato vernachlässigte differenzierte Skalenentwicklung von formativen und reflektiven Konstrukten [vgl. MacKenzie et al. (2011), S. 294 f.].
Vgl. Podsakoff et al. (2016), S. 160; MacKenzie et al. (2011), S. 298; Netemeyer et al. (2003), S. 89; Clark und Watson (1995), S. 310; Churchill (1979), S. 67.
Neben Fachartikeln wurden auch die Konstrukt-Sammlungen aus dem Marketingbereich von Bearden et al. (2011) und Bruner (2019), sowie aus dem Fachbereich Logistik von Keller et al. (2013); Keller et al. (2002) gesichtet.
Das Vorgehen zur Ableitung von Attributen aus den bestehenden Konzeptualisierungen des fokalen Konstruktes sowie der verwandten Konstrukte stammt von Maynes und Podsakoff (2014) [vgl. Maynes und Podsakoff (2014), S. 89 f.] und erfüllt eine der Anforderungen von Podsakoff et al. (2016) zur verbesserten Konzeptdefinition [vgl. Podsakoff et al. (2016), S. 193].
Vgl. Heggestad et al. (2019), S. 2597. Die Adaption von Messmodellen ist durchaus üblich in der wissenschaftlichen Praxis, und zeigt sich unter anderem in Form von Indikatoranzahl, Wording einzelner Indikatoren, sowie verwendeter Skalen. Kritisch sind im Allgemeinen nicht die Anpassungen selbst, sondern die Tatsache, dass nur wenige Autoren den Einfluss ihrer Adaptionen auf die Validität beurteilen, ihre Anpassungen begründen oder den Prozess dieser transparent darstellen [vgl. Heggestad et al. (2019), S. 2603/2624].
Dies kann sich in der Inhaltsvalidität, sowie der Diskriminanzvalidität, nomologischen Validität und Konvergenzvalidität als Teilaspekte der Konstruktvalidität und letztendlich in der internen Validität ausdrücken [vgl. MacKenzie (2003), S. 323; Netemeyer et al. (2003), S. 89; MacKenzie et al. (2011), S. 305].
Vgl. MacKenzie et al. (2005), S. 716; Jarvis et al. (2003), S. 216; MacCallum und Browne (1993), S. 533. Ähnliche Ergebnisse weist auch Fassott (2006) bei seiner Untersuchung von deutschsprachigen Journals aus [vgl. Fassott (2006), S. 76]. Allerdings wird auch anerkannt, dass eine Entscheidung zwischen formativer und reflektiver Spezifikation der Messmodelle nicht immer einfach ist [vgl. Diamantopoulos und Siguaw (2006), S. 265; Homburg und Klarmann (2006), S. 731; Bollen und Ting (2000), S. 4].
Vgl. Jarvis et al. (2003), S. 203. Auch Jarvis et al. (2003) gestehen ein, dass Forscher Schwierigkeiten haben dürften die Fragen zu den Entscheidungsregeln klar zu beantworten oder gar widersprüchlich ausfallen dürften [vgl. Jarvis et al. (2003), S. 203]. Trotzdem kann davon ausgegangen werden, dass die Berücksichtigung der Entscheidungskriterien die Wahrscheinlichkeit einer Fehlspezifikation reduziert.
Vgl. MacKenzie et al. (2011), S. 304. Gemäß Nunnally et al. (1994) sollte die gesamte Indikatoren-Konstruktion dem Grundprinzip der Klarheit folgen [vgl. Nunnally und Bernstein (1994), S. 297].
In solchen Fällen wird auch häufig von Globalitems gesprochen. Insofern wird ein Item gewählt, das den Gesamtzusammenhang des Konstruktes widerspiegeln soll [vgl. Weiber und Sarstedt (2021), S. 121].
Vgl. Nunnally und Bernstein (1994), S. 67; Churchill (1979), S. 66. Für weitere Entscheidungskriterien bei der Wahl zwischen Single- und Multi-Item-Messungen siehe Fuchs und Diamantopoulos (2009), S. 206; Weiber und Sarstedt (2021), S. 125.
Siehe hierzu auch die allgemeingültige Empfehlung von Churchill (1979): „marketers are much better served with multi-item measures of their constructs, and they should take the time to develop them. This conclusion is particularly true for those investigating behavioral relationships from a fundamental as well as applied perspective, although it applies also to marketing practitioners.“ [Churchill (1979), S. 66 f.].
Beispielsweise empfehlen Garver und Mentzer (1999) die Verwendung von mindestes drei Indikatoren im Kontext der Logistikforschung [vgl. Garver und Mentzer (1999), S. 35]. Ähnlich argumentiert Bollen (1989) für drei bis vier reflektive Indikatoren [vgl. Bollen (1989), S. 288 ff.]. Währenddessen spricht Churchill (1979) bei zehn Indikatoren von einer geringen Anzahl für die meisten Messungen [vgl. Churchill (1979), S. 69]. Ein ähnliches Spektrum (8–10) empfiehlt Bagozzi für Persönlichkeits-Konstrukte gemäß Korrespondenz mit Netermeyer et al. (2003) [vgl. Netemeyer et al. (2003), S. 147]. Einen Schritt weiter gehen Robinson et al. (1991), die bis zu 250 Indikatoren bei besonders facettenreichen Konstrukten vorschlagen [vgl. Robinson et al. (1991), S. 12 f.].
Tatsächlich hat sich gezeigt, dass die Art der Ausweisung von Merkmalsausprägungen einen Effekt auf das Antwortverhalten hat. Diesbezüglich haben beispielsweise Mazaheri und Theuns (2009), Tourangeau (2007) und Schwarz et al. (1991) festgestellt, dass eine Nummerierung im Stile -5 bis + 5 im Vergleich zu einer Nummerierung im Stile von 0 bis 10 dazu führt, dass vergleichsweise mehr Probanden im positiven Spektrum der Skala antworten [vgl. Mazaheri und Theuns (2009), S. 391 f.; Tourangeau et al. (2007), S. 109; Schwarz et al. (1991), S. 578]. Dies liegt daran, dass sich Personen nur ungern selbst negativ darstellen und sich dies letztendlich bei Ausweisung von negativen Nummerierungen im Antwortverhalten widerspiegelt [vgl. Porst (2014), S. 93; Schwarz et al. (1991), S. 577]. Insofern wird es für das vorliegende Forschungsvorhaben als sinnvoll erachtet eine Nummerierung von 1–7 zu verwenden.
Vgl. Krosnick und Fabrigar (2012), S. 158. Hierbei konnten Francis und Busch (1975) nachweisen, dass „Weiß ich nicht“-Ausprägungen häufiger von Frauen, nicht-weißen, gering gebildeten, einkommensschwachen und nicht beteiligten Probanden genutzt werden. Dies impliziert eine mögliche Verzerrung der Ergebnisse bei Verwendung von „Weiß ich nicht“-Ausprägungen [vgl. Francis und Busch (1975), S. 218].
Eigene Darstellung. Da nachfolgende Untersuchungen in ihrer Konzeptualisierung der Markensensibilität stark an Zablah et al. (2010) und Kapferer und Laurent (1988) ausgerichtet sind und somit keine signifikanten neuen Erkenntnisse beitragen konnten, wurden diese in der Tabelle nicht mitaufgenommen [e.g. He et al. (2018), S. 164; Casidy et al. (2018), S. 26; Brown et al. (2012), S. 509; Brown et al. (2011), S. 196].
Vgl. Alhosseini Almodarresi und Rasty (2019), S. 96; Mathews-Lefebvre und Valette-Florence (2014), S. 240; Wei (2008), S. 55; Brown (2007), S. 70; Beaudoin (2006), S. 312; Odin et al. (2001), S. 78; Hutton (1997), S. 430; Kapferer und Laurent (1988), S. 13.
Vgl. Alhosseini Almodarresi und Rasty (2019), S. 96; Wei (2008), S. 55; Brown et al. (2007), S. 212; Beaudoin (2006), S. 312; Beaudoin et al. (2003), S. 25; Lachance et al. (2003), S. 48; Odin et al. (2001), S. 78; Kapferer und Laurent (1988), S. 13.
Vgl. Beaudoin (2006), S. 312; Beaudoin et al. (2003), S. 25; Lachance et al. (2003), S. 48; Odin et al. (2001), S. 78; Kapferer und Laurent (1988), S. 13 f. Auch Hutton (1997) legt der Markensensibilität im Kontext der organisationalen Beschaffung eine individuelle Betrachtungsebene zu Grunde [vgl. Hutton (1997), S. 429 ff.].
Eingeführt wurde diese Betrachtungsebene von Brown (2007) im Rahmen seiner Dissertationsschrift [vgl. Brown (2007), S. 70], siehe auch Sharma und Sengupta (2020), S. 58; He et al. (2018), S. 164; Casidy et al. (2018), S. 26; Brown et al. (2012), S. 509; Brown et al. (2011), S. 194 f.; Zablah et al. (2010), S. 251.
Vgl. Sharma und Sengupta (2020), S. 58; He et al. (2018), S. 164; Casidy et al. (2018), S. 26; Brown et al. (2012), S. 509; Brown et al. (2011), S. 194 f.; Zablah et al. (2010), S. 251.
Dieses Modell wurde in der Werbeforschung eingeführt [vgl. Lavidge und Steiner (1961), S. 61] und dort auch entsprechend empirisch untersucht [vgl. Palda (1966), S. 19 f.].
Bei der Mediensensibilität ist eine Abgrenzung zum tatsächlichen Verhalten, wie sie bei der Markensensibilität durch Zablah et al. (2010) herausgestellt wurde, nicht ersichtlich. Vielmehr wird die Mediensensibilität gemäß der vorliegenden Definition als ein Faktor des Kommunikationsverhaltens verstanden [vgl. Large (2003), S. 87; 113 f.].
Sharma et al. (2020) sprechen zwar bei „organisational brand sensitivity“ von einem mehrdimensionalen Konstrukt, modellieren es aber nicht als Second-Order Konstrukt mit drei Dimensionen erster Ordnung. Deshalb werden auch keine Indizes zur Güteprüfung eines Second-Order Konstruktes angegeben, oder überhaupt eine Diskussion zur Spezifikation des Second-Order Konstruktes geführt. Für die drei Dimensionen (BIP, BIA und BCM) konnten lediglich hohe Korrelation untereinander nachgewiesen werden [vgl. Sharma und Sengupta (2020), S. 64], was wiederum nicht verwunderlich ist, wenn man beachtet, dass für die Operationalisierung der BIA und BIP jeweils Indikatoren von Brown's (2012) eindimensionaler Operationalisierung der Markensensibilität verwendet wurden [vgl. Sharma und Sengupta (2020), S. 78]. Da so die Einflüsse der zu untersuchenden Determinanten nicht auf ein Second-Order Konstrukt „organisational brand sensitivity“ gemessen werden können, bleibt zu kritisieren, ob damit auch tatsächlich im Ergebnis hinsichtlich der organisationalen Markensensibilität argumentiert werden kann.
Es sei darauf hingewiesen, dass dies die finalen Indikatorformulierungen sind – nach Einpflegen der Anmerkungen aus der ersten Überprüfung und Modifikation [siehe Kapitelabschnitt 3.3].
Hier wurde bewusst auf eine negative Kodierung verzichtet, da der negativ kodierte Indikator im Pre-test beanstandet wurde [siehe Kapitelabschnitt 3.3].
Hier wurde bewusst auf eine negative Kodierung verzichtet, da der negativ kodierte Indikator im Pre-test beanstandet wurde [siehe Kapitelabschnitt 3.3].
Vgl. Mitchell et al. (2003), S. 8; Henthorne und LaTour (1992), S. 71; Peter und Ryan (1976), S. 185. Eine Übersicht zu den Autoren, die einen solchen Messansatz verwendet haben, findet sich bei Gemünden (1985b), S. 28 f. Für eine detaillierte Analyse dieses Messansatzes sei dagegen auf die Operationalisierung des wahrgenommenen Risikos in Kapitelabschnitt 3.1.6 verwiesen.
Damit werden die beiden Komponenten „Unsicherheit“ und „Konsequenzen“ des wahrgenommenen Risikos operationalisiert [vgl. Henthorne und LaTour (1992), S. 69].
Vgl. Cadogan und Lee (2013), S. 234; Cenfetelli und Bassellier (2009), S. 690; Diamantopoulos und Siguaw (2006), S. 263. Siehe hierzu auch Kapitelabschnitt 3.1.1.
Vgl. Davis et al. (2008), S. 226. Aus der Überprüfung des Messmodells wird deutlich, dass das Markenimage hier reflektiv spezifiziert wurde [vgl. Davis et al. (2008), S. 223].
Es sei darauf hingewiesen, dass dies die finalen Indikatorformulierungen sind – nach Einpflegen der Anmerkungen aus der ersten Überprüfung und Modifikation [siehe Kapitelabschnitt 3.3].
Vgl. Bendixen et al. (2004), S. 376; Leek und Christodoulides (2012), S. 112; Syed Alwi et al. (2016), S. 870; Jensen und Klastrup (2008), S. 123; Balmer et al. (2020), S. 857. Die Markenattribute werden hier beispielsweise im Rahmen der Operationalisierung des Markenimages, der Markenassoziationen und des Markenwertes präsentiert.
Vgl. Zablah et al. (2010), S. 258 f.; Fischer et al. (2010), S. 836; Brown et al. (2011), S. 203. Bei Lachance et al. (2003), S. 56; Brown (2007), S. 70 wird die Konstantsummenskala zur Messung der Markensensibilität herangezogen. Siehe hierzu auch den Diskurs zum wechselseitigen Einsatz der Konstantsummenskala in Kapitelabschnitt 3.1.2.1.
Vgl. Aguezzoul (2014), S. 75. In ihrer Literaturanalyse fasst sie die am häufigsten untersuchten Selektionskriterien bei der Logistikdienstleisterauswahl zusammen. Insofern ist die Arbeit besonders geeignet für die Operationalisierung der Markenwichtigkeit.
Es sei darauf hingewiesen, dass dies die finalen Indikatorformulierungen sind – nach Einpflegen der Anmerkungen aus der ersten Überprüfung und Modifikation [siehe Kapitelabschnitt 3.3].
Siehe beispielhaft Homburg et al. (2011), S. 809; Large (2008), S. 18; Heitmann et al. (2007), S. 246; Burnham et al. (2003), S. 123; McQuiston (1989), S. 73.
Vgl. Ateş et al. (2022), S. 4; Bozarth et al. (2009), S. 80. Eine ähnlich detaillierte Untergliederung ist auch für die „Supply Base Complexity“ zu finden. Diese wird beispielsweise in die strukturelle Dimension (horizontale Komplexität, Lieferantendifferenzierung, räumliche Komplexität, Lieferanteninteraktion) und dynamische Dimension (Lieferkomplexität, Instabilität der Lieferanten) unterteilt [vgl. Ateş und Memiş (2021), S. 831 f.].
Vgl. Braun und Hadwich (2016), S. 3509. Mit Hilfe der Kategorisierung von Braun und Hadwich (2016) können ebenfalls Definitionen zur Aufgabenkomplexität [siehe hierzu Campbell (1988)] und zur Komplexität aus der Perspektive interner Kunden [siehe hierzu Braun (2016)] für ungeeignet erachtet werden.
Wobei auch bei der Produktkomplexität von wenig konsistenten Definitionen berichtet wird, was die Konzeptualisierung und Operationalisierung des Konstruktes erschwert [vgl. Trattner et al. (2019), S. 70].
Vgl. Shou et al. (2017), S. 302; Bode und Wagner (2015), S. 216; Rossiter Hofer und Knemeyer (2009), S. 190; Burnham et al. (2003), S. 112; Rao und Young (1994), S. 17; Simon (1962), S. 468; Stock (2005), S. 69.
Vgl. Cannon und Perreault (1999), S. 448; Cannon und Homburg (2001), S. 42. Eine vergleichbare Abfrage findet sich bei Zou et al. (2019) zur Messung der Dienstleistungskomplexität [vgl. Zou et al. (2019), S. 535].
Ähnlich argumentiert auch Kramer (2016) im Rahmen seiner Operationalisierung der Service Capability gegen eine Aufzählung verschiedener Teilfähigkeiten [vgl. Kramer (2016), S. 149].
Die reflektive Spezifikation des Messmodells geht aus den verwendeten Gütekriterien zur Überprüfung der Reliabilität und Validität hervor [vgl. Large (2008), S. 10 f.]. Siehe hierzu auch Kapitelabschnitt 4.2.3.1.
Es sei darauf hingewiesen, dass dies die finalen Indikatorformulierungen sind – nach Einpflegen der Anmerkungen aus der ersten Überprüfung und Modifikation [siehe Kapitelabschnitt 3.3].
Eigene Darstellung. Übersichten zu den verschiedenen Definitionsansätzen sind auch den Arbeiten von Eppler und Mengis (2004), S. 276 f. sowie Iastrebova (2006), S. 62 zu entnehmen.
Vgl. Roetzel (2019), S. 484; Schick et al. (1990), S. 205 f.; Bawden und Robinson (2009), S. 182 f.; Jacoby et al. (1974b), S. 63; Malhotra et al. (1982), S. 27.
Vgl. Bawden et al. (1999), S. 249; Bawden und Robinson (2009), S. 183; Benselin und Ragsdell (2016), S. 285; Jacoby et al. (1974a), S. 41; Roetzel (2019), S. 484; Eppler und Mengis (2004), S. 284; Schneider (1987), S. 148.
Vgl. Hunter (2004), S. 94; Hunter und Goebel (2008), S. 25. Allerdings fand diese klare Trennung in der statistischen Auswertung nicht mehr statt. So wurde den beiden Dimensionen aufgrund der Unteridentifikation des latenten Konstruktes „Informationsüberflutung“ gestattet miteinander zu korrelieren [vgl. Hunter (2004), S. 94].
In anderen Disziplinen, wie der Psychologie oder der statistischen Entscheidungsforschung wurde das Konzept des Risikos schon früher eingeführt. Allerdings unterschiedet sich dieses Verständnis zum wahrgenommenen Risiko in der Konsumentenforschung hinsichtlich deren Auswirkungen. So werden mit dem wahrgenommenen Risiko in der Konsumentenforschung primär potenziell negative Auswirkungen adressiert, während in den anderen Forschungsdisziplinen mit dem Risiko-Konzept sowohl negative als auch positive Auswirkungen aufgegriffen werden [vgl. Stone und Grønhaug (1993), S. 40].
Vgl. Mitchell (1992), S. 27; Laroche et al. (2004), S. 375; Dholakia (2001), S. 1342; Mitchell (1999), S. 163. Es wird davon ausgegangen, dass die Forschung zum wahrgenommenen Risiko Anfang der 70er Jahre seinen Höhepunkt hatte [vgl. Stone und Grønhaug (1993), S. 39].
Vgl. Garrido‐Samaniego und Gutiérrez‐Cillán (2004), S. 323; Hawes und Barnhouse (1987), S. 287; Newall (1977), S. 167; Gallear et al. (2022), S. 1402; Munnukka und Järvi (2015), S. 94; Henthorne und LaTour (1992), S. 69; Kohli (1989), S. 55; Kull et al. (2014), S. 472 f.; Mitchell (1995), S. 118.
Vgl. Conchar (2004), S. 422; Dowling und Staelin (1994), S. 119; Sweeney et al. (1999), S. 81; Sitkin und Pablo (1992), S. 12; Hawes und Barnhouse (1987), S. 287; Kohli (1989), S. 55; Bauer (1960), S. 395.
Vgl. Conchar (2004), S. 422; Dowling und Staelin (1994), S. 119; Sitkin und Pablo (1992), S. 12; Hawes und Barnhouse (1987), S. 287; Kohli (1989), S. 55.
Vgl. Sitkin und Pablo (1992), S. 12; Sitkin und Weingart (1995), S. 1575; Conchar (2004), S. 423; Cox und Rich (1964), S. 33; Garrido‐Samaniego und Gutiérrez‐Cillán (2004), S. 323; Renn (1989), S. 180.
Vgl. Kohli (1989), S. 55; Dowling und Staelin (1994), S. 119; Laroche et al. (2004), S. 376; Peter und Ryan (1976), S. 184; Peter und Tarpey (1975), S. 30.
Siehe beispielsweise Jacoby und Kaplan (1972); Peter und Tarpey (1975), S. 32; Mitchell und Greatorex (1993), S. 197; Roselius (1971), S. 58; Mitchell (1992), S. 27; Horton (1976), S. 696; Paluch und Wünderlich (2016), S. 2427.
Vgl. Stone und Grønhaug (1993), S. 46. Allerdings modellieren die Autoren die sechs Risiko-Dimensionen nicht alle auf einer Ebene. Sie konnten aufzeigen, dass das psychologische Risiko als Mediator zwischen den anderen fünf Dimensionen und dem übergreifenden Risiko-Konstrukt wirkt [vgl. Stone und Grønhaug (1993), S. 46].
Es lassen sich noch weitere Ansätze zur Dimensionierung des wahrgenommenen Risikos identifizieren, wie bei Newall (1977) das Risiko des Einkäufers und des Unternehmens [vgl. Newall (1977), S. 168], sowie bei Bettman (1973) das inhärente und bewältigte Risiko [vgl. Bettman (1973), S. 184].
Vgl. Mitchell et al. (2003), S. 8. Er begründet beispielsweise die Exklusion der leistungsbezogenen Risiko-Dimension mit der über mehrere Studien nachgewiesenen hohen Korrelation zu einem übergreifenden Risiko-Konstrukt. Damit ist das „performance risk“ der Argumentation folgend ein Ersatzkonstrukt von „overall risk“, und keine Subdimension [vgl. Mitchell et al. (2003), S. 4].
Vgl. Newall (1977), S. 168. Damit wird das soziale und psychologische Risiko vereint. Einen empirischen Nachweis der Dimensionskombination liefern Peter und Tarpey (1975) mittels Faktorenanalyse [vgl. Peter und Tarpey (1975), S. 32]. Dies lässt darauf schließen, dass es den Probanden schwer fällt die beiden Dimensionen gedanklich zu differenzieren [vgl. Mitchell et al. (2003), S. 4; Mitchell und Greatorex (1993), S. 187]. Brooker (1984) fasst ebenfalls die beiden Dimensionen psychologisches und soziales Risiko zusammen, definiert diese Kombination allerdings als persönliches Risiko.
Vgl. Mitchell (1995), S. 124; Newall (1977), S. 169; Garner und Thompson (1985), S. 155; Mitchell et al. (2003), S. 4; Copley und Callom (1971), S. 208 f.
Vgl. Knight (1921), S. 19 f. 197 ff.; Stone und Grønhaug (1993), S. 40; Mitchell (1999), S. 166. Eine noch detailliertere Differenzierung zwischen „Risiko“, „Sicherheit“, „Ungewissheit“, „Unsicherheit i.e.S., sowie „radikale Unsicherheit“ nimmt Large (1995), S. 52 vor.
Vgl. Sitkin und Pablo (1992), S. 12; Zhang et al. (2019), S. 153; Meertens und Lion (2008), S. 1508; Conchar (2004), S. 421; Weber und Milliman (1997), S. 128.
Vgl. Weber et al. (2002), S. 282; Schoemaker (1990), S. 1460; Sitkin und Weingart (1995), S. 1575; Conchar (2004), S. 426; Dohmen et al. (2017), S. F101. Für eine Vertiefung der Diskussion siehe Kapitelabschnitt 3.1.6.
Carleton et al. (2012), S. 468. Auch nach Fink (2016), S. 6 ist Angst: „Thoughts of future threat“. Auch hier wird der Bezug zu den negativen Konsequenzen ersichtlich.
Es sei darauf hingewiesen, dass dies die finalen Indikatorformulierungen sind – nach Einpflegen der Anmerkungen aus der ersten Überprüfung und Modifikation [siehe Kapitelabschnitt 3.3].
Vgl. Knowles et al. (1973), S. 131; Zhang et al. (2019), S. 154; Wolman (1989), S. 103; Sitkin und Pablo (1992), S. 12 f.; Meertens und Lion (2008), S. 1511.
Vgl. Mata et al. (2018), S. 156; Sitkin und Weingart (1995), S. 1575. Beispielsweise konnten Dohmen et al. (2017) aufzeigen, dass die Risikoneigung mit dem Alter sinkt, sich jedoch ab 65 Jahren konstanter verhält [vgl. Dohmen et al. (2017), S. F101]. Es gibt allerdings auch Studien, die ein Zusammenwirken situationsspezifischer und genereller Risikoneigung proklamieren [vgl. Highhouse et al. (2017), S. 405].
Es sei darauf hingewiesen, dass dies die finalen Indikatorformulierungen sind – nach Einpflegen der Anmerkungen aus der ersten Überprüfung und Modifikation [siehe Kapitelabschnitt 3.3].
Hier wurde bewusst auf eine negative Kodierung verzichtet, da der Indikator im Original eine doppelte Negierung beinhaltet, die in der deutschen Übersetzung als verwirrend wahrgenommen wurde [siehe Kapitelabschnitt 3.3].
Vgl. Epstein et al. (1996), S. 392. Erwähnung findet es aber bereits in der Arbeit von Epstein (1994). Damals noch unter dem Oberbegriff „Rational versus Experiential Inventory (RVEI) [vgl. Epstein (1994), S. 719 f.].
Vgl. Cohen et al. (1955), S. 291; Cacioppo und Petty (1982), S. 116. Als ursächlich für die Unterbrechung der Forschung zu Need for Cognition sehen die Autoren die ab den 1950/60er Jahren aufblühende Forschung zur kognitiven Konsistenz mit der Entwicklung der kognitiven Dissonanztheorie [vgl. Cacioppo und Petty (1982), S. 116].
Siehe beispielhaft Zimmerman et al. (2011), S. 292; Priluck und Till (2004), S. 331; Petty et al. (2008), S. 900; Alós-Ferrer und Hügelschäfer (2016), S. 61.
Siehe beispielhaft Ahlering und Parker (1989), S. 313; Cacioppo et al. (1984), S. 306; Haugtvedt et al. (1992), S. 240 f.; Petty et al. (2009), S. 318 verweisend auf die Definition von Cacioppo und Petty (1982), S. 116.
Vgl. Epstein et al. (1996), S. 401. Ähnliche Erkenntnisse liefern auch Studien zur Analyse der Dual-Processing Modelle [vgl. Bohner et al. (1995), S. 61].
Eine ambiguose Situation ist dadurch gekennzeichnet, dass ein Individuum die Situation aufgrund eines Mangels an Cues nicht angemessen strukturieren kann [vgl. Budner (1962), S. 30].
Vgl. Kaufmann et al. (2014), S. 105; Kaufmann et al. (2017), S. 83 f. Dies wird insbesondere anhand der Indikatoren deutlich [vgl. Kaufmann et al. (2014), S. 108; Kaufmann et al. (2017), S. 86].
Verweisend auf Stanczyk et al. (2015) und ihre Unterscheidung zwischen „creative intuition“ und „justified intuition“ [vgl. Stanczyk et al. (2015), S. 174 f.].
Vgl. Epstein et al. (1996), S. 394; Pacini und Epstein (1999), S. 976. Hier wird Need for Cognition zwar mit Hilfe zweier Subskalen gemessen – über Rational Engagement und Rational Ability. Allerdings verstehen die Autoren die Subskalen nicht als Dimensionen des Konstruktes. Dies wird durch die Faktorenanalyse deutlich [vgl. Pacini und Epstein (1999), S. 976].
Vgl. Cacioppo et al. (1984), S. 307. Nachdem die Indikatoren gemäß ihren Faktorladungen absteigend gelistet wurden, fand nach sukzessivem Hinzufügen der jeweils nächsten Indikatoren aus der Liste eine Bewertung der Cronbach Alpha Werte statt. Bei 19 Indikatoren sank der Cronbach Alpha Wert schließlich, weshalb die Operationalisierung insgesamt 18 Indikatoren umfasst [vgl. Cacioppo et al. (1984), S. 306].
Vgl. Weiber und Sarstedt (2021), S. 125. Diese Nachteile entspringen der Unterscheidung zwischen Single- und Multi-Item Messungen. Jedoch dürften diese mit steigender Anzahl an Indikatoren umso eher und stärker zutreffen.
Aus Konsistenzgründen wurde eine Übernahme der deutschen Kurzfassung von Need for Cognition [vgl. Beißert et al. (2014)] abgelehnt und stattdessen eine Übernahme der beiden englischsprachigen Messmodelle von Epstein et al. (1996) mit anschließender Übersetzung befürwortet.
Es sei darauf hingewiesen, dass dies die finalen Indikatorformulierungen sind – nach Einpflegen der Anmerkungen aus der ersten Überprüfung und Modifikation [siehe Kapitelabschnitt 3.3].
Es sei darauf hingewiesen, dass dies die finalen Indikatorformulierungen sind – nach Einpflegen der Anmerkungen aus der ersten Überprüfung und Modifikation [siehe Kapitelabschnitt 3.3].
Die Methodenliteratur empfiehlt eine Offenlegung und Begründung der Operationalisierungen von Kontrollvariablen [vgl. Becker (2005b), S. 285; Becker et al. (2016), S. 158]. Dies wird in diesem Kapitelabschnitt adressiert.
Vgl. Bergkvist und Rossiter (2007), S. 176; Diamantopoulos et al. (2012), S. 435. Da eine ausgiebige Analyse der Reliabilität für die Kontrollvariablen nicht fokussiert wird, ist einer der Hauptkritikpunkte an Single-Item Messungen hier zu vernachlässigen.
Vgl. Boyd et al. (2005), S. 246. Zur Empfehlung, wann Single-Item Messungen eingesetzt werden sollten siehe Fuchs und Diamantopoulos (2009), S. 203 ff.
Es sei darauf hingewiesen, dass dies die finalen Indikatorformulierungen sind – nach der ersten Überprüfung und Modifikation [siehe Kapitelabschnitt 3.3].
Vgl. Brown et al. (2012), S. 518; Zablah et al. (2010), S. 259. Für Multi-Item Messungen des Selbst-wahrgenommenen Involvements siehe Kohli (1989), S. 63; Kohli und Zaltman (1988), S. 203.
Die Operationalisierung der Lieferantenerfahrung erfolgte analog zur Kontrollvariable „Erfahrung mit der Logistikdienstleistung“ und damit in Anlehnung an Arbeiten zur „Produkterfahrung“ (engl. Product Familiarity) [vgl. Kaufmann et al. (2017), S. 86; Zablah et al. (2010), S. 259].
Vgl. Kaufmann et al. (2017), S. 86; Zablah et al. (2010), S. 259. Für Multi-Item Messungen der Produkterfahrung siehe Heitmann et al. (2007), S. 246; Riedl et al. (2013), S. 34.
Vgl. Mahlendorf (2008), S. 230; Breitling (2018), S. 458. Die Abstufung der Abfrage erfolgte auf Grundlage der Empfehlungen der Europäische Union (2003) zur Bestimmung von Kleinstunternehmen, kleinen und mittleren Unternehmen [vgl. Europäische Union (2003), S. 39].
Vgl. Mahlendorf (2008), S. 230; Breitling (2018), S. 458. Die Abstufung der Abfrage erfolgte auf Grundlage der Empfehlungen der Europäische Union (2003) zur Bestimmung von Kleinstunternehmen, kleinen und mittleren Unternehmen [vgl. Europäische Union (2003), S. 39].
Die Einteilung in Ex-ante und Ex-post Checks in den Unterkapiteln basiert nicht immer aufgrund notwendiger Vorarbeiten zur Durchführung der Tests (wie beispielsweise bei den Multigruppenanalysen, beim Einfluss der Social Desirability Indexe oder beim Full Collinearity Test), sondern auch aufgrund der Praktikabilität und Struktur der Arbeit. So hätte beispielsweise Harmans Einfaktor-Test auch vor der Hauptanalyse durchgeführt werden können.
Eine ähnliche Strukturierung in „Pre-Data Collection Techniques“ und „Post-Data Collection Techniques“ nimmt Baumgartner und Steenkamp (2006) vor [vgl. Baumgartner und Steenkamp (2006), S. 99 ff.]. Die Ex-Ante und Ex-post Checks werden dann später entsprechend vor bzw. nach der Kausalanalyse durchgeführt und diskutiert [siehe Kapitelabschnitt 4.1 und Kapitelabschnitt 4.3.3.5].
Vgl. Döring und Bortz (2016), S. 384. In der Sozialforschung hat sich gezeigt dass vor allem Personen, die kein Interesse an der Umfrageforschung, die eine geringe Bildung aufweisen, die eine Furcht vor Viktimisierung, die beruflich sehr beschäftigt oder die sehr erfahren in der Thematik sind, seltener an Umfragen teilnehmen [vgl. Häder (2019), S. 189; Diller (2006), S. 616]. Respondenten dagegen gelten als eher zufrieden mit dem Job, loyal und committed zur Organisation [vgl. Rogelberg et al. (2000), S. 288] sowie als gewissenhaft [vgl. Rogelberg et al. (2003), S. 1108]. Für einen Überblick zu den verschiedenen Theorien zur Erklärung der Teilnahme und Nicht-Teilnahme von Probanden siehe auch Häder (2019), S. 205 ff.
Kittleson (1997) hält fest, dass mehr als zwei Erinnerungsschreiben keine wesentliche Erhöhung des Rücklaufs bewirken. Er empfiehlt ein bis zwei Erinnerungsschreiben [vgl. Kittleson (1997), S. 196]. Zur genaueren Beschreibung des Vorgehens der vorliegenden Arbeit siehe Kapitelabschnitt 4.1.1.
Vgl. Schafer und Graham (2002), S. 148; Hair et al. (2022), S. 63. Demnach ist es wichtig zu bestimmen, um welche Art und um welche Anzahl an Missing Values es sich handelt. [vgl. Hair et al. (2022), S. 63]. Zur Bestimmung der Art der Missing Values wird häufig die Kategorisierung von Rubin (1976) in 1) Not missig at random (NMAR), 2) Missing completely at random (MCAR) und 3) Missing at random (MAR) angewendet.
Diese Maßnahme zur Auswahl von Respondenten aufgrund deren Berufsbezeichnung oder spezifischen Wissens wird auch in der Literatur zum Informant Bias thematisiert [vgl. Phillips (1981), S. 396; Kumar et al. (1993), S. 1634].
Bei der Filterfrage wurden zur Verdeutlichung Beispiele zur strategischen Auswahl von Logistikdienstleistern gegeben: 1) Abschließen von Rahmenverträgen (Fracht-, Speditions- oder Lagerverträge) mit Logistikdienstleistern. 2) Abschließen von Kontraktlogistikverträgen mit Logistikdienstleistern. 3) Aufnahme einer Lieferanten-Abnehmer-Beziehung zu einem Logistikdienstleister.
Angesichts eines solchen Vorgehens müsste dann der Leniency Bias kontrolliert werden, da davon auszugehen ist, dass Personen ihre Kollegen oder Freunde vorteilhafter, bzw. sozial erwünschter darstellen wollen [vgl. Schriesheim et al. (1979), S. 2; Schriesheim (1981), S. 402].
Vgl. Podsakoff et al. (2012), S. 549; MacKenzie und Podsakoff (2012), S. 552; Weijters et al. (2008), S. 412; Chang et al. (2020), S. 389; Barden et al. (2005), S. 163. Siehe hierzu auch die Ausführungen des Pre-Tests [vgl. Kapitelabschnitt 3.3].
Vgl. Lindell und Whitney (2001), S. 116. Für eine Übersicht zu den verschieden Einsatzmöglichkeiten und zu Anwendungsbeispielen sei auf Williams et al. (2010), S. 480 verwiesen.
Zudem konnten auch Richardson et al. (2009) aufzeigen, dass die Methode bei der Entdeckung von Common Method Bias nicht überzeugt [vgl. Richardson et al. (2009), S. 793]. Daher lehnen auch Conway und Lance (2010) den Einsatz einer „Marker“-Variable nach dem Vorbild von Lindell und Whitney (2001) ab [vgl. Conway und Lance (2010), S. 331].
Vgl. Podsakoff und Organ (1986), S. 536. Eine Anwendung des Tests ist beispielhaft bei Mohaghegh et al. (2021), S. 7; Riedl et al. (2013), S. 29; Golicic et al. (2012), S. 26 zu finden.
Die Autoren beschreiben den Test als „variance-based SEM equivalent“ zu der zweiten von Lindell und Whitney (2001) vorgeschlagenen Methode zum Einsatz eines „ungemessenen“ Faktors, die im Gegensatz bei kovarianzbasierten Strukturgleichungsanalysen mittels konfirmatorischer Faktorenanalyse angewendet wird und in dieser Form in PLS-Ansätzen nicht umsetzbar ist [vgl. Kock und Lynn (2012), S. 561].
Vgl. Kock und Lynn (2012), S. 578. Eine Anwendung des Tests ist beispielhaft bei Rasoolimanesh et al. (2015), S. 339; Kock (2015), S. 6; Kock (2017), S. 253; Dennis et al. (2016), S. 3052 zu finden.
Vgl. Winkler et al. (2006), S. 2; Paulhus (2002), S. 50; King und Bruner (2000), S. 80; Podsakoff und Organ (1986), S. 535; Arnold und Feldman (1981), S. 377.
Insbesondere kann die soziale Erwünschtheit die Konstruktvalidität der Markensensibilität, als auch die kausalen Beziehung zwischen den Konstrukten gefährden [vgl. Bagozzi und Yi (1991), S. 426], was letztendlich zu einer falschen Ergebnisinterpretation führen kann [vgl. Jo (2000), S. 138].
Vgl. Moosbrugger und Kelava (2020), S. 83; Döring und Bortz (2016), S. 440; Wang et al. (2013), S. 120; Fisher und Katz (2000), S. 117; Fisher (1993), S. 313.
Beispielsweise entwickelten Strahan und Gerbasi (1972) zwei 10 Indikatoren umfassende Skalen und eine kombinierte Skala mit 20 Indikatoren [vgl. Strahan und Gerbasi (1972), S. 192]. Später bestimmt Reynolds (1982) drei Kurzformen (11, 12 und 13-Indikatoren) [vgl. Reynolds (1982), S. 121].
Vgl. Paulhus (1984), S. 599. Die Idee zur Zwei-Dimensionalität stammt von Sackheim und Gur (1978), die zwischen der Self-Deception und Other Deceptions unterscheiden [vgl. Paulhus (2002), S. 55 f.; Paulhus (1984), S. 599].
Gleichzeitig wird die Skala von Crowne und Marlowe (1960) für seine veraltete Wortwahl und seine geringe Reliabilität kritisiert [vgl. Hart et al. (2015), S. 1; Beretvas et al. (2002), S. 583]. Zur Kritik an den Kurzformen der Crowne und Marlowe (1960) Skala siehe Thompson und Phua (2005), S. 547 ff.
Vgl. Hair et al. (2022), S. 64. Auf der anderen Seite betrachten Baumgartner und Steenkamp (2001) sieben unterschiedliche Antworttendenzen; unter anderem die „Aquiescence, Disaquiescence und Net Acquiescence Response Styles“ [vgl. Baumgartner und Steenkamp (2001), S. 144]. Der Aquiescence Response Style wird auch häufig als „Aquiescence Bias“ bezeichnet und beschreibt in aller Kürze die Zustimmungsneigung von Probanden [vgl. Winkler et al. (1982), S. 555; Krosnick (1999), S. 552 f.; Weijters et al. (2010), S. 105 f.].
In der Literatur herrscht eine Vielzahl an Begriffen, die sich der Verzerrung durch Retrospektion widmen – beispielsweise Restrospective Bias, Memory Bias, oder Hindsight Bias.
Eine Anmerkung betraf die Komplexität, die durch den Begriff „strategische Auswahl von Logistikdienstleistern“ ausgeht. Aufgrund dessen wurde im Fragebogen die Abkürzung: „strategische LogistikDL-Auswahl“ verwendet. Eine zweite Anmerkung betraf die doppelte Negierung von Indikator IRN 05. Dieser wurde als verwirrend wahrgenommen, weshalb er im Folgenden nicht revers kodiert wurde. Eine dritte Anmerkung betraf das Messmodell Markensensibilität. Hier wurden ebenfalls die revers kodierten Indikatoren MSE 03 und MSE 05 kritisiert und daher positiv formuliert.
Vgl. Schriesheim (1978), S. 71; Anderson und Gerbing (1991), S. 734, zur Anwendung siehe auch Hair et al. (2019a), S. 682; Mahlendorf (2008), S. 79; Durst (2011), S. 116; MacKenzie et al. (1991), S. 129; Yao et al. (2007), S. 487. Alternativen zum Sorting-Pretest liefern Zaichkowsky (1985), S. 343; MacKenzie et al. (2011), S. 305.
Vgl. Stone und Grønhaug (1993), S. 49. Das in der Konsumentenforschung häufig berücksichtigte physische Risiko [vgl. Stone und Grønhaug (1993), S. 50; Jacoby et al. (1977)] wird in empirischen Untersuchungen zur Erklärung des Beschaffungsverhalten oder im organisationalen Kontext eher selten herangezogen [vgl. Henthorne und LaTour (1992), S. 69; Brown et al. (2011), S. 203]. Zu derselben Erkenntnis kommen auch Mitchell et al. (2003): „it seems unlikely that there exists a notion of physical risk to the purchaser involved in organisational professional services […].“ [ Mitchell et al. (2003), S. 4]. Aus diesem Grund wurde die Dimension "physisches Risiko" im Rahmen des Pre-Tests auch nicht abgefragt.
Anders als für die wahrgenommene Informationsüberflutung stellten die fünf Risikodimensionen keinen Inhalt des Hypothesensystems dar, sondern galten lediglich als Option den indirekten Effekt detaillierter zu betrachten. Insofern wurden diese fünf Risikodimensionen in der vorliegenden Arbeit auch nicht im Hypothesensystem berücksichtigt oder operationalisiert.
Nach der Auswertung der Anmerkungen muss festgehalten werden, dass die Probanden die Zuordnung als sehr anstrengend und zeitintensiv wahrgenommen haben. Vor dem Hintergrund der Erkenntnisse von Miller (1956) zur Informationsverarbeitung sollte zukünftig von Sorting-Pre-Tests mit mehr als sieben Konstrukten abgeraten werden. Bei sehr komplexen Modellen mit mehreren Variablen sollten dann diejenigen Konstrukte im Sorting-Pre-Test auf inhaltliche Validität kontrolliert werden, die auch konzeptionell eng miteinander verbunden sind und eine Gefahr der inhaltlichen Überschneidung begründet ist.
Ein ähnliches Problem trat bei Epstein et al. (1996) und ihrer Neu-Entwicklung des Messmodells Faith in Intuition auf. Zunächst war beabsichtigt die Hälfte der Indikatoren negativ zu formulieren, jedoch zeigte die Güteprüfung daraufhin eine schlechte interne Konsistenz an, weshalb die Autoren sich ebenfalls entschlossen die revers kodierten Indikatoren positiv zu formuliere [vgl. Epstein et al. (1996), S. 394].
So wurden beispielsweise die deskriptive Abfrage nach dem Einkaufsvolumen ergänzt und die Referenz bei der Zeitdauer und dem Zurückliegen der Lieferantenauswahl von Monaten in Wochen geändert.
Vgl. Roetzel (2019), S. 494 ff.; Eppler und Mengis (2004), S. 283; Jackson und Farzaneh (2012), S. 525; Schneider (1987), S. 146; Driver und Streufert (1969), S. 274; Payne (1976), S. 384.
Ausführlich hierzu die Abhandlungen in Kapitelabschnitt 2.1.2.2.2. Hingegen gehen Brown et al. (2012) von einem U-förmigen Effekt für die Beschaffungskomplexität aus [vgl. Brown et al. (2012), S. 510]. Allerdings konnte die U-förmige Wirkungsbeziehung nicht bestätigt werden [vgl. Brown et al. (2012), S. 513]. Schließlich wurde in Schlussfolgerung der Markensensibilitätsliteratur festgehalten, dass der positive lineare Effekt fundierter scheint [siehe Kapitelabschnitt 2.1.2.2.2]. Dennoch soll das Hypothesensystem aufgrund der Arbeit von Brown et al. (2012) auf einen möglichen nicht-linearen Effekt geprüft werden [siehe Kapitelabschnitt 4.3.3.3].