Skip to main content
main-content

Tipp

Weitere Kapitel dieses Buchs durch Wischen aufrufen

2022 | OriginalPaper | Buchkapitel

12. Computerlinguistik: Eine Fallstudie zu Corona anhand der Analyse lokaler und bundesweiter Diskurse in ausgewählten Medien

verfasst von: Heike Walterscheid, Veton Matoshi, Katarzyna Wiśniewiecka-Brückner, Klaus Rothenhäusler, Frank Eckardt

Erschienen in: Corona und die anderen Wissenschaften

Verlag: Springer Fachmedien Wiesbaden

share
TEILEN

Zusammenfassung

Auf der Grundlage des methodischen Hilfsmittels der veröffentlichten und öffentlichen Meinung, die von der tatsächlichen gesellschaftlichen (versteckten) Meinung abweichen können, wurden Texte aus lokalen und bundesweiten digitalen Medien extrahiert, um aus diesen mit LDA als gängigem Topic-Modeling Verfahren und einer auf BERT basierten Variante Corona-relevante Medien-Diskurse experimentell zu identifizieren. Die intuitive Erwartung eines positiven Befundes wurde bestätigt. Die Ähnlichkeit der Ergebnisse der unterschiedlichen Verfahren des maschinellen Lernens liefert einen Hinweis auf die grundsätzliche Eignung der methodischen Erfassung digitaler Diskurse. Allerdings bedarf es der methodischen Verbesserung, um das Potenzial des primär erhobenen Datensatzes auch mit Blick auf zunächst nicht offensichtliche Diskurse zu erschließen.
Fußnoten
1
Zeitraum: 2001–2020; Umfang: 121.388.607 Mio. Token. Korpusinhalt: lokale Medien der süddeutschen Regionen Freiburg und Südbaden: Badische Zeitung (www.​badische-zeitung.​de/​), Die Oberbadische (www.​verlagshaus-jaumann.​de), Wochenblatt (www.​wzo.​de/​home), Baden FM Das Radio für Freiburg und Südbaden (www.​baden.​fm), Radio Regenbogen (www.​regenbogen.​de), Südwestfunks (www.​swr.​de/​swraktuell/​baden-wuerttemberg/​suedbaden/​index.​html).
 
2
Korpusinhalt: Die Zeit (www.​zeit.​de), Frankfurter Allgemeine Zeitung (www.​faz.​net), Frankfurter Rundschau (www.​fr.​de), Süddeutsche Zeitung (www.​sueddeutsche.​de), Der Spiegel (www.​spiegel.​de), Bild (www.​bild.​de), Fokus (www.​focus.​de), Die Welt (www.​welt.​de) und Stern (www.​stern.​de).
 
3
Als Topic ist die im LDA-Verfahren ermittelte zusammengehörige Wortmenge zu verstehen.
 
4
Als Thema ist die Interpretation der im LDA-Verfahren ermittelten zusammengehörigen Wortmenge, des Topics, zu verstehen.
 
5
Als relevant sollen Diskurse gelten, wenn ihre Verbreitung festgestellt werden kann und Subdiskurse gebildet werden.
 
6
Unter Salienz wird in diesem Beitrag verstanden, dass ein Thema besonders aus seinem Kontext hervorsticht und deshalb stärker wahrgenommen wird als andere Themen.
 
7
Lemma (Plural: Lemmata): die Grundform eines Wortes, die alle grammatischen Formen des Wortes miteinschließt. Elektronische Sprachdaten werden automatisch lemmatisiert, damit alle Formen eines Wortes gefunden werden können und dem jeweiligen Lemma zugeschrieben werden können. Die Lemmatisierung der Daten ist ein gängiger Datenvorbereitungsvorgang in der Korpuslinguistik. Besonders im Falle flektierender Sprachen, zu denen die deutsche Sprache gehört, ist Lemmatisierung wichtig.
 
8
Als Doubletten werden im Beitrag formal und semantisch identische Einheiten eingestuft. Bei semantischer Identität und formaler (orthografischer, grammatischer) Ungleichheit werden Varianten separat berücksichtigt und aufgeführt. Vgl. Coronakrise: Corona-Krise.
 
9
Der Relevanzwert bewegt sich in einem Spektrum von λ = 1 (relevant) und λ = 0 (nicht relevant).
 
10
vgl.: [T7A-loc (2,7 %): Absage, Corona-Zahlen, Schutzmaske, Krankheit]; [T27A-loc (1,5 %): Pandemie-Lage, Pandemie, Corona-Regeln, Corona-Infektionen, Hygieneregel]; [T28A-loc (1,5 %): Quarantäne, Corona-Krise, Korona-Fälle, Fall, Welle]; [T41A-loc (1,2 %): Krise, Lockerung, Covid-19, Fall, Beschränkung].
 
11
vgl.: [T8A-nat (1,4 %): Coronavirus, Virus, Kampf, Krankheit, Ausbreitung, Mensch, Schuld, Medikament, Covid-19, Mediziner, Verlierer, Corona, Verbreitung, Corona-Pandemie, Infektion, China, Bundesgesundheitsminister, Nachbarland, Besserung].
 
12
Als affin werden Terme eingestuft, die eine formale, semantische oder formalsemantische Beziehung zum Thema Corona aufweisen. Aus der so verstandenen Affinität ergibt sich die Relevanzzuschreibung für das Thema Corona.
 
13
Vgl. Corona in Zahlen.de. https://​www.​corona-in-zahlen.​de/​weltweit/​deutschland/​. Zugegriffen im Juni 2021.
 
14
Für eine kurze Beschreibung des Tf-idf-Maßes (term frequency & inverse document frequency) siehe Qaiser und Ali (2018).
 
Literatur
Zurück zum Zitat Bubenhofer N, Rothenhäusler K (2018) „Die Aussicht ist grandios!“ – Korpuslinguistische Analyse narrativer Muster in Bergtourenberichten. In: Eller-Wildfeuer N, Rössler P, Wildfeuer A (Hrsg) Alpindeutsch. Einfluss und Verwendung des Deutschen im Alpinen Raum. Edition Vulpes, Regensburg, S 39–60 Bubenhofer N, Rothenhäusler K (2018) „Die Aussicht ist grandios!“ – Korpuslinguistische Analyse narrativer Muster in Bergtourenberichten. In: Eller-Wildfeuer N, Rössler P, Wildfeuer A (Hrsg) Alpindeutsch. Einfluss und Verwendung des Deutschen im Alpinen Raum. Edition Vulpes, Regensburg, S 39–60
Zurück zum Zitat Bubenhofer N, Rothenhäusler K, Affolter K, Pajovic D (2019) The linguistic construction of world: an example of visual analysis and methodological challenges. In: Scholz R (Hrsg) Quantifying approaches to discourse for social scientists. Springer, Cham, S 251–284 CrossRef Bubenhofer N, Rothenhäusler K, Affolter K, Pajovic D (2019) The linguistic construction of world: an example of visual analysis and methodological challenges. In: Scholz R (Hrsg) Quantifying approaches to discourse for social scientists. Springer, Cham, S 251–284 CrossRef
Zurück zum Zitat Devlin J, Chang M-W, Lee K, Toutanova K (2019) BERT: pre-training of deep bidirectional transformers for language understanding. In: Devlin J, Chang M-W, Lee K, Toutanova K (Hrsg) Proceedings of the 2019 conference of the North American chapter of the Association for Computational Linguistics: Human Language Technologies, Bd 1. Association for Computational Linguistics, Minneaplois, S 4171–4186. https://​www.​aclweb.​org/​anthology/​N19-1423/​ Devlin J, Chang M-W, Lee K, Toutanova K (2019) BERT: pre-training of deep bidirectional transformers for language understanding. In: Devlin J, Chang M-W, Lee K, Toutanova K (Hrsg) Proceedings of the 2019 conference of the North American chapter of the Association for Computational Linguistics: Human Language Technologies, Bd 1. Association for Computational Linguistics, Minneaplois, S 4171–4186. https://​www.​aclweb.​org/​anthology/​N19-1423/​
Zurück zum Zitat Luhmann N (1985) Die Autopoiesis des Bewusstseins. Soziale Welt 36:402–446 Luhmann N (1985) Die Autopoiesis des Bewusstseins. Soziale Welt 36:402–446
Zurück zum Zitat Luhmann N (1999) Soziale Systeme. Suhrkamp, Frankfurt am Main Luhmann N (1999) Soziale Systeme. Suhrkamp, Frankfurt am Main
Zurück zum Zitat Noelle-Neumann E (1980) Die Schweigespirale – Öffentliche Meinung, unsere soziale Haut. Piper, München Noelle-Neumann E (1980) Die Schweigespirale – Öffentliche Meinung, unsere soziale Haut. Piper, München
Zurück zum Zitat Putnam RD (2020) Bowling alone: the collapse and revival of American community. Simon&Schuster, New York Putnam RD (2020) Bowling alone: the collapse and revival of American community. Simon&Schuster, New York
Zurück zum Zitat Roudometof V (2015) The glocal and global studies. Globalizations 12(5):774–787 CrossRef Roudometof V (2015) The glocal and global studies. Globalizations 12(5):774–787 CrossRef
Zurück zum Zitat Roudometof V (2019) Recovering the local: from glocalization to localization. Curr Sociol Rev 67(6):801–817 CrossRef Roudometof V (2019) Recovering the local: from glocalization to localization. Curr Sociol Rev 67(6):801–817 CrossRef
Zurück zum Zitat Scharloth J, Bubenhofer N, Rothenhäusler K (2012) Andersschreiben aus Korpuslinguistischer Perspektive: Datengeleitete Zugänge zum Stil. In: Schuster B-M, ophinke D (Hrsg) Andersschreiben: Formen, Funktionen, Traditionen. Erich Schmidt, Berlin, S 157–178 Scharloth J, Bubenhofer N, Rothenhäusler K (2012) Andersschreiben aus Korpuslinguistischer Perspektive: Datengeleitete Zugänge zum Stil. In: Schuster B-M, ophinke D (Hrsg) Andersschreiben: Formen, Funktionen, Traditionen. Erich Schmidt, Berlin, S 157–178
Zurück zum Zitat Walterscheid H, Matoshi V, Wiśniewiecka-Brückner K, Rothenhäusler K, Eckardt F (2021) LDA, BERT: comparison of method application under corona conditions. In: 12th international conference on Applied Human Factors and Ergonomics (AHEF 2021). Springer Nature, Heidelberg. Erscheint demnächst Walterscheid H, Matoshi V, Wiśniewiecka-Brückner K, Rothenhäusler K, Eckardt F (2021) LDA, BERT: comparison of method application under corona conditions. In: 12th international conference on Applied Human Factors and Ergonomics (AHEF 2021). Springer Nature, Heidelberg. Erscheint demnächst
Zurück zum Zitat Wilke J (1999) Leitmedien und Zielgruppenorgane. In: Wilke J (Hrsg) Mediengeschichte der Bundesrepublik Deutschland. Böhlau, Köln/Weimar/Wien, S 302–329 CrossRef Wilke J (1999) Leitmedien und Zielgruppenorgane. In: Wilke J (Hrsg) Mediengeschichte der Bundesrepublik Deutschland. Böhlau, Köln/Weimar/Wien, S 302–329 CrossRef
Metadaten
Titel
Computerlinguistik: Eine Fallstudie zu Corona anhand der Analyse lokaler und bundesweiter Diskurse in ausgewählten Medien
verfasst von
Heike Walterscheid
Veton Matoshi
Katarzyna Wiśniewiecka-Brückner
Klaus Rothenhäusler
Frank Eckardt
Copyright-Jahr
2022
DOI
https://doi.org/10.1007/978-3-658-36903-3_12

Premium Partner