Skip to main content
Erschienen in: Datenbank-Spektrum 1/2015

01.03.2015 | Schwerpunktbeitrag

Content Analysis between Quality and Quantity

Fulfilling Blended-Reading Requirements for the Social Sciences with a Scalable Text Mining Infrastructure

verfasst von: Matthias Lemke, Andreas Niekler, Gary S. Schaal, Gregor Wiedemann, M.A.

Erschienen in: Datenbank-Spektrum | Ausgabe 1/2015

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Social science research using Text Mining tools requires—due to the lack of a canonical heuristics in the digital humanities—a blended reading approach. Integrating quantitative and qualitative analyses of complex textual data progressively, blended reading brings up various requirements for the implementation of Text Mining infrastructures. The article presents the Leipzig Corpus Miner (LCM), developed in the joint research project ePol—Post-Democracy and Neoliberalism and responding to social science research requirements. The functionalities offered by the LCM may serve as best practice of processing data in accordance with blended reading.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Weitere Produktempfehlungen anzeigen
Fußnoten
1
http://​www.​epol-projekt.​de; for the heuristic interest articulated by the Political Science branch of the project, see Lemke and Schaal [16: 3–19].
 
4
Wiedemann et al. [27: pp. 101 ff].
 
6
Currently we are trying to optimize classification results, before we run final classifications for different sub collections. For now we achieve F1 = 0.613 and accuracy = 0.867 on our category of neoliberal argumentation (interrater reliability during manual annotation phase: Krippendorf’s alpha = 0.76).
 
Literatur
1.
Zurück zum Zitat Baßler M (1995) Einleitung. In: Baßler M (ed) New Historicism. Literaturgeschichte als Poetik der Kultur. Fischer, Frankfurt a. M., pp 7–28 Baßler M (1995) Einleitung. In: Baßler M (ed) New Historicism. Literaturgeschichte als Poetik der Kultur. Fischer, Frankfurt a. M., pp 7–28
4.
Zurück zum Zitat Evangelopoulos N, Zhang X, Prybutok VR (2012) Latent semantic analysis: five methodological recommendations. Eur J Inf Syst 21:70–86 Evangelopoulos N, Zhang X, Prybutok VR (2012) Latent semantic analysis: five methodological recommendations. Eur J Inf Syst 21:70–86
5.
Zurück zum Zitat Ferrucci D, Lally A (2004) UIMA. An architectural approach to unstructured information processing in the corporate research environment. Nat Lang Eng 10(3–4):327–348CrossRef Ferrucci D, Lally A (2004) UIMA. An architectural approach to unstructured information processing in the corporate research environment. Nat Lang Eng 10(3–4):327–348CrossRef
6.
Zurück zum Zitat Früh W (2009) Inhaltsanalyse. Theorie und Praxis. UVK, Konstanz Früh W (2009) Inhaltsanalyse. Theorie und Praxis. UVK, Konstanz
7.
Zurück zum Zitat Gadamer HG (1968) Klassische und philosophische Hermeneutik. In: Grondin J (ed) Gadamer-Lesebuch. Mohr Siebeck, Tübingen, pp 32–57 Gadamer HG (1968) Klassische und philosophische Hermeneutik. In: Grondin J (ed) Gadamer-Lesebuch. Mohr Siebeck, Tübingen, pp 32–57
8.
Zurück zum Zitat Heyer G, Quasthoff U, Wittig T (2008) Text Mining: Wissensrohstoff Text. IT lernen. W3L GmbH, Herdecke Heyer G, Quasthoff U, Wittig T (2008) Text Mining: Wissensrohstoff Text. IT lernen. W3L GmbH, Herdecke
9.
Zurück zum Zitat Husserl E (1976) Die Krisis der europäischen Wissenschaften und die transzendentale Phänomenologie. Eine Einleitung in die phänomenologische Philosophie. Biemel v. W. (ed) Husserliana, vol 6. Nijhoff, The Hague Husserl E (1976) Die Krisis der europäischen Wissenschaften und die transzendentale Phänomenologie. Eine Einleitung in die phänomenologische Philosophie. Biemel v. W. (ed) Husserliana, vol 6. Nijhoff, The Hague
10.
Zurück zum Zitat Husserl E (1980) Phantasie, Bildbewusstsein, Erinnerung. Zur Phänomenologie der anschaulichen Vergegenwärtigungen. In: Marbach E (ed) Husserliana, vol. 23. Springer, The Hague Husserl E (1980) Phantasie, Bildbewusstsein, Erinnerung. Zur Phänomenologie der anschaulichen Vergegenwärtigungen. In: Marbach E (ed) Husserliana, vol. 23. Springer, The Hague
11.
Zurück zum Zitat Ihde D (1998) Expanding hermeneutics. Visualism in science. Northwestern University Press, Evanston Ihde D (1998) Expanding hermeneutics. Visualism in science. Northwestern University Press, Evanston
12.
Zurück zum Zitat Ihde D (2012) Experimental Phenomenology. Multistables. State University of New York, New York Ihde D (2012) Experimental Phenomenology. Multistables. State University of New York, New York
14.
16.
Zurück zum Zitat Lemke M, Schaal GS (2014) Ökonomisierung und Politikfeldanalyse. Eine ideengeschichtliche und theoretische Rekonstruktion des Neoliberalismus in der Postdemokratie. Schaal GS, Lemke M, Ritzi C (eds) Die Ökonomisierung der Politik in Deutschland. Eine vergleichende Politikfeldanalyse. Springer VS, Wiesbaden, pp 3–19 Lemke M, Schaal GS (2014) Ökonomisierung und Politikfeldanalyse. Eine ideengeschichtliche und theoretische Rekonstruktion des Neoliberalismus in der Postdemokratie. Schaal GS, Lemke M, Ritzi C (eds) Die Ökonomisierung der Politik in Deutschland. Eine vergleichende Politikfeldanalyse. Springer VS, Wiesbaden, pp 3–19
17.
Zurück zum Zitat Lemke M, Stulpe A (2015, forthcoming) Text und soziale Wirklichkeit. Theoretische Grundlagen und empirische Anwendung von Text-Mining-Verfahren in sozialwissenschaftlicher Perspektive. Scharloth J, Bubenhofer N (eds) ZGL-Sonderheft Automatisierte Textanalyse. http://www.degruyter.com/view/j/zfgl Lemke M, Stulpe A (2015, forthcoming) Text und soziale Wirklichkeit. Theoretische Grundlagen und empirische Anwendung von Text-Mining-Verfahren in sozialwissenschaftlicher Perspektive. Scharloth J, Bubenhofer N (eds) ZGL-Sonderheft Automatisierte Textanalyse. http://​www.​degruyter.​com/​view/​j/​zfgl
18.
Zurück zum Zitat Mayring P (2010) Qualitative Inhaltsanalyse. Grundlagen und Techniken, 11th edn. Beltz, Weinheim Mayring P (2010) Qualitative Inhaltsanalyse. Grundlagen und Techniken, 11th edn. Beltz, Weinheim
19.
Zurück zum Zitat Montrose L (1995) Die Renaissance behaupten. Die Poetik und Politik der Kultur. In: Baßler M (ed), New Historicism. Literaturgeschichte als Poetik der Kultur. Fischer, Frankfurt a. M., pp 60–93 Montrose L (1995) Die Renaissance behaupten. Die Poetik und Politik der Kultur. In: Baßler M (ed), New Historicism. Literaturgeschichte als Poetik der Kultur. Fischer, Frankfurt a. M., pp 60–93
20.
Zurück zum Zitat Moretti F (2000) Conjectures on world literature. New Left Rev 1(1):54–68 Moretti F (2000) Conjectures on world literature. New Left Rev 1(1):54–68
21.
Zurück zum Zitat Moretti F (2007) Graphs, maps, trees. Abstract models for literary history. Verso, London Moretti F (2007) Graphs, maps, trees. Abstract models for literary history. Verso, London
22.
Zurück zum Zitat Niehr T (1999) Halbautomatische Erforschung des öffentlichen Sprachgebrauchs oder Vom Nutzen computerlesbarer Textkorpora. ZGL 27(2):205–214 Niehr T (1999) Halbautomatische Erforschung des öffentlichen Sprachgebrauchs oder Vom Nutzen computerlesbarer Textkorpora. ZGL 27(2):205–214
25.
Zurück zum Zitat Stone PJ (1966) The general inquirer: A computer approach to content analysis. MIT Press, Cambridge Stone PJ (1966) The general inquirer: A computer approach to content analysis. MIT Press, Cambridge
27.
Zurück zum Zitat Wiedemann G, Lemke M, Niekler A (2013) Postdemokratie und Neoliberalismus – Zur Nutzung neoliberaler Argumentation in der Bundesrepublik Deutschland 1949–2011. Ein Werkstattbericht. ZPTh 4(1):99–115 Wiedemann G, Lemke M, Niekler A (2013) Postdemokratie und Neoliberalismus – Zur Nutzung neoliberaler Argumentation in der Bundesrepublik Deutschland 1949–2011. Ein Werkstattbericht. ZPTh 4(1):99–115
Metadaten
Titel
Content Analysis between Quality and Quantity
Fulfilling Blended-Reading Requirements for the Social Sciences with a Scalable Text Mining Infrastructure
verfasst von
Matthias Lemke
Andreas Niekler
Gary S. Schaal
Gregor Wiedemann, M.A.
Publikationsdatum
01.03.2015
Verlag
Springer Berlin Heidelberg
Erschienen in
Datenbank-Spektrum / Ausgabe 1/2015
Print ISSN: 1618-2162
Elektronische ISSN: 1610-1995
DOI
https://doi.org/10.1007/s13222-014-0174-x

Weitere Artikel der Ausgabe 1/2015

Datenbank-Spektrum 1/2015 Zur Ausgabe

EDITORIAL

Editorial

DISSERTATIONEN

Dissertationen

Premium Partner