Skip to main content
Erschienen in: Publizistik 1/2018

08.01.2018 | Aufsatz

What you tweet is what we get?

Zum wissenschaftlichen Nutzen von Twitter-Daten

verfasst von: Fabian Pfaffenberger, M.Sc.

Erschienen in: Publizistik | Ausgabe 1/2018

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Elf Jahre nach Veröffentlichung des ersten Tweets hat der Kurznachrichtendienst Twitter mittlerweile eine hohe Präsenz in Gesellschaft, Medien und Wissenschaft. Die Vielzahl an Studien mit Twitter-Daten zeigt, dass Tweets eine beliebte Datenquelle wissenschaftlicher Arbeiten sind. Dies lässt sich vor allem durch die weitestgehend kostenlos und technisch gut verfügbaren Daten sowie die klare, offene Kommunikationsstruktur erklären. Dennoch ist der Kurznachrichtendienst nur bedingt für die Forschung geeignet: Eine eingeschränkte Repräsentativität und Aussagekraft, eine hinsichtlich Zeitspanne und Volumen begrenzte Datenverfügbarkeit und die geringe Datenqualität mindern den wissenschaftlichen Nutzen. Die Eigenheiten der Internetsprache sowie fehlende Metriken erschweren die inhaltliche Analyse der verbreiteten Nachrichten zusätzlich. Zudem stellt die zunehmende Verbreitung von Bots, die mittlerweile einen großen Teil der Kommunikation auf Twitter erzeugen, eine große Herausforderung dar. Anhand eines Fallbeispiels bewertet die Arbeit den wissenschaftlichen Nutzen von Twitter-Daten, indem Probleme bei der Datenerhebung, Auswertung und Interpretation herausgearbeitet werden. Dies soll nicht nur zu einem vorsichtigeren und kritischeren wissenschaftlichen Umgang mit Twitter-Daten beitragen, sondern auch die Frage aufwerfen, inwieweit Twitter-Daten überhaupt in Zukunft für die Wissenschaft bedeutsam sein können.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Publizistik

Die Zeitschrift enthält in der Regel vier größere Aufsätze (Forschungsberichte), dazu Personalien (Laudationes bei Geburtstagen von Fachvertretern, Berufungen, Habilitationen sowie Nachrufe) und Buchbesprechungen. Gelegentlich ist dem Heft auch eine Kolumne/Gastessay vorangestellt.

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
SCOPUS-Abfrage: TITLE-ABS-KEY (twitter). Stand: 15. Oktober 2017.
 
2
Einen systematischen Forschungsüberblick zu Qualitätskriterien von Daten geben Knight und Burn (2005).
 
3
Engl. Application Programming Interface (kurz: API).
 
4
Die kostenfrei verfügbare Bandbreite (Spritzer) beträgt maximal ein Prozent des gesamten Twitter-Volumens. Daneben stehen weitere, kostenpflichtige und nicht allgemein verfügbare Bandbreiten zur Verfügung: Decahose (10 %) und Firehose (100 %).
 
5
Für die REST API GET search/tweets stehen über den Suchparameter result_type drei Abfragemöglichkeiten zur Verfügung: recent (übermittelt nur die neuesten/letzten Tweets zur einer Suchabfrage), popular (nur die populärsten Tweets) und mixed (populäre und neueste Tweets gemischt).
 
6
Das Programm basiert auf dem Python-Paket Tweepy (http://​tweepy.​org) und sammelt alle Daten mit Suchterm-Filter über die Streaming APIs, bzw. deren Endpoint POST statuses/filter. Im Untersuchungszeitraum gab es keine Rate Limits.
 
7
Beispielsweise nutzen manche Bots aktuell beliebte Hashtags, um die Sichtbarkeit eigener Botschaften (meistens Spam) zu erhöhen (vgl. Marechal 2016).
 
8
Als MAU gilt jeder Account, der sich mindestens einmal pro Monat einloggt oder mit einem Twitter-Dienst verbindet – unabhängig davon, ob dies bewusst oder automatisch geschieht.
 
9
Für die manuelle Account-Analyse verglich der Autor allgemeine Nutzermetriken (wie die Tweet- und Retweet-Häufigkeit) der 30 Accounts mit der höchsten Tweet-Anzahl im Datensatz. Beispielsweise war ein Account mit hoher Wahrscheinlichkeit ein Bot, wenn dieser ein sehr hohes Tweet-Volumen hatte (> 1000/Tag) oder nur andere Tweets teilte.
 
10
Benutzernamen vom Autor unkenntlich gemacht.
 
11
Twitter verdoppelte im November 2017 testweise das Limit auf 280 Zeichen.
 
Literatur
Zurück zum Zitat Alexander, J. E., & Tate, M. A. (1999). Web wisdom; how to evaluate and create information quality on the web. Hillsdale: Lawrence Erlbaum. Alexander, J. E., & Tate, M. A. (1999). Web wisdom; how to evaluate and create information quality on the web. Hillsdale: Lawrence Erlbaum.
Zurück zum Zitat Bollen, J., Mao, H., & Zeng, X. (2011). Twitter mood predicts the stock market. Journal of Computational Science, 2, 1–8.CrossRef Bollen, J., Mao, H., & Zeng, X. (2011). Twitter mood predicts the stock market. Journal of Computational Science, 2, 1–8.CrossRef
Zurück zum Zitat Burnap, P., Gibson, R., Sloan, L., Southern, R., & Williams, M. (2016). 140 characters to victory? Using Twitter to predict the UK 2015 general election. Electoral Studies, 41, 230–233.CrossRef Burnap, P., Gibson, R., Sloan, L., Southern, R., & Williams, M. (2016). 140 characters to victory? Using Twitter to predict the UK 2015 general election. Electoral Studies, 41, 230–233.CrossRef
Zurück zum Zitat Cai, L., & Zhu, Y. (2015). The challenges of data quality and data quality assessment in the big data era. Data Science Journal, 14(2), 1–10. Cai, L., & Zhu, Y. (2015). The challenges of data quality and data quality assessment in the big data era. Data Science Journal, 14(2), 1–10.
Zurück zum Zitat Carter, S., Weerkamp, W., & Tsagkias, M. (2013). Microblog language identification. Overcoming the limitations of short, unedited and idiomatic text. Language Resources and Evaluation, 47, 195–215.CrossRef Carter, S., Weerkamp, W., & Tsagkias, M. (2013). Microblog language identification. Overcoming the limitations of short, unedited and idiomatic text. Language Resources and Evaluation, 47, 195–215.CrossRef
Zurück zum Zitat Cheng, Z., Caverlee, J., & Lee, K. (2010). You are where you tweet. Proceedings of the 19th ACM International Conference on Information and Knowledge Management. (S. 759–768). New York: ACM. Cheng, Z., Caverlee, J., & Lee, K. (2010). You are where you tweet. Proceedings of the 19th ACM International Conference on Information and Knowledge Management. (S. 759–768). New York: ACM.
Zurück zum Zitat Dusch, A., Gerbig, S., Lake, M., Lorenz, S., Pfaffenberger, F., & Schulze, U. (2015). Post, reply, retweet – Einsatz und Resonanz von Twitter im Bundestagswahlkampf 2013. In C. Holtz-Bacha (Hrsg.), Die Massenmedien im Wahlkampf (S. 275–294). Wiesbaden: Springer VS. Dusch, A., Gerbig, S., Lake, M., Lorenz, S., Pfaffenberger, F., & Schulze, U. (2015). Post, reply, retweet – Einsatz und Resonanz von Twitter im Bundestagswahlkampf 2013. In C. Holtz-Bacha (Hrsg.), Die Massenmedien im Wahlkampf (S. 275–294). Wiesbaden: Springer VS.
Zurück zum Zitat Ferrara, E., Varol, O., Davis, C., Menczer, F., & Flammini, A. (2016). The rise of social bots. Communications of the ACM, 59(7), 96–104.CrossRef Ferrara, E., Varol, O., Davis, C., Menczer, F., & Flammini, A. (2016). The rise of social bots. Communications of the ACM, 59(7), 96–104.CrossRef
Zurück zum Zitat Gainous, J., & Wagner, K. M. (2014). Tweeting to power: the social media revolution in American politics. Oxford: Oxford University Press. Gainous, J., & Wagner, K. M. (2014). Tweeting to power: the social media revolution in American politics. Oxford: Oxford University Press.
Zurück zum Zitat Gaurav, M., Srivastava, A., Kumar, A., & Miller, S. (2013). Leveraging candidate popularity on Twitter to predict election outcome. Proceedings of the 7th Workshop on Social Network Mining and Analysis – SNAKDD’’13. (S. 1–8). Gaurav, M., Srivastava, A., Kumar, A., & Miller, S. (2013). Leveraging candidate popularity on Twitter to predict election outcome. Proceedings of the 7th Workshop on Social Network Mining and Analysis – SNAKDD’’13. (S. 1–8).
Zurück zum Zitat Gayo-Avello, D. (2012). No, you cannot predict elections with Twitter. IEEE Internet Computing, 16(6), 91–94.CrossRef Gayo-Avello, D. (2012). No, you cannot predict elections with Twitter. IEEE Internet Computing, 16(6), 91–94.CrossRef
Zurück zum Zitat Ginnis, S., & Miller, C. (2017). #GE2015. The general election on Twitter. In D. Wring, R. Mortimore & S. Atkinson (Hrsg.), Political communication in britain: polling, campaigning and media in the 2015 general election (S. 315–328). Cham: Springer.CrossRef Ginnis, S., & Miller, C. (2017). #GE2015. The general election on Twitter. In D. Wring, R. Mortimore & S. Atkinson (Hrsg.), Political communication in britain: polling, campaigning and media in the 2015 general election (S. 315–328). Cham: Springer.CrossRef
Zurück zum Zitat Graham, M., Hale, S. A., & Gaffney, D. (2014). Where in the world are you? Geolocation and language identification in Twitter. The Professional Geographer, 66, 568–578.CrossRef Graham, M., Hale, S. A., & Gaffney, D. (2014). Where in the world are you? Geolocation and language identification in Twitter. The Professional Geographer, 66, 568–578.CrossRef
Zurück zum Zitat Hasan, S., Zhan, X., & Ukkusuri, S. V. (2013). Understanding urban human activity and mobility patterns using large-scale location-based data from online social media. Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. https://doi.org/10.1145/2505821.2505823b.CrossRef Hasan, S., Zhan, X., & Ukkusuri, S. V. (2013). Understanding urban human activity and mobility patterns using large-scale location-based data from online social media. Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. https://​doi.​org/​10.​1145/​2505821.​2505823b.CrossRef
Zurück zum Zitat Hawelka, B., Sitko, I., Beinat, E., Sobolevsky, S., Kazakopoulos, P., & Ratti, C. (2014). Geo-located Twitter as proxy for global mobility patterns. Cartography and Geographic Information Science, 41, 260–271.CrossRef Hawelka, B., Sitko, I., Beinat, E., Sobolevsky, S., Kazakopoulos, P., & Ratti, C. (2014). Geo-located Twitter as proxy for global mobility patterns. Cartography and Geographic Information Science, 41, 260–271.CrossRef
Zurück zum Zitat Holtz-Bacha, C., & Zeh, R. (2017). Tweeting to the press? Effects of political Twitter activity on offline media in the 2013 German election campaign. In C. Holtz-Bacha, M. R. Just & R. Davis (Hrsg.), Twitter and elections around the world. Campaigning in 140 characters or less. Routledge studies in global information, politics and society: Vol. 11. (S. 27–42). London: Routledge. Holtz-Bacha, C., & Zeh, R. (2017). Tweeting to the press? Effects of political Twitter activity on offline media in the 2013 German election campaign. In C. Holtz-Bacha, M. R. Just & R. Davis (Hrsg.), Twitter and elections around the world. Campaigning in 140 characters or less. Routledge studies in global information, politics and society: Vol. 11. (S. 27–42). London: Routledge.
Zurück zum Zitat Huberty, M. (2015). Can we vote with our tweet? On the perennial difficulty of election forecasting with social media. International Journal of Forecasting, 31, 992–1007.CrossRef Huberty, M. (2015). Can we vote with our tweet? On the perennial difficulty of election forecasting with social media. International Journal of Forecasting, 31, 992–1007.CrossRef
Zurück zum Zitat Immonen, A., Pääkkönen, P., & Ovaska, E. (2015). Evaluating the quality of social media data in big data architecture. IEEE Access, 3, 2028–2043.CrossRef Immonen, A., Pääkkönen, P., & Ovaska, E. (2015). Evaluating the quality of social media data in big data architecture. IEEE Access, 3, 2028–2043.CrossRef
Zurück zum Zitat Ji, X., Chun, S. A., & Geller, J. (2012). Epidemic outbreak and spread detection system based on Twitter data. In J. He, X. Liu, E. A. Krupinski & G. Xu (Hrsg.), Health Information Science: First International Conference, HIS 2012 (S. 152–163). Berlin: Springer.CrossRef Ji, X., Chun, S. A., & Geller, J. (2012). Epidemic outbreak and spread detection system based on Twitter data. In J. He, X. Liu, E. A. Krupinski & G. Xu (Hrsg.), Health Information Science: First International Conference, HIS 2012 (S. 152–163). Berlin: Springer.CrossRef
Zurück zum Zitat Jungherr, A., Jurgens, P., & Schoen, H. (2012). Why the Pirate Party won the German Election of 2009 or the trouble with predictions: a response to Tumasjan, A., Sprenger, T. O., Sander, P. G., & Welpe, I. M. „Predicting elections with Twitter: What 140 characters reveal about political sentiment“. Social Science Computer Review, 30, 229–234.CrossRef Jungherr, A., Jurgens, P., & Schoen, H. (2012). Why the Pirate Party won the German Election of 2009 or the trouble with predictions: a response to Tumasjan, A., Sprenger, T. O., Sander, P. G., & Welpe, I. M. „Predicting elections with Twitter: What 140 characters reveal about political sentiment“. Social Science Computer Review, 30, 229–234.CrossRef
Zurück zum Zitat Kruikemeier, S. (2014). How political candidates use Twitter and the impact on votes. Computers in Human Behavior, 34, 131–139.CrossRef Kruikemeier, S. (2014). How political candidates use Twitter and the impact on votes. Computers in Human Behavior, 34, 131–139.CrossRef
Zurück zum Zitat Larsson, A. O., & Moe, H. (2012). Studying political microblogging: Twitter users in the 2010 Swedish election campaign. New Media & Society, 14, 729–747.CrossRef Larsson, A. O., & Moe, H. (2012). Studying political microblogging: Twitter users in the 2010 Swedish election campaign. New Media & Society, 14, 729–747.CrossRef
Zurück zum Zitat Larsson, A. O., & Moe, H. (2015). Bots or journalists? News sharing on Twitter. Communications, 40, 361–370.CrossRef Larsson, A. O., & Moe, H. (2015). Bots or journalists? News sharing on Twitter. Communications, 40, 361–370.CrossRef
Zurück zum Zitat Lui, M., & Baldwin, T. (2014). Accurate language identification of twitter messages. Proceedings of the 5th Workshop on Language Analysis for Social Media (LASM). (S. 17–25). Göteborg: EACL. Lui, M., & Baldwin, T. (2014). Accurate language identification of twitter messages. Proceedings of the 5th Workshop on Language Analysis for Social Media (LASM). (S. 17–25). Göteborg: EACL.
Zurück zum Zitat Marechal, N. (2016). When bots tweet: toward a normative framework for bots on social networking sites. International Journal of Communication, 10, 5022–5031. Marechal, N. (2016). When bots tweet: toward a normative framework for bots on social networking sites. International Journal of Communication, 10, 5022–5031.
Zurück zum Zitat McGee, J., Caverlee, J., & Cheng, Z. (2013). Location prediction in social media based on tie strength. Proceedings of the 22nd ACM international conference on Information & Knowledge Management. (S. 459–468). New York: ACM Press. McGee, J., Caverlee, J., & Cheng, Z. (2013). Location prediction in social media based on tie strength. Proceedings of the 22nd ACM international conference on Information & Knowledge Management. (S. 459–468). New York: ACM Press.
Zurück zum Zitat Metaxas, P. T., Mustafaraj, E., & Gayo-Avello, D. (2011). How (not) to predict elections. Privacy, Security, Risk and Trust (PASSAT) and 2011 IEEE Third International Conference on Social Computing (SocialCom). (S. 165–171). Boston, Massachusetts: IEEE Press. Metaxas, P. T., Mustafaraj, E., & Gayo-Avello, D. (2011). How (not) to predict elections. Privacy, Security, Risk and Trust (PASSAT) and 2011 IEEE Third International Conference on Social Computing (SocialCom). (S. 165–171). Boston, Massachusetts: IEEE Press.
Zurück zum Zitat Miller, H., Thebault-Spieker, J., Chang, S., Johnson, I., Terveen, L., & Hecht, B. (2016). „Blissfully happy“ or „ready to fight“: varying interpretations of Emoji. Proceedings of ICWSM 2016. (S. 259–268). Köln: AAAI Press. Miller, H., Thebault-Spieker, J., Chang, S., Johnson, I., Terveen, L., & Hecht, B. (2016). „Blissfully happy“ or „ready to fight“: varying interpretations of Emoji. Proceedings of ICWSM 2016. (S. 259–268). Köln: AAAI Press.
Zurück zum Zitat Morstatter, F., Pfeffer, J., Liu, H., & Carley, K. M. (2013). Is the sample good enough? Comparing data from twitter’s streaming API with twitter’s firehose. Proceedings of the Seventh International AAAI Conference on Weblogs and Social Media. (S. 400–408). Palo Alto: AAAI Press. Morstatter, F., Pfeffer, J., Liu, H., & Carley, K. M. (2013). Is the sample good enough? Comparing data from twitter’s streaming API with twitter’s firehose. Proceedings of the Seventh International AAAI Conference on Weblogs and Social Media. (S. 400–408). Palo Alto: AAAI Press.
Zurück zum Zitat Murthy, D., & Longwell, S. A. (2013). Twitter and disasters. Information, Communication & Society, 16, 837–855.CrossRef Murthy, D., & Longwell, S. A. (2013). Twitter and disasters. Information, Communication & Society, 16, 837–855.CrossRef
Zurück zum Zitat Naumann, F., & Rolker, C. (2000). Assessment methods for information quality criteria. Proceedings of 5th International Conference on Information Quality. (S. 148–162). Naumann, F., & Rolker, C. (2000). Assessment methods for information quality criteria. Proceedings of 5th International Conference on Information Quality. (S. 148–162).
Zurück zum Zitat Oelsner, K., & Heimrich, L. (2015). Social media use of German politicians. Towards dialogic voter relations? German Politics, 24, 451–468.CrossRef Oelsner, K., & Heimrich, L. (2015). Social media use of German politicians. Towards dialogic voter relations? German Politics, 24, 451–468.CrossRef
Zurück zum Zitat Park, J., Barash, V., Fink, C., & Cha, M. (2013). Emoticon style: interpreting differences in emoticons across cultures. Proceedings of the Seventh International AAAI Conference on Weblogs and Social Media. (S. 466–475). Palo Alto: AAAI Press. Park, J., Barash, V., Fink, C., & Cha, M. (2013). Emoticon style: interpreting differences in emoticons across cultures. Proceedings of the Seventh International AAAI Conference on Weblogs and Social Media. (S. 466–475). Palo Alto: AAAI Press.
Zurück zum Zitat Stieglitz, S., & Dang-Xuan, L. (2012). Political communication and influence through microblogging. An empirical analysis of sentiment in Twitter messages and retweet behaviour. In. Proceedings of 45th Hawaii International Conference on System Sciences. (S. 3500–3509). Hawaii: IEEE. Stieglitz, S., & Dang-Xuan, L. (2012). Political communication and influence through microblogging. An empirical analysis of sentiment in Twitter messages and retweet behaviour. In. Proceedings of 45th Hawaii International Conference on System Sciences. (S. 3500–3509). Hawaii: IEEE.
Zurück zum Zitat Tumasjan, A., Sprenger, T. O., Sandner, P. G., & Welpe, I. M. (2010). Election forecasts with twitter. Social Science Computer Review, 29, 402–418.CrossRef Tumasjan, A., Sprenger, T. O., Sandner, P. G., & Welpe, I. M. (2010). Election forecasts with twitter. Social Science Computer Review, 29, 402–418.CrossRef
Zurück zum Zitat Vaccari, C., Valeriani, A., Barberá, P., Bonneau, R., Jost, J. T., Nagler, J., & Tucker, J. (2013). Social media and political communication: a survey of twitter users during the 2013 Italian general election. Rivista italiana di scienza politica, 43, 381–410. Vaccari, C., Valeriani, A., Barberá, P., Bonneau, R., Jost, J. T., Nagler, J., & Tucker, J. (2013). Social media and political communication: a survey of twitter users during the 2013 Italian general election. Rivista italiana di scienza politica, 43, 381–410.
Zurück zum Zitat Vieweg, S., Hughes, A. L., Starbird, K., & Palen, L. (2010). Microblogging during two natural hazards events. In CHI2010 (S. 1079–1088). Vieweg, S., Hughes, A. L., Starbird, K., & Palen, L. (2010). Microblogging during two natural hazards events. In CHI2010 (S. 1079–1088).
Zurück zum Zitat Wang, R. Y., & Strong, D. M. (1996). Beyond accuracy. What data quality means to data consumers. Journal of management information systems, 12(4), 5–33.CrossRef Wang, R. Y., & Strong, D. M. (1996). Beyond accuracy. What data quality means to data consumers. Journal of management information systems, 12(4), 5–33.CrossRef
Metadaten
Titel
What you tweet is what we get?
Zum wissenschaftlichen Nutzen von Twitter-Daten
verfasst von
Fabian Pfaffenberger, M.Sc.
Publikationsdatum
08.01.2018
Verlag
Springer Fachmedien Wiesbaden
Erschienen in
Publizistik / Ausgabe 1/2018
Print ISSN: 0033-4006
Elektronische ISSN: 1862-2569
DOI
https://doi.org/10.1007/s11616-017-0400-2

Weitere Artikel der Ausgabe 1/2018

Publizistik 1/2018 Zur Ausgabe