Skip to main content
Erschienen in: WIRTSCHAFTSINFORMATIK 5/2014

01.10.2014 | Aufsatz

Informationsunschärfe in Big Data

Erkenntnisse aus sozialen Medien in Stadtgebieten

verfasst von: Johannes Bendler, Sebastian Wagner, Dipl.-Vw. Tobias Brandt, Prof. Dr. Dirk Neumann

Erschienen in: WIRTSCHAFTSINFORMATIK | Ausgabe 5/2014

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Während die klassische Definition von Big Data ursprünglich nur die drei Größen Datenmenge (Volume), Datenrate (Velocity) und Datenvielfalt (Variety) umfasste, ist in jüngster Zeit der Wahrheitsgehalt (Veracity) als weitere Dimension mehr und mehr in den wissenschaftlichen und praktischen Fokus gerückt. Der noch immer wachsende Bereich der Sozialen Medien und damit verbundene benutzergenerierte Datenmengen verlangen nach neuen Methoden, die die enthaltene Datenunschärfe abschätzen und kontrollieren können. Dieser Beitrag widmet sich einem Aspekt der Datenunschärfe und stellt einen neuartigen Ansatz vor, der die Verlässlichkeit von benutzergenerierten Daten auf Basis von wiederkehrenden Mustern abschätzt. Zu diesem Zweck wird eine große Menge von Twitter-Statusnachrichten mit geographischer Standortinformation aus San Francisco untersucht und mit Points of Interest (POIs), wie beispielsweise Bars, Restaurants oder Parks, in Verbindung gebracht. Das vorgeschlagene Modell wird durch kausale Beziehungen zwischen Points of Interest und den in der Umgebung vorliegenden Twitter-Meldungen validiert. Weiterhin wird die zeitliche Dimension dieser Beziehung in Betracht gezogen, um so in Abhängigkeit der Art des POI wiederkehrende Muster zu identifizieren. Die durchgeführten Analysen münden in einem Indikator, der die Verlässlichkeit von vorliegenden Daten in räumlicher und zeitlicher Dimension abschätzt.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Weitere Produktempfehlungen anzeigen
Fußnoten
1
Eine Woche mit 7 Tagen à 24 Stunden ergibt 168 Zeitscheiben des Beobachtungszeitraums.
 
Literatur
Zurück zum Zitat Du Y, Fan J, Chen J (2011) Experimental analysis of user mobility pattern in mobile social networks. In: IEEE wireless communications and networking conference (WCNC), S 1086–1090 Du Y, Fan J, Chen J (2011) Experimental analysis of user mobility pattern in mobile social networks. In: IEEE wireless communications and networking conference (WCNC), S 1086–1090
Zurück zum Zitat Ferrari L, Rosi A, Mamei M, Zambonelli F (2011) Extracting urban patterns from location-based social networks. In: Proc of the 3rd ACM SIGSPATIAL international workshop on location-based social networks (LBSN ’11). ACM, New York, S 9–16 Ferrari L, Rosi A, Mamei M, Zambonelli F (2011) Extracting urban patterns from location-based social networks. In: Proc of the 3rd ACM SIGSPATIAL international workshop on location-based social networks (LBSN ’11). ACM, New York, S 9–16
Zurück zum Zitat Heinrich B, Kaiser M, Klier M (2007) How to measure data quality? A metric-based approach. In: Rivard S, Webster J (Hrsg) Proc of the 28th international conference on information systems (ICIS). Queen’s University, Montreal Heinrich B, Kaiser M, Klier M (2007) How to measure data quality? A metric-based approach. In: Rivard S, Webster J (Hrsg) Proc of the 28th international conference on information systems (ICIS). Queen’s University, Montreal
Zurück zum Zitat Hilbert M, López P (2011) The world’s technological capacity to store, communicate, and compute information. Science 332(6025):60–65 CrossRef Hilbert M, López P (2011) The world’s technological capacity to store, communicate, and compute information. Science 332(6025):60–65 CrossRef
Zurück zum Zitat Kraut RE, Rice RE, Ronald E, Cool C, Fish RS (1998) Varieties of social influence: the role of utility and norms in the sSuccess of a new communication medium. Organization Science 9(4):437–453 CrossRef Kraut RE, Rice RE, Ronald E, Cool C, Fish RS (1998) Varieties of social influence: the role of utility and norms in the sSuccess of a new communication medium. Organization Science 9(4):437–453 CrossRef
Zurück zum Zitat Lee R, Wakamiya S, Sumiya K (2011) Discovery of unusual regional social activities using geo-tagged microblogs. World Wide Web 14(4):321–349 CrossRef Lee R, Wakamiya S, Sumiya K (2011) Discovery of unusual regional social activities using geo-tagged microblogs. World Wide Web 14(4):321–349 CrossRef
Zurück zum Zitat Liu B, Fu Y, Yao Z, Xiong H (2013) Learning geographical preferences for point-of-interest recommendation. In: Proc of the 19th ACM SIGKDD international conference on knowledge discovery and data mining (KDD ’13). ACM, S 1043–1051, New York CrossRef Liu B, Fu Y, Yao Z, Xiong H (2013) Learning geographical preferences for point-of-interest recommendation. In: Proc of the 19th ACM SIGKDD international conference on knowledge discovery and data mining (KDD ’13). ACM, S 1043–1051, New York CrossRef
Zurück zum Zitat Otto B, Wende K, Schmidt A, Osl P (2007) Towards a framework for corporate data quality management. In: ACIS 2007 proc Otto B, Wende K, Schmidt A, Osl P (2007) Towards a framework for corporate data quality management. In: ACIS 2007 proc
Zurück zum Zitat Sargent RP, Shepard RM, Glantz SA (2004) Reduced incidence of admissions for myocardial infarction associated with public smoking ban: before and after study. British Medical Journal 328:977–980 CrossRef Sargent RP, Shepard RM, Glantz SA (2004) Reduced incidence of admissions for myocardial infarction associated with public smoking ban: before and after study. British Medical Journal 328:977–980 CrossRef
Zurück zum Zitat Tobler WR (1970) A computer movie simulating urban growth in the Detroit region. Economic Geography 46:234–240 CrossRef Tobler WR (1970) A computer movie simulating urban growth in the Detroit region. Economic Geography 46:234–240 CrossRef
Zurück zum Zitat Wakamiya S, Lee R, Sumiya K (2011) Crowd-based urban characterization: extracting crowd behavioral patterns in urban areas from Twitter. In: Proc of the 3rd ACM SIGSPATIAL international workshop on location-based social networks (LBSN ’11). ACM, New York, S 77–84 Wakamiya S, Lee R, Sumiya K (2011) Crowd-based urban characterization: extracting crowd behavioral patterns in urban areas from Twitter. In: Proc of the 3rd ACM SIGSPATIAL international workshop on location-based social networks (LBSN ’11). ACM, New York, S 77–84
Zurück zum Zitat Wasserkrug S, Gal A, Etzion O (2005) A model for reasoning with uncertain rules in event composition systems. In: Proc of the 21st conference in uncertainty in artificial intelligence, Edinburgh, Scotland, UAI ’05, July 26–29, 2005. AUAI Press, Corvallis, S 599–608 Wasserkrug S, Gal A, Etzion O (2005) A model for reasoning with uncertain rules in event composition systems. In: Proc of the 21st conference in uncertainty in artificial intelligence, Edinburgh, Scotland, UAI ’05, July 26–29, 2005. AUAI Press, Corvallis, S 599–608
Zurück zum Zitat Wasserkrug S, Gal A, Etzion O, Turchin Y (2008) Complex event processing over uncertain data. In: Proc of the second international conference on distributed event-based systems (DEBS ’08). ACM, New York, S 253–264 CrossRef Wasserkrug S, Gal A, Etzion O, Turchin Y (2008) Complex event processing over uncertain data. In: Proc of the second international conference on distributed event-based systems (DEBS ’08). ACM, New York, S 253–264 CrossRef
Zurück zum Zitat Zhang X, Zhu F (2011) Group size and incentives to contribute: a natural experiment at Chinese wikipedia. The American Economic Review 101(4):1601–1615 CrossRef Zhang X, Zhu F (2011) Group size and incentives to contribute: a natural experiment at Chinese wikipedia. The American Economic Review 101(4):1601–1615 CrossRef
Metadaten
Titel
Informationsunschärfe in Big Data
Erkenntnisse aus sozialen Medien in Stadtgebieten
verfasst von
Johannes Bendler
Sebastian Wagner
Dipl.-Vw. Tobias Brandt
Prof. Dr. Dirk Neumann
Publikationsdatum
01.10.2014
Verlag
Springer Fachmedien Wiesbaden
Erschienen in
WIRTSCHAFTSINFORMATIK / Ausgabe 5/2014
Print ISSN: 0937-6429
Elektronische ISSN: 1861-8936
DOI
https://doi.org/10.1007/s11576-014-0431-5

Weitere Artikel der Ausgabe 5/2014

WIRTSCHAFTSINFORMATIK 5/2014 Zur Ausgabe

Editorial

Big Data

Research Notes

Big Data