Zum Inhalt
Erschienen in:

01.12.2020 | Original Article

Feature selection methods for event detection in Twitter: a text mining approach

verfasst von: Ahmad Hany Hossny, Lewis Mitchell, Nick Lothian, Grant Osborne

Erschienen in: Social Network Analysis and Mining | Ausgabe 1/2020

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Die Auswahl von Schlüsselwörtern aus Twitter als Merkmale zur Identifizierung von Ereignissen ist aufgrund der Sprachinformalität wie Akronyme, falsch geschriebene Wörter, Synonyme, Transliteration und mehrdeutige Begriffe eine Herausforderung. In diesem Aufsatz vergleichen und identifizieren wir die besten Methoden für die Schlüsselwortauswahl als Merkmale, die für Klassifizierungszwecke verwendet werden sollen. Insbesondere untersuchen wir die Aspekte, die Schlüsselwörter als Merkmale zur Identifizierung ziviler Unruhen und Proteste betreffen. Zu diesen Aspekten gehören die Wortanzahl, die Wortformen wie n-gram, überspringen-gram und Taschen-of-words sowie die Methoden der Datenassoziation, einschließlich Korrelationstechniken und Ähnlichkeitstechniken. Um die Auswirkungen der genannten Faktoren zu testen, entwickelten wir ein Rahmenwerk, das 641 Tage Tweets analysierte und die Wörter extrahierte, die stark mit Ereignistagen im gleichen Zeitrahmen in Verbindung gebracht wurden. Anschließend verwendeten wir die extrahierten Wörter als Merkmale, um jeden einzelnen Tag als Ereignistag oder Nichtereignungstag an einem bestimmten Ort zu klassifizieren. In diesem Rahmen verwendeten wir dieselbe Pipeline von Datenreinigung, Vorbesitztum, Merkmalsauswahl, Modellbildung und Ereignisklassifizierung unter Verwendung aller ausgewählten Schlüsselwortklassifikationen ist die beste Methode, die Naive-Klassifikation, die mit der zweieinstufigurigen Klassifikation von 74 Tagen am besten ist.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Literatur
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Metadaten
Titel
Feature selection methods for event detection in Twitter: a text mining approach
verfasst von
Ahmad Hany Hossny
Lewis Mitchell
Nick Lothian
Grant Osborne
Publikationsdatum
01.12.2020
Verlag
Springer Vienna
Erschienen in
Social Network Analysis and Mining / Ausgabe 1/2020
Print ISSN: 1869-5450
Elektronische ISSN: 1869-5469
DOI
https://doi.org/10.1007/s13278-020-00658-3