Skip to main content
Erschienen in: Datenbank-Spektrum 3/2013

01.11.2013 | Schwerpunktbeitrag

An Interactive System for Visual Analytics of Dynamic Topic Models

verfasst von: Nikou Günnemann, Michael Derntl, Ralf Klamma, Matthias Jarke

Erschienen in: Datenbank-Spektrum | Ausgabe 3/2013

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

The vast amount and rapid growth of data on the Web and in document repositories make knowledge extraction and trend analysis a challenging task. A well-proven approach for the unsupervised analysis of large text corpora is dynamic topic modeling. While there is a solid body of research on fundamentals and applications of this technique, visual-interactive analysis systems for allowing end-users to perform analysis tasks using topic models are still rare. In this paper, we present D-VITA, an interactive text analysis system that exploits dynamic topic modeling to detect the latent topic structure and dynamics in a collection of documents. D-VITA supports end-users in understanding and exploiting the topic modeling results by providing interactive visualizations of the topic evolution in document collections and by browsing documents based on keyword search and similarity of their topic distributions. The system was evaluated by a scientific community that used D-VITA for trend analysis in their data sources. The results indicate high usability of D-VITA and its usefulness for productive analysis tasks.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Weitere Produktempfehlungen anzeigen
Literatur
1.
Zurück zum Zitat Ahmed A, Xing EP (2010) Timeline: a dynamic hierarchical Dirichlet process model for recovering birth/death and evolution of topics in text stream. In: Conference on uncertainty in artificial intelligence (UAI), pp 20–29 Ahmed A, Xing EP (2010) Timeline: a dynamic hierarchical Dirichlet process model for recovering birth/death and evolution of topics in text stream. In: Conference on uncertainty in artificial intelligence (UAI), pp 20–29
3.
Zurück zum Zitat Blei DM, Lafferty JD (2006) Dynamic topic models. In: International conference on machine learning (ICML), pp 113–120 Blei DM, Lafferty JD (2006) Dynamic topic models. In: International conference on machine learning (ICML), pp 113–120
4.
Zurück zum Zitat Blei DM, Ng AY, Jordan MI (2003) Latent Dirichlet allocation. J Mach Learn Res 3:993–1022 MATH Blei DM, Ng AY, Jordan MI (2003) Latent Dirichlet allocation. J Mach Learn Res 3:993–1022 MATH
5.
Zurück zum Zitat Chaney AJ-B, Blei DM (2012) Visualizing topic models. In: International conference on weblogs and social, Media (ICWSM) Chaney AJ-B, Blei DM (2012) Visualizing topic models. In: International conference on weblogs and social, Media (ICWSM)
6.
Zurück zum Zitat Cohen E (2009) Decay models. In: Encyclopedia of database systems, pp 757–761 Cohen E (2009) Decay models. In: Encyclopedia of database systems, pp 757–761
7.
Zurück zum Zitat Cormode G, Korn F, Tirthapura S (2008) Exponentially decayed aggregates on data streams. In: International conference on data engineering (ICDE), pp 1379–1381 Cormode G, Korn F, Tirthapura S (2008) Exponentially decayed aggregates on data streams. In: International conference on data engineering (ICDE), pp 1379–1381
8.
Zurück zum Zitat Derntl M, Cooper A, Pham MC, Klamma R, Renzel D (2011) In: Mediabase ready and first analysis report, TEL-map deliverable D4.3 Derntl M, Cooper A, Pham MC, Klamma R, Renzel D (2011) In: Mediabase ready and first analysis report, TEL-map deliverable D4.3
9.
Zurück zum Zitat Derntl M, Klamma R (2012) A mediabase for technology enhanced learning in Europe. IEEE Learn. Technol. Newslett. 14(3):2–5 Derntl M, Klamma R (2012) A mediabase for technology enhanced learning in Europe. IEEE Learn. Technol. Newslett. 14(3):2–5
10.
Zurück zum Zitat Fuglede B, Topsoe F (2004) Jensen-Shannon divergence and Hilbert space embedding. In: International symposium on information theory. IEEE Press, New York, p 31 Fuglede B, Topsoe F (2004) Jensen-Shannon divergence and Hilbert space embedding. In: International symposium on information theory. IEEE Press, New York, p 31
11.
Zurück zum Zitat Günnemann N (2013) D-VITA: a visual interactive text analysis system using dynamic topic mining. In: BTW workshops, pp 237–246 Günnemann N (2013) D-VITA: a visual interactive text analysis system using dynamic topic mining. In: BTW workshops, pp 237–246
12.
Zurück zum Zitat Havre S, Hetzler EG, Nowell LT (2000) ThemeRiver: visualizing theme changes over time. In: IEEE symposium on information visualization (INFOVIS), pp 115–123 Havre S, Hetzler EG, Nowell LT (2000) ThemeRiver: visualizing theme changes over time. In: IEEE symposium on information visualization (INFOVIS), pp 115–123
13.
Zurück zum Zitat He Q, Chen B, Pei J, Qiu B, Mitra P, Giles CL (2009) Detecting topic evolution in scientific literature: how can citations help? In: ACM international conference on information and knowledge management (CIKM), pp 957–966 He Q, Chen B, Pei J, Qiu B, Mitra P, Giles CL (2009) Detecting topic evolution in scientific literature: how can citations help? In: ACM international conference on information and knowledge management (CIKM), pp 957–966
14.
Zurück zum Zitat Hong L, Yin D, Guo J, Davison BD (2011) Tracking trends: incorporating term volume into temporal topic models. In: ACM SIGKDD international conference on knowledge, pp 484–492 Hong L, Yin D, Guo J, Davison BD (2011) Tracking trends: incorporating term volume into temporal topic models. In: ACM SIGKDD international conference on knowledge, pp 484–492
15.
Zurück zum Zitat Jo Y, Hopcroft JE, Lagoze C (2011) The web of topics: discovering the topology of topic evolution in a corpus. In: World wide web conference (WWW), pp 257–266 Jo Y, Hopcroft JE, Lagoze C (2011) The web of topics: discovering the topology of topic evolution in a corpus. In: World wide web conference (WWW), pp 257–266
16.
Zurück zum Zitat Keim D, Mansmann F, Schneidewind J, Thomas J, Ziegler H (2008) Visual analytics: scope and challenges. In: Visual data mining, pp 76–90 CrossRef Keim D, Mansmann F, Schneidewind J, Thomas J, Ziegler H (2008) Visual analytics: scope and challenges. In: Visual data mining, pp 76–90 CrossRef
17.
Zurück zum Zitat Leskovec J, Backstrom L, Kleinberg JM (2009) Meme-tracking and the dynamics of the news cycle. In: ACM SIGKDD international conference on knowledge, pp 497–506 Leskovec J, Backstrom L, Kleinberg JM (2009) Meme-tracking and the dynamics of the news cycle. In: ACM SIGKDD international conference on knowledge, pp 497–506
18.
Zurück zum Zitat Liu S, Zhou MX, Pan S, Song Y, Qian W, Cai W, Lian X (2012) TIARA: interactive, topic-based visual text summarization and analysis. ACM Trans Intell Syst Technol 3(2):25 Liu S, Zhou MX, Pan S, Song Y, Qian W, Cai W, Lian X (2012) TIARA: interactive, topic-based visual text summarization and analysis. ACM Trans Intell Syst Technol 3(2):25
19.
Zurück zum Zitat Mei Q, Zhai C (2005) Discovering evolutionary theme patterns from text: an exploration of temporal text mining. In: ACM SIGKDD international conference on knowledge, pp 198–207 Mei Q, Zhai C (2005) Discovering evolutionary theme patterns from text: an exploration of temporal text mining. In: ACM SIGKDD international conference on knowledge, pp 198–207
20.
Zurück zum Zitat Mendonça S, Cardoso G, Caraça J (2012) The strategic strength of weak signal analysis. Futures 44(3):218–228 CrossRef Mendonça S, Cardoso G, Caraça J (2012) The strategic strength of weak signal analysis. Futures 44(3):218–228 CrossRef
22.
Zurück zum Zitat Wang C, Blei DM, Heckerman D (2008) Continuous time dynamic topic models. In: Conference on uncertainty in artificial intelligence (UAI), pp 579–586 Wang C, Blei DM, Heckerman D (2008) Continuous time dynamic topic models. In: Conference on uncertainty in artificial intelligence (UAI), pp 579–586
23.
Zurück zum Zitat Wang X, McCallum A (2006) Topics over time: a non-Markov continuous-time model of topical trends. In: ACM SIGKDD international conference on knowledge, pp 424–433 Wang X, McCallum A (2006) Topics over time: a non-Markov continuous-time model of topical trends. In: ACM SIGKDD international conference on knowledge, pp 424–433
Metadaten
Titel
An Interactive System for Visual Analytics of Dynamic Topic Models
verfasst von
Nikou Günnemann
Michael Derntl
Ralf Klamma
Matthias Jarke
Publikationsdatum
01.11.2013
Verlag
Springer Berlin Heidelberg
Erschienen in
Datenbank-Spektrum / Ausgabe 3/2013
Print ISSN: 1618-2162
Elektronische ISSN: 1610-1995
DOI
https://doi.org/10.1007/s13222-013-0134-x

Weitere Artikel der Ausgabe 3/2013

Datenbank-Spektrum 3/2013 Zur Ausgabe

Editorial

Editorial

Dissertationen

Dissertationen

Premium Partner