Skip to main content
Erschienen in:
Buchtitelbild

2012 | OriginalPaper | Buchkapitel

Fuzzification of Agglomerative Hierarchical Crisp Clustering Algorithms

verfasst von : Mathias Bank, Friedhelm Schwenker

Erschienen in: Challenges at the Interface of Data Analysis, Computer Science, and Optimization

Verlag: Springer Berlin Heidelberg

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

User generated content from fora, weblogs and other social networks is a very fast growing data source in which different information extraction algorithms can provide a convenient data access. Hierarchical clustering algorithms are used to provide topics covered in this data on different levels of abstraction. During the last years, there has been some research using hierarchical fuzzy algorithms to handle comments not dealing with one topic but many different topics at once. The used variants of the well-known fuzzy c-means algorithm are nondeterministic and thus the cluster results are irreproducible. In this work, we present a deterministic algorithm that fuzzifies currently available agglomerative hierarchical crisp clustering algorithms and therefore allows arbitrary multi-assignments. It is shown how to reuse well-studied linkage metrics while the monotonic behavior is analyzed for each of them. The proposed algorithm is evaluated using collections of the RCV1 and RCV2 corpus.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
Zurück zum Zitat Bäck C, Hussain M (1996) Validity measures for fuzzy partitions. In: Bock HH, Polasek W (eds) Data analysis and information systems. Springer, Berlin, pp 114–125CrossRef Bäck C, Hussain M (1996) Validity measures for fuzzy partitions. In: Bock HH, Polasek W (eds) Data analysis and information systems. Springer, Berlin, pp 114–125CrossRef
Zurück zum Zitat Bordogna G, Pasi G (2009) Hierarchical-hyperspherical divisive fuzzy c-means (h2d-fcm) clustering for information retrieval. In: WI-IAT ’09: Proceedings of the 2009 IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology, IEEE Computer Society, pp 614–621 Bordogna G, Pasi G (2009) Hierarchical-hyperspherical divisive fuzzy c-means (h2d-fcm) clustering for information retrieval. In: WI-IAT ’09: Proceedings of the 2009 IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology, IEEE Computer Society, pp 614–621
Zurück zum Zitat Johnson SC (1967) Hierarchical clustering schemes. Psychometrika 32:241–254CrossRef Johnson SC (1967) Hierarchical clustering schemes. Psychometrika 32:241–254CrossRef
Zurück zum Zitat Lance GN, Williams WT (1966) A generalized sorting strategy for computer classifications. Nature 212:218–219, DOI10.1038/212218a0 Lance GN, Williams WT (1966) A generalized sorting strategy for computer classifications. Nature 212:218–219, DOI10.1038/212218a0
Zurück zum Zitat Lance GN, Williams WT (1967) A general theory of classificatory sorting strategies 1. hierarchical systems. Comput J 9(4):373–380 Lance GN, Williams WT (1967) A general theory of classificatory sorting strategies 1. hierarchical systems. Comput J 9(4):373–380
Zurück zum Zitat Mendes MES, Sacks L (2003) Evaluating fuzzy clustering for relevance-based information access. In: IEEE International Conference on Fuzzy Systems, pp 648–653 Mendes MES, Sacks L (2003) Evaluating fuzzy clustering for relevance-based information access. In: IEEE International Conference on Fuzzy Systems, pp 648–653
Zurück zum Zitat Nuovo AGD, Catania V (2007) On external measures for validation of fuzzy partitions. In: Foundations of Fuzzy Logic and Soft Computing. Springer, Berlin, pp 491–501 Nuovo AGD, Catania V (2007) On external measures for validation of fuzzy partitions. In: Foundations of Fuzzy Logic and Soft Computing. Springer, Berlin, pp 491–501
Zurück zum Zitat Torra V (2005) Fuzzy c-means for fuzzy hierachical clustering. In: FUZZ ’05: The 14th IEEE International Conference on Fuzzy Systems, pp 646–651 Torra V (2005) Fuzzy c-means for fuzzy hierachical clustering. In: FUZZ ’05: The 14th IEEE International Conference on Fuzzy Systems, pp 646–651
Metadaten
Titel
Fuzzification of Agglomerative Hierarchical Crisp Clustering Algorithms
verfasst von
Mathias Bank
Friedhelm Schwenker
Copyright-Jahr
2012
Verlag
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-642-24466-7_1