Skip to main content

2021 | OriginalPaper | Buchkapitel

Benchmarking Minimax Linkage in Hierarchical Clustering

verfasst von : Xiao Hui Tai, Kayla Frisoli

Erschienen in: Data Analysis and Rationality in a Complex World

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Minimax linkage was first introduced by Ao et al. (2004) in 2004, as an alternative to standard linkage methods used in hierarchical clustering. Minimax linkage relies on distances to a prototype for each cluster; this prototype can be thought of as a representative object in the cluster, hence improving the interpretability of clustering results. Bien and Tibshirani analyzed properties of this method in 2011 (Bien and Tibshirani 2011), popularizing the method within the statistics community. Additionally, they performed some comparisons of minimax linkage to standard linkage methods. In an effort to expand upon their work and evaluate minimax linkage more comprehensively, we follow the guidelines for neutral benchmark studies outlined in Van Mechelen et al. (2018), focusing on thorough method evaluation via multiple performance metrics on several well-described data sets. We also make all code and data publicly available through an R package, for full reproducibility. Similarly to Bien and Tibshirani (2011), we find that minimax linkage often produces the smallest distances to prototypes, meaning that objects in a cluster are tightly clustered around their prototype. This is true across a range of values for the total number of clusters (k). However, this is not universally true, and special attention should be paid to the case when k is the true known value. For true k, minimax linkage does not always perform the best in terms of all the evaluation metrics studied, including distance to prototype.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
Zurück zum Zitat Anderson, E.: The species problem in iris. Ann. Mo. Bot. Gard. 23(3), 457–509 (1936)CrossRef Anderson, E.: The species problem in iris. Ann. Mo. Bot. Gard. 23(3), 457–509 (1936)CrossRef
Zurück zum Zitat Ao, S.I., Yip, K., Ng, M., Cheung, D., Fong, P.-Y., Melhado, I., Sham, P.C.: CLUSTAG: hierarchical clustering and graph methods for selecting tag SNPs. Bioinformatics 21(8), 1735–1736 (2004) Ao, S.I., Yip, K., Ng, M., Cheung, D., Fong, P.-Y., Melhado, I., Sham, P.C.: CLUSTAG: hierarchical clustering and graph methods for selecting tag SNPs. Bioinformatics 21(8), 1735–1736 (2004)
Zurück zum Zitat Bien, J., Tibshirani, R.: Hierarchical clustering with prototypes via minimax linkage. J. Am. Stat. Assoc. 106(495), 1075–1084 (2011) Bien, J., Tibshirani, R.: Hierarchical clustering with prototypes via minimax linkage. J. Am. Stat. Assoc. 106(495), 1075–1084 (2011)
Zurück zum Zitat Fisher, R.A.: The use of multiple measurements in taxonomic problems. Ann. Eugen. 7(2), 179–188 Fisher, R.A.: The use of multiple measurements in taxonomic problems. Ann. Eugen. 7(2), 179–188
Zurück zum Zitat Van Mechelen, I., Boulesteix, A.L., Dangl, R., Dean, N., Guyon, I., Hennig, C., Leisch, F., Steinley, D.: Benchmarking in cluster analysis: a white paper (2018). arXiv:1809.10496 Van Mechelen, I., Boulesteix, A.L., Dangl, R., Dean, N., Guyon, I., Hennig, C., Leisch, F., Steinley, D.: Benchmarking in cluster analysis: a white paper (2018). arXiv:​1809.​10496
Zurück zum Zitat Vorburger, T., Yen, J., Bachrach, B., Renegar, T., Filliben, J., Ma, L., Rhee, H., Zheng, A., Song, J., Riley, M., Foreman, C., Ballou, S.: Surface topography analysis for a feasibility assessment of a National Ballistics Imaging Database. Tech. Rep. NISTIR 7362, National Institute of Standards and Technology, Gaithersburg, MD (2007) Vorburger, T., Yen, J., Bachrach, B., Renegar, T., Filliben, J., Ma, L., Rhee, H., Zheng, A., Song, J., Riley, M., Foreman, C., Ballou, S.: Surface topography analysis for a feasibility assessment of a National Ballistics Imaging Database. Tech. Rep. NISTIR 7362, National Institute of Standards and Technology, Gaithersburg, MD (2007)
Metadaten
Titel
Benchmarking Minimax Linkage in Hierarchical Clustering
verfasst von
Xiao Hui Tai
Kayla Frisoli
Copyright-Jahr
2021
DOI
https://doi.org/10.1007/978-3-030-60104-1_32

Premium Partner