Skip to main content

2019 | OriginalPaper | Buchkapitel

Modification of the k-MXT Algorithm and Its Application to the Geotagged Data Clustering

verfasst von : Anastasia Stepanova, Sergei V. Mironov, Sergei Sidorov, Alexey Faizliev

Erschienen in: Machine Learning, Optimization, and Data Science

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

The paper considers the problem of detection of the most attractive city sights using datasets with geotagged photographs. We form a graph on the basis of the geotagged spot coordinates and rewrite the problem as the problem of graph clustering. In this paper, we propose a modification of the k-MXT algorithm, which we called the k-MXT-W algorithm and which uses window functions. We compare the proposed algorithm with k-Means and k-MXT algorithms on simulated data using ARI, one of the most common metrics for assessing clustering quality. In this paper we also use the k-MXT-W algorithm to find the most popular places in St. Petersburg (Russia) and we compare the performance of the proposed algorithm with the k-MXT algorithm on real-world data using the modularity metric that does not require knowledge of true clustering.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Béjar, J.: K-means vs mini batch k-means: a comparison. Technical report, Universitat Politècnica de Catalunya (2013) Béjar, J.: K-means vs mini batch k-means: a comparison. Technical report, Universitat Politècnica de Catalunya (2013)
2.
Zurück zum Zitat Bottou, L., Bengio, Y.: Convergence properties of the k-means algorithms. In: Advances in Neural Information Processing System (NIPS 1994), pp. 585–592 (1994) Bottou, L., Bengio, Y.: Convergence properties of the k-means algorithms. In: Advances in Neural Information Processing System (NIPS 1994), pp. 585–592 (1994)
7.
Zurück zum Zitat Ester, M., Kriegel, H.P., Sander, J., Xu, X.: A density-based algorithm for discovering clusters a density-based algorithm for discovering clusters in large spatial databases with noise. In: Proceedings of the Second International Conference on Knowledge Discovery and Data Mining, KDD 1996, pp. 226–231. AAAI Press (1996) Ester, M., Kriegel, H.P., Sander, J., Xu, X.: A density-based algorithm for discovering clusters a density-based algorithm for discovering clusters in large spatial databases with noise. In: Proceedings of the Second International Conference on Knowledge Discovery and Data Mining, KDD 1996, pp. 226–231. AAAI Press (1996)
10.
Zurück zum Zitat Macqueen, J.: Some methods for classification and analysis of multivariate observations. In: 5th Berkeley Symposium on Mathematical Statistics and Probability, pp. 281–297 (1967) Macqueen, J.: Some methods for classification and analysis of multivariate observations. In: 5th Berkeley Symposium on Mathematical Statistics and Probability, pp. 281–297 (1967)
21.
Zurück zum Zitat Steinhaus, H.: Sur la division des corps materiels en parties. Bull. Acad. Polon. Sci. 4(12), 801–804 (1956)MathSciNetMATH Steinhaus, H.: Sur la division des corps materiels en parties. Bull. Acad. Polon. Sci. 4(12), 801–804 (1956)MathSciNetMATH
23.
Zurück zum Zitat Vinh, N.X., Epps, J., Bailey, J.: Information theoretic measures for clusterings comparison: variants, properties, normalization and correction for chance. J. Mach. Learn. Res. 11, 2837–2854 (2010)MathSciNetMATH Vinh, N.X., Epps, J., Bailey, J.: Information theoretic measures for clusterings comparison: variants, properties, normalization and correction for chance. J. Mach. Learn. Res. 11, 2837–2854 (2010)MathSciNetMATH
Metadaten
Titel
Modification of the k-MXT Algorithm and Its Application to the Geotagged Data Clustering
verfasst von
Anastasia Stepanova
Sergei V. Mironov
Sergei Sidorov
Alexey Faizliev
Copyright-Jahr
2019
DOI
https://doi.org/10.1007/978-3-030-37599-7_25