Skip to main content

2017 | OriginalPaper | Buchkapitel

A Novel on Automatic K Value for Efficiency Improvement of K-means Clustering

verfasst von : Se-Hoon Jung, Kyoung-Jong Kim, Eun-Cheon Lim, Chun-Bo Sim

Erschienen in: Advanced Multimedia and Ubiquitous Engineering

Verlag: Springer Singapore

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

The development of H/W and S/W has shortened the repetition cycle of new data generation and produced various categories of data. Machine learning, in particular, attracts explosive interest as it categorizes and analyzes data through artificial intelligence and contests against man. Once generated, data have their importance highlighted in terms of utilization. It is critical to analyze the data from the past and cluster new data for the utilization of data. The present study thus investigated an algorithm of determining the initial number of clusters automatically, which is part of problems with the K-means algorithm used in data clustering. The study also proposed an approach of optimizing the number of clusters through principal component analysis, a pre-processing process, with the input data for clustering. Its performance evaluation results show the accuracy rate of 87.6% or so.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Madhulatha, T.S.: An overview on clustering methods. J. Intell. Data Anal. 11(6), 719–725 (2007) Madhulatha, T.S.: An overview on clustering methods. J. Intell. Data Anal. 11(6), 719–725 (2007)
2.
Zurück zum Zitat Kodinaiya, T.M., Makwana, P.R.: Review on determining number of cluster in K-means clustering. Int. J. Adv. Res. Comput. Sci. Manag. Stud. 1(6), 90–95 (2013) Kodinaiya, T.M., Makwana, P.R.: Review on determining number of cluster in K-means clustering. Int. J. Adv. Res. Comput. Sci. Manag. Stud. 1(6), 90–95 (2013)
3.
Zurück zum Zitat Zhang, K., Bi, W., Zhang, X., Fu, X., Zhou, K., Zhu, L.: A new kmeans clustering algorithm for point cloud. Int. J. Hybrid Inf. Technol. 8(9), 157–170 (2015)CrossRef Zhang, K., Bi, W., Zhang, X., Fu, X., Zhou, K., Zhu, L.: A new kmeans clustering algorithm for point cloud. Int. J. Hybrid Inf. Technol. 8(9), 157–170 (2015)CrossRef
4.
Zurück zum Zitat Anderberg, M.R.: Cluster Analysis for Applications. Academic Press, New York (1973)MATH Anderberg, M.R.: Cluster Analysis for Applications. Academic Press, New York (1973)MATH
5.
Zurück zum Zitat Khan, S.S., Ahmad, A.: Cluster center initialization algorithm for K-means clustering. Patter Recogn. Lett. 25, 1293–1302 (2004)CrossRef Khan, S.S., Ahmad, A.: Cluster center initialization algorithm for K-means clustering. Patter Recogn. Lett. 25, 1293–1302 (2004)CrossRef
6.
Zurück zum Zitat Pena, J., Lozano, J., Larranaga, P.: An empirical comparison of four initialization method for the K-means algorithm. Patter Recogn. Lett. 20, 1027–1040 (1999)CrossRef Pena, J., Lozano, J., Larranaga, P.: An empirical comparison of four initialization method for the K-means algorithm. Patter Recogn. Lett. 20, 1027–1040 (1999)CrossRef
7.
Zurück zum Zitat Jung, S.H., Kim, J.C., Sim, C.B.: Prediction data processing scheme using an artificial neural network and data clustering for Big Data. Int. J. Electr. Comput. Eng. 6(1), 330–336 (2016) Jung, S.H., Kim, J.C., Sim, C.B.: Prediction data processing scheme using an artificial neural network and data clustering for Big Data. Int. J. Electr. Comput. Eng. 6(1), 330–336 (2016)
Metadaten
Titel
A Novel on Automatic K Value for Efficiency Improvement of K-means Clustering
verfasst von
Se-Hoon Jung
Kyoung-Jong Kim
Eun-Cheon Lim
Chun-Bo Sim
Copyright-Jahr
2017
Verlag
Springer Singapore
DOI
https://doi.org/10.1007/978-981-10-5041-1_31