Skip to main content

2018 | OriginalPaper | Buchkapitel

Optimization of Fuzzy C-Means Algorithm Using Feature Selection Strategies

verfasst von : Kanika Maheshwari, Vivek Sharma

Erschienen in: Information Systems Design and Intelligent Applications

Verlag: Springer Singapore

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

In the era of Digital World, everything has a cost whether the cost is in terms of money, time, space, or data. Big data is a term used to define very large volume of data which possesses a lot of varieties in it. In the following paper, we are presenting feature selection strategy to optimize fuzzy-based clustering over very large data. By using selective features method, we can reduce number of features used to classify the following dataset; thus, the reduction of dimensions/features can help in optimizing iteration count, space, time as well as minimize objective function for the following dataset. In final observation, we found out the reduction in iteration count as well as time in comparison to literal fuzzy c-means algorithm that is 10.65 s and 9.84 s, respectively, for pen digits and cement dataset in comparison to PCA that is 8 s and 9 s and EFA that is 5.74 s and 8 s, respectively, for both the datasets.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Neha Bharill and Aruna Tiwari.: Handling Big Data with Fuzzy Based Classification Approach, Advance Trends in Soft Computing WCSC 2013, Springer International Publishing Switzerland (2014). Neha Bharill and Aruna Tiwari.: Handling Big Data with Fuzzy Based Classification Approach, Advance Trends in Soft Computing WCSC 2013, Springer International Publishing Switzerland (2014).
2.
Zurück zum Zitat KIMBERLY L. ELMORE & MICHAEL B. RICHMAN: Euclidean Distance as a Similarity Metric for Principal Component Analysis, American Meteorological Society (2001). KIMBERLY L. ELMORE & MICHAEL B. RICHMAN: Euclidean Distance as a Similarity Metric for Principal Component Analysis, American Meteorological Society (2001).
3.
Zurück zum Zitat Har-Peled, S., Mazumdar, S.: On coresets for k-means and k-median clustering. In:Proc. ACM Symp. theory Comput., pp. 291–300 (2004). Har-Peled, S., Mazumdar, S.: On coresets for k-means and k-median clustering. In:Proc. ACM Symp. theory Comput., pp. 291–300 (2004).
4.
Zurück zum Zitat Kaufman, L., Rousseeuw, P.: Finding Groups in Data: An Introduction to Cluster Analysis. Wiley Blackwell, New Work (2005). Kaufman, L., Rousseeuw, P.: Finding Groups in Data: An Introduction to Cluster Analysis. Wiley Blackwell, New Work (2005).
5.
Zurück zum Zitat Guha, L.S., Rastogi, R., Shim, K.: CURE: An efficient clustering algorithm for large databases. Inf. Syst. 26(1), 35–58 (2001). Guha, L.S., Rastogi, R., Shim, K.: CURE: An efficient clustering algorithm for large databases. Inf. Syst. 26(1), 35–58 (2001).
6.
Zurück zum Zitat Havens, T.C., Bezdek, J.C., Leckie, C., Hall, L.O., Palaniswami, M.: Fuzzy c-Means Algorithms for Very Large Data. IEEE Trans. Fuzzy Systems 20(6), 1130–1146 (2012). Havens, T.C., Bezdek, J.C., Leckie, C., Hall, L.O., Palaniswami, M.: Fuzzy c-Means Algorithms for Very Large Data. IEEE Trans. Fuzzy Systems 20(6), 1130–1146 (2012).
7.
Zurück zum Zitat A.M. Hafiz & G.M. Bhat.: Handwritten Digit Recognition using Slope Detail Features, International Journal of Computer Applications (0975–8887) Volume 93 – No 5, May 2014. A.M. Hafiz & G.M. Bhat.: Handwritten Digit Recognition using Slope Detail Features, International Journal of Computer Applications (0975–8887) Volume 93 – No 5, May 2014.
Metadaten
Titel
Optimization of Fuzzy C-Means Algorithm Using Feature Selection Strategies
verfasst von
Kanika Maheshwari
Vivek Sharma
Copyright-Jahr
2018
Verlag
Springer Singapore
DOI
https://doi.org/10.1007/978-981-10-7512-4_37