Skip to main content

2021 | OriginalPaper | Buchkapitel

Effective Usage of Oversampling with SMOTE for Performance Improvement in Classification Over Twitter Data

verfasst von : Deepak Patil, Poonam Katyare, Parag Bhalchandra, Aniket Muley

Erschienen in: Techno-Societal 2020

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

This paper highlights an attempt for addressing the issue of imbalanced classification resulted due to deployment of machine learning algorithms over an imbalanced dataset. It has used Synthetic Minority Oversampling Technique (SMOTE). This type of augmentation of the dataset is extremely necessary as it leads to poor performance in the minority class. Four machine learning algorithms were deployed on the Twitter dataset using the Python platform. Standard data preprocessing including data cleaning, data integration, data transformations, and data reduction was carried out first as the most necessary arrangement before experimentations.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Jan S, Ruby R, Najeeb PT, Muttoo MA (2017) Social network analysis and data mining, by © 2017, IJCSMC Saima Jan et al. Int J Comput Sci Mob Comput 6(6):401–404 Jan S, Ruby R, Najeeb PT, Muttoo MA (2017) Social network analysis and data mining, by © 2017, IJCSMC Saima Jan et al. Int J Comput Sci Mob Comput 6(6):401–404
2.
Zurück zum Zitat Chawla NV, Bowyer KW, Hall LO, Kegelmeyer WP (2002) SMOTE: synthetic minority over-sampling technique. J. Artif Intell Res 16:321–357 Chawla NV, Bowyer KW, Hall LO, Kegelmeyer WP (2002) SMOTE: synthetic minority over-sampling technique. J. Artif Intell Res 16:321–357
3.
Zurück zum Zitat Mohammed AJ, Hassan MM, Kadir DH (2020) Improving classification performance for a novel imbalanced medical dataset using SMOTE method. Int J Adv Trends Comput Sci Eng. 9(3). ISSN 2278–3091 Mohammed AJ, Hassan MM, Kadir DH (2020) Improving classification performance for a novel imbalanced medical dataset using SMOTE method. Int J Adv Trends Comput Sci Eng. 9(3). ISSN 2278–3091
4.
Zurück zum Zitat Papagelis M, Das G (2010) Sampling online social networks. IEEE Trans Knowl Data Eng X(X):Month 20xx Papagelis M, Das G (2010) Sampling online social networks. IEEE Trans Knowl Data Eng X(X):Month 20xx
7.
Zurück zum Zitat Wasserman S, Galaskiewicz J (1994) Advances in social network analysis: research in the social and behavioral sciences. Sage Publications, Thousand OaksCrossRef Wasserman S, Galaskiewicz J (1994) Advances in social network analysis: research in the social and behavioral sciences. Sage Publications, Thousand OaksCrossRef
8.
Zurück zum Zitat Zheng Z, Cai Y, Li Ye (2015) Oversampling method for imbalanced classification. Comput Inf 34:1017–1037 Zheng Z, Cai Y, Li Ye (2015) Oversampling method for imbalanced classification. Comput Inf 34:1017–1037
9.
Zurück zum Zitat Jiawei H, Kamber M (2001) Data mining: concepts and techniques San Francisco. California, Morgan Kauffmann Jiawei H, Kamber M (2001) Data mining: concepts and techniques San Francisco. California, Morgan Kauffmann
10.
Zurück zum Zitat Muthuselvi et al (2012) Information retrieval from social network, IJCA. In: Proceedings on E-governance and cloud computing services vol 4 Muthuselvi et al (2012) Information retrieval from social network, IJCA. In: Proceedings on E-governance and cloud computing services vol 4
11.
Zurück zum Zitat Erdogan SZ et al (2006) A data mining application. A student database. J Aeronaut Space Technol 2(2) Erdogan SZ et al (2006) A data mining application. A student database. J Aeronaut Space Technol 2(2)
Metadaten
Titel
Effective Usage of Oversampling with SMOTE for Performance Improvement in Classification Over Twitter Data
verfasst von
Deepak Patil
Poonam Katyare
Parag Bhalchandra
Aniket Muley
Copyright-Jahr
2021
DOI
https://doi.org/10.1007/978-3-030-69921-5_53

    Marktübersichten

    Die im Laufe eines Jahres in der „adhäsion“ veröffentlichten Marktübersichten helfen Anwendern verschiedenster Branchen, sich einen gezielten Überblick über Lieferantenangebote zu verschaffen.