Skip to main content

2019 | OriginalPaper | Buchkapitel

A Novel Approach to the Potentially Hazardous Text Identification Under Theme Uncertainty Based on Intelligent Data Analysis

verfasst von : Vladislav Babutskiy, Igor Sidorov

Erschienen in: Computational and Statistical Methods in Intelligent Systems

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

The problem of potentially hazardous text identification is an important one in the intelligent data analysis area. As usual, this problem is solved by methods and techniques, which are of a low efficiency in conditions of theme uncertainty.
Within this paper, a novel approach to the potentially hazardous text identification under theme uncertainty is presented. The main idea of data processing approach proposed is based on the user and automatically extracted keywords comparison. This paper contains the brief overview of the text identification methods, the description of the approach presented, some statistical experimental results, discussion and conclusion.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Nigam, K., McCallum, A.D., Thrun, S., Mitchell, T.M.: Text classification from labelled and unlabeled documents using EM. Mach. Learn. 39, 103–134 (2007)CrossRef Nigam, K., McCallum, A.D., Thrun, S., Mitchell, T.M.: Text classification from labelled and unlabeled documents using EM. Mach. Learn. 39, 103–134 (2007)CrossRef
2.
Zurück zum Zitat Omer, E.: Using machine learning to identify jihadist messages on Twitter. M.S. theses, Department of Information Technology, Uppsala University Sweden (2015) Omer, E.: Using machine learning to identify jihadist messages on Twitter. M.S. theses, Department of Information Technology, Uppsala University Sweden (2015)
3.
Zurück zum Zitat Zhang, L., Zhu, J., Yao, T.: An evaluation of statistical spam filtering techniques. ACM Trans. Asian Lang. Inf. Process. (TALIP) 3(4), 243–269 (2004)CrossRef Zhang, L., Zhu, J., Yao, T.: An evaluation of statistical spam filtering techniques. ACM Trans. Asian Lang. Inf. Process. (TALIP) 3(4), 243–269 (2004)CrossRef
4.
Zurück zum Zitat Rish, I.: An empirical study of the Naïve Bayes classifier. In: IJCAI 2001 Work Empire Methods Artificial Intelligence, vol. 3 (2001) Rish, I.: An empirical study of the Naïve Bayes classifier. In: IJCAI 2001 Work Empire Methods Artificial Intelligence, vol. 3 (2001)
5.
Zurück zum Zitat Kwon, O.-W., Lee, J.-H.: Text categorization based on k-nearest neighbor approach for web site classification. Inf. Process. Manag. 39(1), 25–44 (2003)CrossRef Kwon, O.-W., Lee, J.-H.: Text categorization based on k-nearest neighbor approach for web site classification. Inf. Process. Manag. 39(1), 25–44 (2003)CrossRef
6.
Zurück zum Zitat Tresch, M., Luniewski, A.: An extensible classifier for semi-structured documents. In: Park, E.K., Makki, K. (eds.) Proceedings of the Fourth International Conference on Information and Knowledge Management (CIKM 1995), Niki Pissinou, Avi Silber-schatz, pp. 226–233. ACM, New York (1995) Tresch, M., Luniewski, A.: An extensible classifier for semi-structured documents. In: Park, E.K., Makki, K. (eds.) Proceedings of the Fourth International Conference on Information and Knowledge Management (CIKM 1995), Niki Pissinou, Avi Silber-schatz, pp. 226–233. ACM, New York (1995)
7.
Zurück zum Zitat Haykin, S.: Neural Networks - A Comprehensive Foundation. Canada (1999) Haykin, S.: Neural Networks - A Comprehensive Foundation. Canada (1999)
8.
Zurück zum Zitat Sebastiani, F.: Machine learning in automated text categorization. ACM Comput. Surv. 34, 1–47 (2002)CrossRef Sebastiani, F.: Machine learning in automated text categorization. ACM Comput. Surv. 34, 1–47 (2002)CrossRef
9.
Zurück zum Zitat Mahinovs, A., Tiwari, A.: Text Classification Method Review. Cranfield University, Cranfield (2007) Mahinovs, A., Tiwari, A.: Text Classification Method Review. Cranfield University, Cranfield (2007)
10.
Zurück zum Zitat Jordan, M.I., Bishop, C.: Neural Networks. CRC Press, Boca Raton (1997) Jordan, M.I., Bishop, C.: Neural Networks. CRC Press, Boca Raton (1997)
Metadaten
Titel
A Novel Approach to the Potentially Hazardous Text Identification Under Theme Uncertainty Based on Intelligent Data Analysis
verfasst von
Vladislav Babutskiy
Igor Sidorov
Copyright-Jahr
2019
DOI
https://doi.org/10.1007/978-3-030-00211-4_4

Premium Partner