Skip to main content

2016 | OriginalPaper | Buchkapitel

The SPMF Open-Source Data Mining Library Version 2

verfasst von : Philippe Fournier-Viger, Jerry Chun-Wei Lin, Antonio Gomariz, Ted Gueniche, Azadeh Soltani, Zhihong Deng, Hoang Thanh Lam

Erschienen in: Machine Learning and Knowledge Discovery in Databases

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

SPMF is an open-source data mining library, specialized in pattern mining, offering implementations of more than 120 data mining algorithms. It has been used in more than 310 research papers to solve applied problems in a wide range of domains from authorship attribution to restaurant recommendation. Its implementations are also commonly used as benchmarks in research papers, and it has also been integrated in several data analysis software programs. After three years of development, this paper introduces the second major revision of the library, named SPMF 2, which provides (1) more than 60 new algorithm implementations (including novel algorithms for sequence prediction), (2) an improved user interface with pattern visualization (3) a novel plug-in system, (4) improved performance, and (5) support for text mining.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Agrawal, R., Ramakrishnan, S.: Mining sequential patterns. In: Proceedings 11th International Conference on Data Engineering, pp. 3–14. IEEE (1995) Agrawal, R., Ramakrishnan, S.: Mining sequential patterns. In: Proceedings 11th International Conference on Data Engineering, pp. 3–14. IEEE (1995)
2.
Zurück zum Zitat Berthold, M.R., et al.: KNIME - the Konstanz information miner: version 2.0 and beyond. SIGKDD Explor. 11(1), 26–31 (2009)CrossRef Berthold, M.R., et al.: KNIME - the Konstanz information miner: version 2.0 and beyond. SIGKDD Explor. 11(1), 26–31 (2009)CrossRef
3.
Zurück zum Zitat Bifet, A., et al.: MOA: massive online analysis, a framework for stream classification and clustering. J. Mach. Learn. Res. (JMLR) 11, 1601–1604 (2010) Bifet, A., et al.: MOA: massive online analysis, a framework for stream classification and clustering. J. Mach. Learn. Res. (JMLR) 11, 1601–1604 (2010)
5.
Zurück zum Zitat Fournier-Viger, P., Gomariz, A., Gueniche, T., Soltani, A., Wu, C., Tseng, V.S.: SPMF: a java open-source pattern mining library. J. Mach. Learn. Res. (JMLR) 15, 3389–3393 (2014)MATH Fournier-Viger, P., Gomariz, A., Gueniche, T., Soltani, A., Wu, C., Tseng, V.S.: SPMF: a java open-source pattern mining library. J. Mach. Learn. Res. (JMLR) 15, 3389–3393 (2014)MATH
6.
Zurück zum Zitat Gueniche, T., Fournier-Viger, P., Raman, R., Tseng, V.S.: CPT+: decreasing the time/space complexity of the compact prediction tree. In: Cao, T., Lim, E.-P., Zhou, Z.-H., Ho, T.-B., Cheung, D., Motoda, H. (eds.) PAKDD 2015. LNCS (LNAI), vol. 9078, pp. 625–636. Springer, Heidelberg (2015). doi:10.1007/978-3-319-18032-8_49 CrossRef Gueniche, T., Fournier-Viger, P., Raman, R., Tseng, V.S.: CPT+: decreasing the time/space complexity of the compact prediction tree. In: Cao, T., Lim, E.-P., Zhou, Z.-H., Ho, T.-B., Cheung, D., Motoda, H. (eds.) PAKDD 2015. LNCS (LNAI), vol. 9078, pp. 625–636. Springer, Heidelberg (2015). doi:10.​1007/​978-3-319-18032-8_​49 CrossRef
9.
Zurück zum Zitat Witten, I.H., Frank, E.: Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, San Francisco (2005)MATH Witten, I.H., Frank, E.: Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, San Francisco (2005)MATH
10.
Zurück zum Zitat Zida, S., Fournier-Viger, P., Lin, JC.-W., Wu, C.-W., Tseng, V.S.: EFIM: a highly efficient algorithm for high-utility itemset mining. In: Proceedings of 14th Mexican International Conference on Artificial Intelligence, pp. 530–546 (2015) Zida, S., Fournier-Viger, P., Lin, JC.-W., Wu, C.-W., Tseng, V.S.: EFIM: a highly efficient algorithm for high-utility itemset mining. In: Proceedings of 14th Mexican International Conference on Artificial Intelligence, pp. 530–546 (2015)
11.
Zurück zum Zitat Fournier-Viger, P., Lin, C.W., Duong, Q.-H., Dam, T.-L.: PHM: mining periodic high-utility itemsets. In: Proceedings of 16th Industrial Conference on Data Mining, 15 p. (2016) Fournier-Viger, P., Lin, C.W., Duong, Q.-H., Dam, T.-L.: PHM: mining periodic high-utility itemsets. In: Proceedings of 16th Industrial Conference on Data Mining, 15 p. (2016)
Metadaten
Titel
The SPMF Open-Source Data Mining Library Version 2
verfasst von
Philippe Fournier-Viger
Jerry Chun-Wei Lin
Antonio Gomariz
Ted Gueniche
Azadeh Soltani
Zhihong Deng
Hoang Thanh Lam
Copyright-Jahr
2016
DOI
https://doi.org/10.1007/978-3-319-46131-1_8