Skip to main content

2016 | OriginalPaper | Buchkapitel

Initializing Deep Learning Based on Latent Dirichlet Allocation for Document Classification

verfasst von : Hyung-Bae Jeon, Soo-Young Lee

Erschienen in: Neural Information Processing

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

The gradient-descent learning of deep neural networks is subject to local minima, and good initialization may depend on the tasks. In contrast, for document classification tasks, latent Dirichlet allocation (LDA) was quite successful in extracting topic representations, but its performance was limited by its shallow architecture. In this study, LDA was adopted for efficient layer-by-layer pre-training of deep neural networks for a document classification task. Two-layer feedforward networks were added at the end of the process, and trained using a supervised learning algorithm. With 10 different random initializations, the LDA-based initialization generated a much lower mean and standard deviation for false recognition rates than other state-of-the-art initialization methods. This might demonstrate that the multi-layer expansion of probabilistic generative LDA model is capable of extracting efficient hierarchical topic representations for document classification.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Blei, D.M., Ng, A.Y., Jordan, M.I.: Latent dirichlet allocation. J. Mach. Learn. Res. 3, 993–1022 (2003)MATH Blei, D.M., Ng, A.Y., Jordan, M.I.: Latent dirichlet allocation. J. Mach. Learn. Res. 3, 993–1022 (2003)MATH
2.
Zurück zum Zitat Bengio, Y.: Learning deep architectures for AI. Found. Trends Mach. Learn. 2, 1–127 (2007)CrossRefMATH Bengio, Y.: Learning deep architectures for AI. Found. Trends Mach. Learn. 2, 1–127 (2007)CrossRefMATH
3.
4.
Zurück zum Zitat Charalampous, K., Kostavelis, I., Amanatiadis, A., Gasteratos, A.: Sparse deep-learning algorithm for recognition and categorisation. Electron. Lett. 48, 1265–1266 (2012)CrossRef Charalampous, K., Kostavelis, I., Amanatiadis, A., Gasteratos, A.: Sparse deep-learning algorithm for recognition and categorisation. Electron. Lett. 48, 1265–1266 (2012)CrossRef
5.
Zurück zum Zitat Erhan, D., Bengio, Y., Courville, A., Manzagol, P.-A., Vincent, P., Bengio, S.: Why does unsupervised pre-training help deep learning? J. Mach. Learn. Res. 11, 625–660 (2010)MathSciNetMATH Erhan, D., Bengio, Y., Courville, A., Manzagol, P.-A., Vincent, P., Bengio, S.: Why does unsupervised pre-training help deep learning? J. Mach. Learn. Res. 11, 625–660 (2010)MathSciNetMATH
6.
Zurück zum Zitat Sutskever, I., Martens, J., Dahl, G., Hinton, G.: On the importance of initialization and momentum in deep learning. In: 30th International Conference on Machine Learning, Atlanta, USA, pp. 1139–1147, June 2013 Sutskever, I., Martens, J., Dahl, G., Hinton, G.: On the importance of initialization and momentum in deep learning. In: 30th International Conference on Machine Learning, Atlanta, USA, pp. 1139–1147, June 2013
7.
Zurück zum Zitat Haidar, M.A., O’Shaughnessy, D.: Unsupervised language model adaptation using LDA-based mixture models and latent semantic marginals. Comput. Speech Lang. 29, 20–31 (2015)CrossRef Haidar, M.A., O’Shaughnessy, D.: Unsupervised language model adaptation using LDA-based mixture models and latent semantic marginals. Comput. Speech Lang. 29, 20–31 (2015)CrossRef
8.
Zurück zum Zitat Song, H.A., Kim, B.K., Xuan, T.L., Lee, S.Y.: Hierachical feature extraction by multi-layer non-negative matrix factorization network for classification task. Neurocomputing 165, 63–74 (2015)CrossRef Song, H.A., Kim, B.K., Xuan, T.L., Lee, S.Y.: Hierachical feature extraction by multi-layer non-negative matrix factorization network for classification task. Neurocomputing 165, 63–74 (2015)CrossRef
Metadaten
Titel
Initializing Deep Learning Based on Latent Dirichlet Allocation for Document Classification
verfasst von
Hyung-Bae Jeon
Soo-Young Lee
Copyright-Jahr
2016
DOI
https://doi.org/10.1007/978-3-319-46675-0_70