Skip to main content

2014 | OriginalPaper | Buchkapitel

Deep Learning of Semantic Word Representations to Implement a Content-Based Recommender for the RecSys Challenge’14

verfasst von : Omar U. Florez

Erschienen in: Semantic Web Evaluation Challenge

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

In this paper, we will discuss a recommender system that exploits the semantics regularities captured by a Recurrent Neural Network (RNN) in text documents. Many information retrieval systems treat words as binary vectors under the classic bag-of-words model; however there is not a notion of semantic similarity between words when describing a document in the resulting feature space. Recent advances in neural networks have shown that continuous word vectors can be learned as a probability distribution over the words of a document [3, 4]. Surprisingly, researchers have found that algebraic operations on this new representation captures semantic regularities in language [5]. For example, \(Intel + Pentium - Google\) results in word vectors associated to \(\{Search, Android, Phones\}\).
We used this deep learning approach to discover the continuous features describing content of documents with vectors of semantic words and fitted a linear regression model to approximate user preferences for documents. Our submission to the RecSys Challenge’14 obtained a RMSE of \(0.902\) and ranked 6th for Task 1. Interestingly enough, our approach provided better vector representations than LDA, LSA, and PCA for modeling the content of book abstracts, which are well-known techniques currently used to implement content-based recommender systems in the recommendation community.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Bell, R.M., Koren, Y.: Lessons from the netflix prize challenge. SIGKDD Explor. Newsl. 9(2), 75–79 (2007)CrossRef Bell, R.M., Koren, Y.: Lessons from the netflix prize challenge. SIGKDD Explor. Newsl. 9(2), 75–79 (2007)CrossRef
2.
Zurück zum Zitat Maas, A.L., Ng, A.Y.: A probabilistic model for semantic word vectors. In: Workshop on Deep Learning and Unsupervised Feature Learning, NIPS, vol. 10 (2010) Maas, A.L., Ng, A.Y.: A probabilistic model for semantic word vectors. In: Workshop on Deep Learning and Unsupervised Feature Learning, NIPS, vol. 10 (2010)
3.
Zurück zum Zitat Mikolov, T., Chen, K., Corrado, G., Dean, J.: Efficient estimation of word representations in vector space. CoRR, abs/1301.3781 (2013) Mikolov, T., Chen, K., Corrado, G., Dean, J.: Efficient estimation of word representations in vector space. CoRR, abs/1301.3781 (2013)
4.
Zurück zum Zitat Mikolov, T., Sutskever, I., Chen, K., Corrado, G.S., Dean, J.: Distributed representations of words and phrases and their compositionality. In: NIPS, pp. 3111–3119 (2013) Mikolov, T., Sutskever, I., Chen, K., Corrado, G.S., Dean, J.: Distributed representations of words and phrases and their compositionality. In: NIPS, pp. 3111–3119 (2013)
5.
Zurück zum Zitat Mikolov, T., Yih, W.-T., Zweig, G.: Linguistic regularities in continuous space word representations. In: HLT-NAACL, pp. 746–751. The Association for Computational Linguistics (2013) Mikolov, T., Yih, W.-T., Zweig, G.: Linguistic regularities in continuous space word representations. In: HLT-NAACL, pp. 746–751. The Association for Computational Linguistics (2013)
Metadaten
Titel
Deep Learning of Semantic Word Representations to Implement a Content-Based Recommender for the RecSys Challenge’14
verfasst von
Omar U. Florez
Copyright-Jahr
2014
DOI
https://doi.org/10.1007/978-3-319-12024-9_27

Neuer Inhalt