Skip to main content
Erschienen in: Journal of Intelligent Information Systems 1/2019

11.04.2019

Efficient question classification and retrieval using category information and word embedding on cQA services

verfasst von: Kyoungman Bae, Youngjoong Ko

Erschienen in: Journal of Intelligent Information Systems | Ausgabe 1/2019

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Classifying the task of automatically assigning unlabeled questions into predefined categories (or topics) and effectively retrieving a similar question are crucial aspects of an effective cQA service. We first address the problems associated with estimating and utilizing the distribution of words in each category of word weights. We then apply an automatic expansion word generation technique that is based on our proposed weighting method and the pseudo relevance feedback to question classification. Secondly to address the lexical gap problem in question retrieval, the case frame of the sentence is first defined using the extracted components of a sentence, and a similarity measure based on the case frame and the word embedding is then derived to determine the similarities between two sentences. These similarities are then used to reorder the results of the first retrieval model. Consequently, the proposed methods significantly improve the performance of question classification and retrieval.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
Zurück zum Zitat Brown, P. F., Pietra, V. J. D., Pietra, S. A. D., Mercer, R. L. (1993). The mathematics of statistical machine translation: parameter estimation. Computaional Linguistics, 19(2), 263–311. Brown, P. F., Pietra, V. J. D., Pietra, S. A. D., Mercer, R. L. (1993). The mathematics of statistical machine translation: parameter estimation. Computaional Linguistics, 19(2), 263–311.
Zurück zum Zitat Cai, L., Zhou, G., Liu, K., Zhao, J. (2012). Learning the latent topics for question retrieval in community QA, ACL’12, pp. 273–281. Cai, L., Zhou, G., Liu, K., Zhao, J. (2012). Learning the latent topics for question retrieval in community QA, ACL’12, pp. 273–281.
Zurück zum Zitat Duan, H., Cao, Y., Lin, C. Y., Yu, Y. (2008). Searching questions by identifying questions topics and question focus, ACL’08, pp. 156–164. Duan, H., Cao, Y., Lin, C. Y., Yu, Y. (2008). Searching questions by identifying questions topics and question focus, ACL’08, pp. 156–164.
Zurück zum Zitat Huang, Q., Song, D., Ruger, S. (2008). Robust query-specific pseudo feedback document selection for query expasion, ECIR ’08. LNCS, 4956, 547–554. Huang, Q., Song, D., Ruger, S. (2008). Robust query-specific pseudo feedback document selection for query expasion, ECIR ’08. LNCS, 4956, 547–554.
Zurück zum Zitat Jehl, L., Hieber, F., Riezler, S. (2012). Twitter translation using translation-based cross-lingual retrieval, WMT ’12, pp. 410—421. Jehl, L., Hieber, F., Riezler, S. (2012). Twitter translation using translation-based cross-lingual retrieval, WMT ’12, pp. 410—421.
Zurück zum Zitat Kim, S. H., Ko, Y. J., Oard, D. W. (2015). Combining lexical and statistical translation evidence for cross-language information retrieval. Journal of the American Society for Information Science and Technology, 66(1), 1–17. https://doi.org/10.1002/asi.23153. Kim, S. H., Ko, Y. J., Oard, D. W. (2015). Combining lexical and statistical translation evidence for cross-language information retrieval. Journal of the American Society for Information Science and Technology, 66(1), 1–17. https://​doi.​org/​10.​1002/​asi.​23153.
Zurück zum Zitat Manning, C. D., Raghavan, P., Schutze, H. (2007). An introduction to information retrieval, (pp. 173–1). Cambridge: Cambridge University Press.MATH Manning, C. D., Raghavan, P., Schutze, H. (2007). An introduction to information retrieval, (pp. 173–1). Cambridge: Cambridge University Press.MATH
Zurück zum Zitat Murdock, V., & Croft, W. B. (2005). A statistical model for sentence retrieval, EMNLP ’05, pp. 684–691. Murdock, V., & Croft, W. B. (2005). A statistical model for sentence retrieval, EMNLP ’05, pp. 684–691.
Zurück zum Zitat Robertson, S., Walker, S., Jones, S., Hancock-Beaulieu, M., Gatford, M. (1994). Okapi at trec-3, TREC-3, pp. 109–126. Robertson, S., Walker, S., Jones, S., Hancock-Beaulieu, M., Gatford, M. (1994). Okapi at trec-3, TREC-3, pp. 109–126.
Metadaten
Titel
Efficient question classification and retrieval using category information and word embedding on cQA services
verfasst von
Kyoungman Bae
Youngjoong Ko
Publikationsdatum
11.04.2019
Verlag
Springer US
Erschienen in
Journal of Intelligent Information Systems / Ausgabe 1/2019
Print ISSN: 0925-9902
Elektronische ISSN: 1573-7675
DOI
https://doi.org/10.1007/s10844-019-00556-x

Weitere Artikel der Ausgabe 1/2019

Journal of Intelligent Information Systems 1/2019 Zur Ausgabe