Skip to main content
Top

2017 | OriginalPaper | Chapter

Implementation of an Information Retrieval System Using the Soft Cosine Measure

Authors : Juan Javier González Barbosa, Juan Frausto Solís, J. David Terán-Villanueva, Guadalupe Castilla Valdés, Rogelio Florencia-Juárez, Lucía Janeth Hernández González, Martha B. Mojica Mata

Published in: Nature-Inspired Design of Hybrid Intelligent Systems

Publisher: Springer International Publishing

Activate our intelligent search to find suitable subject content or patents.

search-config
loading …

Abstract

The retrieval information models have been of important study since 1992. These models are based on comparing a user query and a collection of documents taking into account the concurrency of the terms, with the objective to classify a set of relevant documents and retrieve them to the user in accordance with the evaluations criterion. There are metrics to classify a set of documents according to the grade of similarity, such as cosine similarity and soft cosine measure. In this paper, we perform a comparative study of these similarity metrics. The Vector Space Model (VSM) was implemented for retrieving information. A sample of the Collection of the Association for Computing Machinery (CACM) in the domain of Computer Science was used in the evaluation. The experiment results show that the recall is of 96 % in both metrics, but the soft cosine achieves 2 % more in mean average precision.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literature
1.
go back to reference Grigori Sidorov, Alexander Gelbukh, Helena Gómez-Adorno, and David Pinto. Soft Similarity and Soft Cosine Measure: Similarity of Features in Vector Space Model. Computación y Sistemas, Vol. 18, No. 3, 2014, pp. 491–504, DOI:10.13053/CyS-18-3-2043. Grigori Sidorov, Alexander Gelbukh, Helena Gómez-Adorno, and David Pinto. Soft Similarity and Soft Cosine Measure: Similarity of Features in Vector Space Model. Computación y Sistemas, Vol. 18, No. 3, 2014, pp. 491–504, DOI:10.13053/CyS-18-3-2043.
2.
go back to reference Baeza - Yates, R., & Ribeiro - Neto, B. (1999). Modern Information Retrieval (Vol. 463). New York, The United States of America: Addison Wesly, ACM press. Baeza - Yates, R., & Ribeiro - Neto, B. (1999). Modern Information Retrieval (Vol. 463). New York, The United States of America: Addison Wesly, ACM press.
3.
go back to reference Farrús, M., & R. Costa-jussá, M. (2013). Presencia de IRRODL evaluación automática del aprendizaje electrónico utilizando el análisis semántico latente: caso de uso. Revista mexicana de bachillerato a distancia., 153 - 165. Farrús, M., & R. Costa-jussá, M. (2013). Presencia de IRRODL evaluación automática del aprendizaje electrónico utilizando el análisis semántico latente: caso de uso. Revista mexicana de bachillerato a distancia., 153 - 165.
4.
go back to reference La Serna Palomino, N., Pró Concepción, L., & Román Concha, U. (2013). Diseño de un sistema de recuperación de imágenes de individuos malhechores para seguridad ciudadana. Revista de Investigación de Sistemas e Informática, 25 - 32. La Serna Palomino, N., Pró Concepción, L., & Román Concha, U. (2013). Diseño de un sistema de recuperación de imágenes de individuos malhechores para seguridad ciudadana. Revista de Investigación de Sistemas e Informática, 25 - 32.
5.
go back to reference Monsalve, L. S. (2012). Experimento de Recuperación de Información usando las medidas de similitud coseno, Jaccard and Dice. Revista de Investigación: TECCIENCIA, 14 - 24. Monsalve, L. S. (2012). Experimento de Recuperación de Información usando las medidas de similitud coseno, Jaccard and Dice. Revista de Investigación: TECCIENCIA, 14 - 24.
6.
go back to reference La Serna Palomino, N., Román Concha, U., & Osorio, N. (2009). Implementación de un Sistema de Recuperación de Información. Revista de Ingeniería de Sistemas e Informática, 57 - 64. La Serna Palomino, N., Román Concha, U., & Osorio, N. (2009). Implementación de un Sistema de Recuperación de Información. Revista de Ingeniería de Sistemas e Informática, 57 - 64.
Metadata
Title
Implementation of an Information Retrieval System Using the Soft Cosine Measure
Authors
Juan Javier González Barbosa
Juan Frausto Solís
J. David Terán-Villanueva
Guadalupe Castilla Valdés
Rogelio Florencia-Juárez
Lucía Janeth Hernández González
Martha B. Mojica Mata
Copyright Year
2017
DOI
https://doi.org/10.1007/978-3-319-47054-2_50

Premium Partner