Skip to main content

2015 | OriginalPaper | Buchkapitel

The Impact of Using Combinatorial Optimisation for Static Caching of Posting Lists

verfasst von : Casper Petersen, Jakob Grue Simonsen, Christina Lioma

Erschienen in: Information Retrieval Technology

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Caching posting lists can reduce the amount of disk I/O required to evaluate a query. Current methods use optimisation procedures for maximising the cache hit ratio. A recent method selects posting lists for static caching in a greedy manner and obtains higher hit rates than standard cache eviction policies such as LRU and LFU. However, a greedy method does not formally guarantee an optimal solution. We investigate whether the use of methods guaranteed, in theory, to find an approximately optimal solution would yield higher hit rates. Thus, we cast the selection of posting lists for caching as an integer linear programming problem and perform a series of experiments using heuristics from combinatorial optimisation (CCO) to find optimal solutions. Using simulated query logs we find that CCO yields comparable results to a greedy baseline using cache sizes between 200 and 1000 MB, with modest improvements for queries of length two to three.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Azzopardi, L., de Rijke, M.: Automatic construction of known-item finding test beds. In: SIGIR, pp. 603–604 (2006) Azzopardi, L., de Rijke, M.: Automatic construction of known-item finding test beds. In: SIGIR, pp. 603–604 (2006)
2.
Zurück zum Zitat Azzopardi, L., de Rijke, M., Balog, K.: Building simulated queries for known-item topics: an analysis using six european languages. In: SIGIR, pp. 455–462 (2007) Azzopardi, L., de Rijke, M., Balog, K.: Building simulated queries for known-item topics: an analysis using six european languages. In: SIGIR, pp. 455–462 (2007)
3.
Zurück zum Zitat Baeza-Yates, R., Gionis, A., Junqueira, F., Murdock, V., Plachouras, V., Silvestri, F.: The impact of caching on search engines. In: SIGIR, pp. 183–190. ACM (2007) Baeza-Yates, R., Gionis, A., Junqueira, F., Murdock, V., Plachouras, V., Silvestri, F.: The impact of caching on search engines. In: SIGIR, pp. 183–190. ACM (2007)
4.
Zurück zum Zitat Baeza-Yates, R., Gionis, A., Junqueira, F.P., Murdock, V., Plachouras, V., Silvestri, F.: Design trade-offs for search engine caching. TWEB 2(4), 20 (2008)CrossRef Baeza-Yates, R., Gionis, A., Junqueira, F.P., Murdock, V., Plachouras, V., Silvestri, F.: Design trade-offs for search engine caching. TWEB 2(4), 20 (2008)CrossRef
5.
Zurück zum Zitat Baeza-Yates, R., Saint-Jean, F.: A three level search engine index based in query log distribution. In: Nascimento, M.A., de Moura, E.S., Oliveira, A.L. (eds.) SPIRE 2003. LNCS, vol. 2857, pp. 56–65. Springer, Heidelberg (2003)CrossRef Baeza-Yates, R., Saint-Jean, F.: A three level search engine index based in query log distribution. In: Nascimento, M.A., de Moura, E.S., Oliveira, A.L. (eds.) SPIRE 2003. LNCS, vol. 2857, pp. 56–65. Springer, Heidelberg (2003)CrossRef
6.
Zurück zum Zitat Broder, A.Z., Carmel, D., Herscovici, M., Soffer, A., Zien, J.: Efficient query evaluation using a two-level retrieval process. In: IKM, pp. 426–434. ACM (2003) Broder, A.Z., Carmel, D., Herscovici, M., Soffer, A., Zien, J.: Efficient query evaluation using a two-level retrieval process. In: IKM, pp. 426–434. ACM (2003)
7.
Zurück zum Zitat Thomas, H.C., Charles, E.L., Ronald, L.R., Clifford, S.: Introduction to Algorithms. MIT Press, Cambridge (2001)MATH Thomas, H.C., Charles, E.L., Ronald, L.R., Clifford, S.: Introduction to Algorithms. MIT Press, Cambridge (2001)MATH
9.
Zurück zum Zitat Grotschel, M., Lovász, L.: Combinatorial optimization. Handb. Comb. 2, 1541–1597 (1995) Grotschel, M., Lovász, L.: Combinatorial optimization. Handb. Comb. 2, 1541–1597 (1995)
10.
Zurück zum Zitat Liu, Z., Nain, P., Niclausse, N., Towsley, D.: Static caching of web servers. In: PWEI, pp. 179–190. ISOP (1997) Liu, Z., Nain, P., Niclausse, N., Towsley, D.: Static caching of web servers. In: PWEI, pp. 179–190. ISOP (1997)
11.
Zurück zum Zitat Long, X., Suel, T.: Three-level caching for efficient query processing in large web search engines. WWW 9(4), 369–395 (2006)CrossRef Long, X., Suel, T.: Three-level caching for efficient query processing in large web search engines. WWW 9(4), 369–395 (2006)CrossRef
12.
Zurück zum Zitat Papadakis, M., Tzitzikas, Y.: Answering keyword queries through cached subqueries in best match retrieval models. In: JIIS, pp. 1–40 (2014) Papadakis, M., Tzitzikas, Y.: Answering keyword queries through cached subqueries in best match retrieval models. In: JIIS, pp. 1–40 (2014)
13.
Zurück zum Zitat Saraiva, P.C., Silva de Moura, E., Ziviani, N., Meira, W., Fonseca, R., Riberio-Neto, B.: Rank-preserving two-level caching for scalable search engines. In: SIGIR, pp. 51–58. ACM (2001) Saraiva, P.C., Silva de Moura, E., Ziviani, N., Meira, W., Fonseca, R., Riberio-Neto, B.: Rank-preserving two-level caching for scalable search engines. In: SIGIR, pp. 51–58. ACM (2001)
14.
Zurück zum Zitat Tolosa, G., Becchetti, L., Feuerstein, E., Marchetti-Spaccamela, A.: Performance improvements for search systems using an integrated cache of lists+intersections. In: Moura, E., Crochemore, M. (eds.) SPIRE 2014. LNCS, vol. 8799, pp. 227–235. Springer, Heidelberg (2014) Tolosa, G., Becchetti, L., Feuerstein, E., Marchetti-Spaccamela, A.: Performance improvements for search systems using an integrated cache of lists+intersections. In: Moura, E., Crochemore, M. (eds.) SPIRE 2014. LNCS, vol. 8799, pp. 227–235. Springer, Heidelberg (2014)
15.
Zurück zum Zitat Zhang, J., Long, X., Suel,T.: Performance of compressed inverted list caching in search engines. In: WWW, pp. 387–396. ACM (2008) Zhang, J., Long, X., Suel,T.: Performance of compressed inverted list caching in search engines. In: WWW, pp. 387–396. ACM (2008)
Metadaten
Titel
The Impact of Using Combinatorial Optimisation for Static Caching of Posting Lists
verfasst von
Casper Petersen
Jakob Grue Simonsen
Christina Lioma
Copyright-Jahr
2015
DOI
https://doi.org/10.1007/978-3-319-28940-3_36

Neuer Inhalt