Skip to main content

2013 | OriginalPaper | Buchkapitel

Top-k Document Retrieval in Compact Space and Near-Optimal Time

verfasst von : Gonzalo Navarro, Sharma V. Thankachan

Erschienen in: Algorithms and Computation

Verlag: Springer Berlin Heidelberg

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Let

$\cal{D}$

= {

d

1

,

d

2

,...

d

D

} be a given set of

D

string documents of total length

n

. Our task is to index

$\cal{D}$

such that the

k

most relevant documents for an online query pattern

P

of length

p

can be retrieved efficiently. There exist linear space data structures of

O

(

n

) words for answering such queries in optimal

O

(

p

 + 

k

) time. In this paper, we describe a compact index of size |

CSA

|+

n

log

D

 + 

o

(

n

log

D

) bits with near optimal time,

O

(

p

 + 

k

log

*

n

), for the basic relevance metric

term-frequency

, where |

CSA

| is the size (in bits) of a compressed full-text index of

$\cal{D}$

, and log

*

n

is the iterated logarithm of

n

.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Metadaten
Titel
Top-k Document Retrieval in Compact Space and Near-Optimal Time
verfasst von
Gonzalo Navarro
Sharma V. Thankachan
Copyright-Jahr
2013
Verlag
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-642-45030-3_37

Premium Partner