Skip to main content

2007 | OriginalPaper | Buchkapitel

Cache-Oblivious Index for Approximate String Matching

verfasst von : Wing-Kai Hon, Tak-Wah Lam, Rahul Shah, Siu-Lung Tam, Jeffrey Scott Vitter

Erschienen in: Combinatorial Pattern Matching

Verlag: Springer Berlin Heidelberg

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

This paper revisits the problem of indexing a text for approximate string matching. Specifically, given a text

T

of length

n

and a positive integer

k

, we want to construct an index of

T

such that for any input pattern

P

, we can find all its

k

-error matches in

T

efficiently. This problem is well-studied in the internal-memory setting. Here, we extend some of these recent results to external-memory solutions, which are also cache-oblivious. Our first index occupies

O

((

n

log

k

n

)/

B

) disk pages and finds all

k

-error matches with

$O((|P|+occ)/B + \log^k n \log \log_{\scriptscriptstyle B} n)$

I/Os, where

B

denotes the number of words in a disk page. To the best of our knowledge, this index is the first external-memory data structure that does not require

$\Omega(|P| + occ + \mbox{poly}(\log n))$

I/Os. The second index reduces the space to

O

((

n

log

n

)/

B

) disk pages, and the I/O complexity is

O

((|

P

| + 

occ

)/

B

 + log

k

(

k

 + 1)

n

loglog

n

).

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Metadaten
Titel
Cache-Oblivious Index for Approximate String Matching
verfasst von
Wing-Kai Hon
Tak-Wah Lam
Rahul Shah
Siu-Lung Tam
Jeffrey Scott Vitter
Copyright-Jahr
2007
Verlag
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-540-73437-6_7

Premium Partner