Skip to main content

2006 | OriginalPaper | Buchkapitel

Dotted Suffix Trees A Structure for Approximate Text Indexing

verfasst von : Luís Pedro Coelho, Arlindo L. Oliveira

Erschienen in: String Processing and Information Retrieval

Verlag: Springer Berlin Heidelberg

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

In this work, the problem we address is text indexing for approximate matching. Given a text

$\mathcal{T}$

which undergoes some preprocessing to generate an index, we can later query this index to identify the places where a string occurs up to a certain number of errors

k

(edition distance). The indexing structure occupies space

$\mathcal{O}(n\log^kn)$

in the average case, independent of alphabet size. This structure can be used to report the existence of a match with

k

errors in

$\mathcal{O}(3^k m^{k+1})$

and to report the occurrences in

$\mathcal{O}(3^k m^{k+1} + \mbox{\it ed})$

time, where

m

is the length of the pattern and

ed

and the number of matching edit scripts. The construction of the structure has time bound by

$\mathcal{O}(kN|\Sigma|)$

, where

N

is the number of nodes in the index and |Σ| the alphabet size.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Metadaten
Titel
Dotted Suffix Trees A Structure for Approximate Text Indexing
verfasst von
Luís Pedro Coelho
Arlindo L. Oliveira
Copyright-Jahr
2006
Verlag
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/11880561_27

Neuer Inhalt