nach oben

Erschienen in:

2012 | OriginalPaper | Buchkapitel

Speeding Up q-Gram Mining on Grammar-Based Compressed Texts

verfasst von : Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, Masayuki Takeda

Erschienen in: Combinatorial Pattern Matching

Verlag: Springer Berlin Heidelberg

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

We present an efficient algorithm for calculating

-gram frequencies on strings represented in compressed form, namely, as a straight line program (SLP). Given an SLP

$\mathcal{T}$

of size

that represents string

, the algorithm computes the occurrence frequencies of

all

-grams in

, by reducing the problem to the weighted

-gram frequencies problem on a trie-like structure of size

$m = |T|-\mathit{dup}(q,\mathcal{T})$

, where

$\mathit{dup}(q,\mathcal{T})$

is a quantity that represents the amount of redundancy that the SLP captures with respect to

-grams. The reduced problem can be solved in linear time. Since

(

), the running time of our algorithm is

$O(\min\{|T|-\mathit{dup}(q,\mathcal{T}),qn\})$

, improving our previous

(

) algorithm when

= Ω(|

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel FEMTO: Fast Search of Large Sequence Collections

Nächstes Kapitel Simple and Efficient LZW-Compressed Multiple Pattern Matching

Titel: Speeding Up q-Gram Mining on Grammar-Based Compressed Texts
verfasst von: Keisuke Goto
Hideo Bannai
Shunsuke Inenaga
Masayuki Takeda
Verlag: Springer Berlin Heidelberg
Buch: Combinatorial Pattern Matching
Print ISBN: 978-3-642-31264-9

Electronic ISBN: 978-3-642-31265-6

Copyright-Jahr: 2012
DOI: https://doi.org/10.1007/978-3-642-31265-6_18

Springer Professional

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"