Skip to main content

2018 | OriginalPaper | Buchkapitel

Fast Algorithm for Vernier Search of Long Repeats in DNA Sequences with Bounded Error Density

verfasst von : Sergey P. Tsarev, Maria Y. Senashova, Michael G. Sadovsky

Erschienen in: Algorithms for Computational Biology

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

A novel algorithm to find all sufficiently long repeating nucleotide substrings in one or several DNA sequences is proposed. The algorithm searches approximately matching strings very fast with given level of local error density. Some biological applications illustrate the method.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Alsmadi, I., Nuser, M.: String matching evaluation methods for DNA comparison. Int. J. Adv. Sci. Technol. 47, 13–32 (2012) Alsmadi, I., Nuser, M.: String matching evaluation methods for DNA comparison. Int. J. Adv. Sci. Technol. 47, 13–32 (2012)
2.
Zurück zum Zitat Altschul, S.F., Gish, W., Miller, W., Meyers, E.W., Lipman, D.J.: Basic local alignment search tool. J. Mol. Biol. 215(3), 403–410 (1990)CrossRef Altschul, S.F., Gish, W., Miller, W., Meyers, E.W., Lipman, D.J.: Basic local alignment search tool. J. Mol. Biol. 215(3), 403–410 (1990)CrossRef
3.
Zurück zum Zitat Altschul, S.F., Madden, T.L., Schaffer, A.A., Zhang, J., Zhang, Z., Miller, W., Lipman, D.J.: Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. NAR 25(17), 3389–3402 (1997)CrossRef Altschul, S.F., Madden, T.L., Schaffer, A.A., Zhang, J., Zhang, Z., Miller, W., Lipman, D.J.: Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. NAR 25(17), 3389–3402 (1997)CrossRef
4.
Zurück zum Zitat Bugaenko, N.N., Gorban, A.N., Sadovsky, M.G.: Maximum entropy method in analysis of genetic text and measurement of its information content. Open Syst. Inf. Dyn. 5(2), 265–278 (1998)CrossRef Bugaenko, N.N., Gorban, A.N., Sadovsky, M.G.: Maximum entropy method in analysis of genetic text and measurement of its information content. Open Syst. Inf. Dyn. 5(2), 265–278 (1998)CrossRef
5.
Zurück zum Zitat Canzar, S., Salzberg, S.L.: Short read mapping: an algorithmic tour. Proc. IEEE 105(3), 436–458 (2017)CrossRef Canzar, S., Salzberg, S.L.: Short read mapping: an algorithmic tour. Proc. IEEE 105(3), 436–458 (2017)CrossRef
7.
Zurück zum Zitat Gonnet, G.H.: Some string matching problems from Bioinformatics which still need better solutions. J. Dis. Alg. 2(1), 3–15 (2004)MathSciNetMATH Gonnet, G.H.: Some string matching problems from Bioinformatics which still need better solutions. J. Dis. Alg. 2(1), 3–15 (2004)MathSciNetMATH
8.
Zurück zum Zitat Levenshtein, V.I.: Binary codes capable of correcting deletions, insertions, and reversals. Sov. Phys. Dokl. 10(8), 707–710 (1966)MathSciNetMATH Levenshtein, V.I.: Binary codes capable of correcting deletions, insertions, and reversals. Sov. Phys. Dokl. 10(8), 707–710 (1966)MathSciNetMATH
9.
Zurück zum Zitat Maier, D.: The complexity of some problems on substrings and supersequences. J. ACM 25(2), 322–336 (1978)CrossRef Maier, D.: The complexity of some problems on substrings and supersequences. J. ACM 25(2), 322–336 (1978)CrossRef
10.
Zurück zum Zitat Marçais, G., Delcher, A.L., Phillippy, A.M., Coston, R., Salzberg, S.L., Zimin, A.: MUMmer4: a fast and versatile genome alignment system. PLoS Comput. Biol. 14(1), e1005944 (2018)CrossRef Marçais, G., Delcher, A.L., Phillippy, A.M., Coston, R., Salzberg, S.L., Zimin, A.: MUMmer4: a fast and versatile genome alignment system. PLoS Comput. Biol. 14(1), e1005944 (2018)CrossRef
12.
Zurück zum Zitat Pearson, W., Lipman, D.: Improved tools for biological sequence comparison. PNAS 85, 2444–2448 (1988)CrossRef Pearson, W., Lipman, D.: Improved tools for biological sequence comparison. PNAS 85, 2444–2448 (1988)CrossRef
13.
Zurück zum Zitat Sadovsky, M.G.: Comparison of real frequencies of strings vs. the expected ones reveals the information capacity of macromoleculae. J. Biol. Phys. 29, 23 (2003)CrossRef Sadovsky, M.G.: Comparison of real frequencies of strings vs. the expected ones reveals the information capacity of macromoleculae. J. Biol. Phys. 29, 23 (2003)CrossRef
14.
Zurück zum Zitat Sadovsky, M.G.: Information capacity of nucleotide sequences and its applications. Bull. Math. Biol. 68, 156 (2006)MathSciNetCrossRef Sadovsky, M.G.: Information capacity of nucleotide sequences and its applications. Bull. Math. Biol. 68, 156 (2006)MathSciNetCrossRef
15.
Metadaten
Titel
Fast Algorithm for Vernier Search of Long Repeats in DNA Sequences with Bounded Error Density
verfasst von
Sergey P. Tsarev
Maria Y. Senashova
Michael G. Sadovsky
Copyright-Jahr
2018
DOI
https://doi.org/10.1007/978-3-319-91938-6_8