Skip to main content

2018 | OriginalPaper | Buchkapitel

Categorization of RNA Molecules Using Graph Methods

verfasst von : Richard C. Wilson, Enes Algul

Erschienen in: Structural, Syntactic, and Statistical Pattern Recognition

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

RNA molecules are a group of biologically active molecules which have a similar structure to DNA. Graph-based methods for classification have shown promise on other biological compounds such as protein. In this paper, we investigate the use of graph representations of RNA, graph-feature based methods and their role in classifying RNA into particular categories. We describe a number of possible graph representations of RNA structure and how useful information can be encoded in the graph. We show how graph-kernel and graph-feature methods can be used to provide descriptors for the molecules. Finally, on a moderately-sized database of 419 RNA structures, we explore how these methods can be used to classify RNA into high-level categories provided by the biological context or function of the molecules. We find that graph descriptors give state-of-the-art performance on sequence classification, but that the graph elements of the description do not add useful information above the base-sequence.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Helma, C., Kramer, S.: A survey of the predictive toxicology challenge 2000–2001. Bioinformatics 19, 1179–1182 (2003)CrossRef Helma, C., Kramer, S.: A survey of the predictive toxicology challenge 2000–2001. Bioinformatics 19, 1179–1182 (2003)CrossRef
2.
Zurück zum Zitat Andronescu, M., Bereg, V., Hoos, H.H., Condon, A.: Rna strand: The rna secondary structure and statistical analysis database. BMC Bioinform. 9(1), 340 (2008)CrossRef Andronescu, M., Bereg, V., Hoos, H.H., Condon, A.: Rna strand: The rna secondary structure and statistical analysis database. BMC Bioinform. 9(1), 340 (2008)CrossRef
3.
Zurück zum Zitat Klosterman, P., Tamura, M., Holbrook, S., Brenner, S.: Scor: a structural classification of RNA database. Nucleic Acids Res. 30, 392–394 (2002)CrossRef Klosterman, P., Tamura, M., Holbrook, S., Brenner, S.: Scor: a structural classification of RNA database. Nucleic Acids Res. 30, 392–394 (2002)CrossRef
5.
Zurück zum Zitat Needleman, S.B., Wunsch, C.D.: A general method applicable to the search for similarities in the amino acid sequence of two proteins. J. Mol. Biol. 43(3), 443–453 (1970)CrossRef Needleman, S.B., Wunsch, C.D.: A general method applicable to the search for similarities in the amino acid sequence of two proteins. J. Mol. Biol. 43(3), 443–453 (1970)CrossRef
6.
Zurück zum Zitat Wale, N., Watson, I.A., Karypis, G.: Comparison of descriptor spaces for chemical compound retrieval and classification. Knowl. Inf. Syst. 14, 347–375 (2008)CrossRef Wale, N., Watson, I.A., Karypis, G.: Comparison of descriptor spaces for chemical compound retrieval and classification. Knowl. Inf. Syst. 14, 347–375 (2008)CrossRef
8.
Zurück zum Zitat Borgwardt, K.M., Ong, C.S., Schoenauer, S., Vishwanathan, S.V.N., Smola, A.J., Kriegel, H.P.: Protein function prediction via graph kernels. Bioinformatics 21, i47–i56 (2005)CrossRef Borgwardt, K.M., Ong, C.S., Schoenauer, S., Vishwanathan, S.V.N., Smola, A.J., Kriegel, H.P.: Protein function prediction via graph kernels. Bioinformatics 21, i47–i56 (2005)CrossRef
11.
Zurück zum Zitat Kriege, N.M., Giscard, P.-L., Wilson, R.C.: On valid optimal assignment kernels and applications to graph classification. In: Advances in Neural Information Processing Systems, pp. 1615–1623 (2016) Kriege, N.M., Giscard, P.-L., Wilson, R.C.: On valid optimal assignment kernels and applications to graph classification. In: Advances in Neural Information Processing Systems, pp. 1615–1623 (2016)
15.
Zurück zum Zitat Pȩkalska, E., Harol, A., Duin, R.P.W., Spillmann, B., Bunke, H.: Non-euclidean or non-metric measures can be informative. In: Yeung, D.-Y., Kwok, J.T., Fred, A., Roli, F., de Ridder, D. (eds.) SSPR /SPR 2006. LNCS, vol. 4109, pp. 871–880. Springer, Heidelberg (2006). https://doi.org/10.1007/11815921_96CrossRef Pȩkalska, E., Harol, A., Duin, R.P.W., Spillmann, B., Bunke, H.: Non-euclidean or non-metric measures can be informative. In: Yeung, D.-Y., Kwok, J.T., Fred, A., Roli, F., de Ridder, D. (eds.) SSPR /SPR 2006. LNCS, vol. 4109, pp. 871–880. Springer, Heidelberg (2006). https://​doi.​org/​10.​1007/​11815921_​96CrossRef
Metadaten
Titel
Categorization of RNA Molecules Using Graph Methods
verfasst von
Richard C. Wilson
Enes Algul
Copyright-Jahr
2018
DOI
https://doi.org/10.1007/978-3-319-97785-0_42