Skip to main content

2020 | OriginalPaper | Buchkapitel

Local and Global Stratification Analysis in Whole Genome Sequencing (WGS) Studies Using LocStra

verfasst von : Georg Hahn, Sharon Marie Lutz, Julian Hecker, Dmitry Prokopenko, Christoph Lange

Erschienen in: Computational Advances in Bio and Medical Sciences

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

We are interested in the analysis of local and global population stratification in WGS studies. We present a new R package (locStra) that utilizes the covariance matrix, the genomic relationship matrix, and the unweighted/weighted genetic Jaccard similarity matrix in order to assess population substructure. The package allows one to use a tailored sliding window approach, for instance using user-defined window sizes and metrics, in order to compare local and global similarity matrices. A technique to select the window size is proposed. Population stratification with locStra is efficient due to its C++ implementation which fully exploits sparse matrix algebra. The runtime for the genome-wide computation of all local similarity matrices does typically not exceed one hour for realistic study sizes. This makes an unprecedented investigation of local stratification across the entire genome possible. We apply our package to the 1,000 Genomes Project.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Anhänge
Nur mit Berechtigung zugänglich
Literatur
1.
Zurück zum Zitat Bates, D., Eddelbuettel, D.: Fast and elegant numerical linear algebra using the RcppEigen package. J. Stat. Softw. 52(5), 1–24 (2013)CrossRef Bates, D., Eddelbuettel, D.: Fast and elegant numerical linear algebra using the RcppEigen package. J. Stat. Softw. 52(5), 1–24 (2013)CrossRef
2.
Zurück zum Zitat Chang, C.C., Chow, C.C., Tellier, L.C., Vattikuti, S., Purcell, S.M., Lee, J.J.: Second-generation PLINK: rising to the challenge of larger and richer datasets. GigaScience, 4 (2015) Chang, C.C., Chow, C.C., Tellier, L.C., Vattikuti, S., Purcell, S.M., Lee, J.J.: Second-generation PLINK: rising to the challenge of larger and richer datasets. GigaScience, 4 (2015)
3.
Zurück zum Zitat Devlin, B., Roeder, K.: Genomic control for association studies. Biometrics 55(4), 997–1004 (1999)CrossRef Devlin, B., Roeder, K.: Genomic control for association studies. Biometrics 55(4), 997–1004 (1999)CrossRef
5.
Zurück zum Zitat Lee, S., Epstein, M.P., Duncan, R., Lin, X.: Sparse principal component analysis for identifying ancestry-informative markers in genome-wide association studies. Genet. Epidemiol. 36(4), 293–302 (2012)CrossRef Lee, S., Epstein, M.P., Duncan, R., Lin, X.: Sparse principal component analysis for identifying ancestry-informative markers in genome-wide association studies. Genet. Epidemiol. 36(4), 293–302 (2012)CrossRef
6.
Zurück zum Zitat Martin, E.R., et al.: Properties of global and local ancestry adjustments in genetic association tests in admixed populations. Genet. Epidemiol. 42(2), 214–229 (2018)CrossRef Martin, E.R., et al.: Properties of global and local ancestry adjustments in genetic association tests in admixed populations. Genet. Epidemiol. 42(2), 214–229 (2018)CrossRef
7.
Zurück zum Zitat Patterson, N., Price, A.L., Reich, D.: Population structure and Eigenanalysis. PLoS Genet. 2(12), e190 (2006)CrossRef Patterson, N., Price, A.L., Reich, D.: Population structure and Eigenanalysis. PLoS Genet. 2(12), e190 (2006)CrossRef
8.
Zurück zum Zitat Price, A.L., et al.: Principal components analysis corrects for stratification in genome-wide association studies. Nat. Genet. 38, 904–909 (2006)CrossRef Price, A.L., et al.: Principal components analysis corrects for stratification in genome-wide association studies. Nat. Genet. 38, 904–909 (2006)CrossRef
9.
Zurück zum Zitat Price, A.L., et al.: Sensitive detection of chromosomal segments of distinct ancestry in admixed populations. PLoS Genet. 5(6), e1000519 (2009)CrossRef Price, A.L., et al.: Sensitive detection of chromosomal segments of distinct ancestry in admixed populations. PLoS Genet. 5(6), e1000519 (2009)CrossRef
10.
Zurück zum Zitat Pritchard, J.K., Stephens, M., Rosenberg, N.A., Donnelly, P.: Association mapping in structured populations. Am. J. Hum. Genet. 67(1), 170–181 (2000)CrossRef Pritchard, J.K., Stephens, M., Rosenberg, N.A., Donnelly, P.: Association mapping in structured populations. Am. J. Hum. Genet. 67(1), 170–181 (2000)CrossRef
11.
Zurück zum Zitat Prokopenko, D., et al.: Utilizing the Jaccard index to reveal population stratification in sequencing data: a simulation study and an application to the 1000 Genomes Project. Bioinformatics 32(9), 1366–1372 (2016)CrossRef Prokopenko, D., et al.: Utilizing the Jaccard index to reveal population stratification in sequencing data: a simulation study and an application to the 1000 Genomes Project. Bioinformatics 32(9), 1366–1372 (2016)CrossRef
12.
Zurück zum Zitat Purcell, S., Chang, C.: PLINK2 (2019) Purcell, S., Chang, C.: PLINK2 (2019)
13.
Zurück zum Zitat Schlauch, D., Fier, H., Lange, C.: Identification of genetic outliers due to sub-structure and cryptic relationships. Bioinformatics 33(13), 1972–1979 (2017)CrossRef Schlauch, D., Fier, H., Lange, C.: Identification of genetic outliers due to sub-structure and cryptic relationships. Bioinformatics 33(13), 1972–1979 (2017)CrossRef
14.
Zurück zum Zitat Schlauch, D.: Implementation of the stego algorithm - similarity test for estimating genetic outliers (2016) Schlauch, D.: Implementation of the stego algorithm - similarity test for estimating genetic outliers (2016)
15.
Zurück zum Zitat The 1000 Genomes Project Consortium: A global reference for human genetic variation. Nature, 526, 68–74 (2015) The 1000 Genomes Project Consortium: A global reference for human genetic variation. Nature, 526, 68–74 (2015)
16.
Zurück zum Zitat Mises, R.V., PollaczekGeiringer, H.: Praktische Verfahren der Gleichungsaufloesung. ZAMM Zeitschrift fur Angewandte Mathematik und Mechanik 9, 152–164 (1929)CrossRef Mises, R.V., PollaczekGeiringer, H.: Praktische Verfahren der Gleichungsaufloesung. ZAMM Zeitschrift fur Angewandte Mathematik und Mechanik 9, 152–164 (1929)CrossRef
17.
Zurück zum Zitat Wang, B., Sverdlov, S., Thompson, E.: Efficient estimation of realized kinship from single nucleotide polymorphism genotypes. Genetics 205(3), 1063–1078 (2017)CrossRef Wang, B., Sverdlov, S., Thompson, E.: Efficient estimation of realized kinship from single nucleotide polymorphism genotypes. Genetics 205(3), 1063–1078 (2017)CrossRef
18.
Zurück zum Zitat Zhong, Y., Perera, M.A., Gamazon, E.R.: On using local ancestry to characterize the genetic architecture of human traits: genetic regulation of gene expression in multiethnic or admixed populations. Am. J. Hum. Genet. 104(6), 1097–1115 (2019)CrossRef Zhong, Y., Perera, M.A., Gamazon, E.R.: On using local ancestry to characterize the genetic architecture of human traits: genetic regulation of gene expression in multiethnic or admixed populations. Am. J. Hum. Genet. 104(6), 1097–1115 (2019)CrossRef
Metadaten
Titel
Local and Global Stratification Analysis in Whole Genome Sequencing (WGS) Studies Using LocStra
verfasst von
Georg Hahn
Sharon Marie Lutz
Julian Hecker
Dmitry Prokopenko
Christoph Lange
Copyright-Jahr
2020
DOI
https://doi.org/10.1007/978-3-030-46165-2_13