Skip to main content
Erschienen in: Datenbank-Spektrum 1/2019

28.12.2018 | Schwerpunktbeitrag

Big Data Competence Center ScaDS Dresden/Leipzig: Overview and selected research activities

verfasst von: Erhard Rahm, Wolfgang E. Nagel, Eric Peukert, René Jäkel, Fabian Gärtner, Peter F. Stadler, Daniel Wiegreffe, Dirk Zeckzer, Wolfgang Lehner

Erschienen in: Datenbank-Spektrum | Ausgabe 1/2019

Einloggen

Aktivieren Sie unsere intelligente Suche um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Since its launch in October 2014, the Competence Center for Scalable Data Services and Solutions (ScaDS) Dresden/Leipzig carries out collaborative research on Big Data methods and their use in challenging data science applications of different domains, leading to both general, and application-specific solutions and services. In this article, we give an overview about the structure of the competence center, its primary goals and research directions. Furthermore, we outline selected research results on scalable data platforms, distributed graph analytics, data augmentation and integration and visual analytics. We also briefly report on planned activities for the second funding period (2018-2021) of the center.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Weitere Produktempfehlungen anzeigen
Literatur
1.
Zurück zum Zitat Asch M et al (2018) Big data and extreme-scale computing: Pathways to convergence-toward a shaping strategy for a future software and data ecosystem for scientific inquiry. Int J High Perform Comput Appl 32(4):435–479CrossRef Asch M et al (2018) Big data and extreme-scale computing: Pathways to convergence-toward a shaping strategy for a future software and data ecosystem for scientific inquiry. Int J High Perform Comput Appl 32(4):435–479CrossRef
3.
Zurück zum Zitat Berthold MR, Cebron N, Dill F, Gabriel TR, Kötter T, Meinl T, Ohl P, Thiel K, Wiswedel B (2009) KNIME-the Konstanz information miner: version 2.0 and beyond. Acm Sigkdd Explor Newsl 11(1):26–31CrossRef Berthold MR, Cebron N, Dill F, Gabriel TR, Kötter T, Meinl T, Ohl P, Thiel K, Wiswedel B (2009) KNIME-the Konstanz information miner: version 2.0 and beyond. Acm Sigkdd Explor Newsl 11(1):26–31CrossRef
4.
Zurück zum Zitat Boden C, Rabl T, Markl V (2018) The Berlin Big Data Center (BBDC). it Inf Technol 60(5-6):321–326 Boden C, Rabl T, Markl V (2018) The Berlin Big Data Center (BBDC). it Inf Technol 60(5-6):321–326
6.
Zurück zum Zitat Dienst S, Beseler J (2016) Automatic anomaly detection in offshore wind SCADA data. ProcWindEurope Summit, Hamburg Dienst S, Beseler J (2016) Automatic anomaly detection in offshore wind SCADA data. ProcWindEurope Summit, Hamburg
7.
Zurück zum Zitat Eberius J, Werner C, Thiele M, Braunschweig K, Dannecker L, Lehner W (2013) DeExcelerator: a framework for extracting relational data from partially structured documents. In: CIKM, pp 2477–2480, https://doi.org/10.1145/2505515.2508210CrossRef Eberius J, Werner C, Thiele M, Braunschweig K, Dannecker L, Lehner W (2013) DeExcelerator: a framework for extracting relational data from partially structured documents. In: CIKM, pp 2477–2480, https://​doi.​org/​10.​1145/​2505515.​2508210CrossRef
11.
Zurück zum Zitat Franke M, Gladbach M, Sehili Z, Rohde F, Rahm E (2019) ScaDS research on scalable privacy-preserving record linkage. Datenbank Spektrum 19(1) Franke M, Gladbach M, Sehili Z, Rohde F, Rahm E (2019) ScaDS research on scalable privacy-preserving record linkage. Datenbank Spektrum 19(1)
12.
Zurück zum Zitat Frenzel J, Feldhoff K, Jäkel R, Müller-Pfefferkorn R (2018) Tracing of multi-threaded Java applications inScore-P using bytecode instrumentation, Proc. ARCS Workshop, pp 1–8 Frenzel J, Feldhoff K, Jäkel R, Müller-Pfefferkorn R (2018) Tracing of multi-threaded Java applications inScore-P using bytecode instrumentation, Proc. ARCS Workshop, pp 1–8
14.
Zurück zum Zitat Gärtner F, zu Siederdissen C, Müller L, Stadler PF (2018) Coordinate systems for supergenomes. Algorithms for Molecular Biology 13(1):15 Gärtner F, zu Siederdissen C, Müller L, Stadler PF (2018) Coordinate systems for supergenomes. Algorithms for Molecular Biology 13(1):15
15.
Zurück zum Zitat Gawad C, Koh W, Quake SR (2016) Single-cell genome sequencing: current state of the science. Nat Rev Genet 17(3):175–188CrossRef Gawad C, Koh W, Quake SR (2016) Single-cell genome sequencing: current state of the science. Nat Rev Genet 17(3):175–188CrossRef
17.
Zurück zum Zitat Hahmann M, Hartmann C, Kegel L, Lehner W (2019) Large-scale time series analytics – novel approaches for generation and prediction. Datenbank Spektrum 19(1) Hahmann M, Hartmann C, Kegel L, Lehner W (2019) Large-scale time series analytics – novel approaches for generation and prediction. Datenbank Spektrum 19(1)
18.
Zurück zum Zitat Herbig A, Jäger G, Battke F, Nieselt K (2012) GenomeRing: alignment visualization based on SuperGenome coordinates. Bioinformatics 28(i7):i15 Herbig A, Jäger G, Battke F, Nieselt K (2012) GenomeRing: alignment visualization based on SuperGenome coordinates. Bioinformatics 28(i7):i15
19.
Zurück zum Zitat Herold H, Hecht R, Meinel G (2016) Old maps for land use change monitoring – analysing historical maps for long-term land use change monitoring. Proc Int Workshop Exploring Old Maps. EOM 201(6):11–12 Herold H, Hecht R, Meinel G (2016) Old maps for land use change monitoring – analysing historical maps for long-term land use change monitoring. Proc Int Workshop Exploring Old Maps. EOM 201(6):11–12
20.
Zurück zum Zitat Heyer G, Tiepmar J (2019) A Big Data case study in Digital Humanities: Creating a performance benchmark for Canonical Text Services. Datenbank Spektrum 19(1) Heyer G, Tiepmar J (2019) A Big Data case study in Digital Humanities: Creating a performance benchmark for Canonical Text Services. Datenbank Spektrum 19(1)
21.
Zurück zum Zitat Hoehne R, Staib J (2016) Multi-scale visualisation – key to an enhanced understanding of materials. Carbon Compos Mag 4:20–21 (ISSN 2366-8024) Hoehne R, Staib J (2016) Multi-scale visualisation – key to an enhanced understanding of materials. Carbon Compos Mag 4:20–21 (ISSN 2366-8024)
23.
Zurück zum Zitat Jäkel R, Müller-Pfefferkorn R, Kluge M, Grunzke R, Nagel WE (2014) Architectural implications for Exascale based on Big Data workflow requirements. In: High Performance Computing Workshop, IOS Press, Advances in Parallel Computing, vol 26, pp 101–113 Jäkel R, Müller-Pfefferkorn R, Kluge M, Grunzke R, Nagel WE (2014) Architectural implications for Exascale based on Big Data workflow requirements. In: High Performance Computing Workshop, IOS Press, Advances in Parallel Computing, vol 26, pp 101–113
24.
Zurück zum Zitat Jäkel R, Müller-Pfefferkorn R, Kluge M, Grunzke R, Nagel WE (2015) Architectural implications for Exascale-based on Big Data workflow requirements. Advances in Parallel Computing vol 26, pp 101–113 Jäkel R, Müller-Pfefferkorn R, Kluge M, Grunzke R, Nagel WE (2015) Architectural implications for Exascale-based on Big Data workflow requirements. Advances in Parallel Computing vol 26, pp 101–113
25.
Zurück zum Zitat Jäkel R, Peukert E, Nagel WE, Rahm E (2018) ScaDS Dresden/Leipzig – a competence center for collaborative Big Data research. it Inf Technol 60(5-6):327–334 Jäkel R, Peukert E, Nagel WE, Rahm E (2018) ScaDS Dresden/Leipzig – a competence center for collaborative Big Data research. it Inf Technol 60(5-6):327–334
26.
Zurück zum Zitat Junghanns M, Petermann A, Gómez K, Rahm E (2015) GRADOOP: scalable graph data management and analytics with Hadoop. Arxiv Prepr Arxiv 150600548 Junghanns M, Petermann A, Gómez K, Rahm E (2015) GRADOOP: scalable graph data management and analytics with Hadoop. Arxiv Prepr Arxiv 150600548
30.
Zurück zum Zitat Junghanns M, Petermann A, Rahm E (2017c) Distributed grouping of property graphs with GRADOOP. Proc Database systems for Business, Technology and Web (BTW) Junghanns M, Petermann A, Rahm E (2017c) Distributed grouping of property graphs with GRADOOP. Proc Database systems for Business, Technology and Web (BTW)
35.
Zurück zum Zitat Kolb L, Rahm E (2013) Parallel entity resolution with DeDoop. Datenbank Spektrum 13(1):23–32CrossRef Kolb L, Rahm E (2013) Parallel entity resolution with DeDoop. Datenbank Spektrum 13(1):23–32CrossRef
37.
Zurück zum Zitat Kricke M, Peukert E, Rahm E (2019) Graph data transformations in GRADOOP. Proc. BTW, conf Kricke M, Peukert E, Rahm E (2019) Graph data transformations in GRADOOP. Proc. BTW, conf
39.
Zurück zum Zitat McCune RR, Weninger T, Madey G (2015) Thinking like a vertex: a survey of vertex-centric frameworks for large-scale distributed graph processing. ACM Comput Surv 48(2):25CrossRef McCune RR, Weninger T, Madey G (2015) Thinking like a vertex: a survey of vertex-centric frameworks for large-scale distributed graph processing. ACM Comput Surv 48(2):25CrossRef
40.
Zurück zum Zitat Müller L, Gerighausen D, Farman M, Zeckzer D (2016) Sierra Platinum: A Fast and Robust Multiple-Replicate Peak Caller With Visual Quality-Control and -Steering. BMC Bioinformatics 17(1):1–13CrossRef Müller L, Gerighausen D, Farman M, Zeckzer D (2016) Sierra Platinum: A Fast and Robust Multiple-Replicate Peak Caller With Visual Quality-Control and -Steering. BMC Bioinformatics 17(1):1–13CrossRef
41.
Zurück zum Zitat Nagel WE, Jäkel R, Müller-Pfefferkorn R (2015) Execution environments for Big Data: Challenges for user centric scenarios. In: BDEC white paper BDEC. Proc. Int. Workshop on Extreme Scale Scientific Computing (Big Data and Extreme Computing, BDEC), Barcelona, 2015 Nagel WE, Jäkel R, Müller-Pfefferkorn R (2015) Execution environments for Big Data: Challenges for user centric scenarios. In: BDEC white paper BDEC. Proc. Int. Workshop on Extreme Scale Scientific Computing (Big Data and Extreme Computing, BDEC), Barcelona, 2015
42.
Zurück zum Zitat Nentwig M, Rahm E (2018) Incremental clustering on linked data. In: Proc. IEEE, Int. Conf. on Data Mining Workshops (ICDMW)CrossRef Nentwig M, Rahm E (2018) Incremental clustering on linked data. In: Proc. IEEE, Int. Conf. on Data Mining Workshops (ICDMW)CrossRef
49.
Zurück zum Zitat Rostami A, Kricke M, Peukert E, Kühne S, Dienst S, Rahm E (2019) BIGGR: Bringing GRADOOP to applications. Datenbank Spektrum 19(1) Rostami A, Kricke M, Peukert E, Kühne S, Dienst S, Rahm E (2019) BIGGR: Bringing GRADOOP to applications. Datenbank Spektrum 19(1)
53.
Zurück zum Zitat Schemala D, Schlesinger D, Winkler P, Herold H, Meinel G (2016) Semantic segmentation of settlement patterns in gray-scale map images using RF and. CRF, within an HPC environment. Proc GEOBIA Schemala D, Schlesinger D, Winkler P, Herold H, Meinel G (2016) Semantic segmentation of settlement patterns in gray-scale map images using RF and. CRF, within an HPC environment. Proc GEOBIA
55.
Zurück zum Zitat Spangenberg N, Roth M, Mutke S, Franczyk B (2017b) Big Data in der Logistik – ein ganzheitlicher Ansatz für die datengetriebene Logistikplanung, -überwachung und -steuerung. In: Industrie 4.0 Management 33(4):43–47 Spangenberg N, Roth M, Mutke S, Franczyk B (2017b) Big Data in der Logistik – ein ganzheitlicher Ansatz für die datengetriebene Logistikplanung, -überwachung und -steuerung. In: Industrie 4.0 Management 33(4):43–47
57.
Zurück zum Zitat Staib J, Grottel S, Gumhold S (2015) Visualization of particle-based data with transparency and ambient occlusion. Comput Graph Forum 34:151–160CrossRef Staib J, Grottel S, Gumhold S (2015) Visualization of particle-based data with transparency and ambient occlusion. Comput Graph Forum 34:151–160CrossRef
59.
Zurück zum Zitat Staib J, Grottel S, Gumhold S (2017) Temporal focus+context for clusters in particle data. In: Vision, Modeling and Visualization (VMV17) Staib J, Grottel S, Gumhold S (2017) Temporal focus+context for clusters in particle data. In: Vision, Modeling and Visualization (VMV17)
61.
Zurück zum Zitat Tiepmar J (2014) Release of the MySQL-based implementation of the CTS protocol. In: Proc. 3rd LREC Workshop on Challenges in the Management of Large Corpora, pp 35–43 Tiepmar J (2014) Release of the MySQL-based implementation of the CTS protocol. In: Proc. 3rd LREC Workshop on Challenges in the Management of Large Corpora, pp 35–43
62.
Zurück zum Zitat Tiepmar J (2016) CTS text miner – text mining framework based on the canonical text service protocol. In: Proc. 4th LREC Workshop on Challenges in the Management of Large Corpora, pp 1–7 Tiepmar J (2016) CTS text miner – text mining framework based on the canonical text service protocol. In: Proc. 4th LREC Workshop on Challenges in the Management of Large Corpora, pp 1–7
65.
Zurück zum Zitat Zeckzer D, Gerighausen D, Steiner L, Prohaska SJ (2014) Analyzing Chromatin Using Tiled Binned Scatterplot Matrices. IEEE, Symp on Biological Data Visualization (BioVis) Zeckzer D, Gerighausen D, Steiner L, Prohaska SJ (2014) Analyzing Chromatin Using Tiled Binned Scatterplot Matrices. IEEE, Symp on Biological Data Visualization (BioVis)
67.
Zurück zum Zitat Zeckzer D, Wiegreffe D, Müller L (2018) Analyzing Histone Modifications Using Tiled Binned Clustering and 3D Scatter Plots. J Wscg 26:1–10CrossRef Zeckzer D, Wiegreffe D, Müller L (2018) Analyzing Histone Modifications Using Tiled Binned Clustering and 3D Scatter Plots. J Wscg 26:1–10CrossRef
Metadaten
Titel
Big Data Competence Center ScaDS Dresden/Leipzig: Overview and selected research activities
verfasst von
Erhard Rahm
Wolfgang E. Nagel
Eric Peukert
René Jäkel
Fabian Gärtner
Peter F. Stadler
Daniel Wiegreffe
Dirk Zeckzer
Wolfgang Lehner
Publikationsdatum
28.12.2018
Verlag
Springer Berlin Heidelberg
Erschienen in
Datenbank-Spektrum / Ausgabe 1/2019
Print ISSN: 1618-2162
Elektronische ISSN: 1610-1995
DOI
https://doi.org/10.1007/s13222-018-00303-6

Weitere Artikel der Ausgabe 1/2019

Datenbank-Spektrum 1/2019 Zur Ausgabe

Community

News

Dissertationen

Dissertationen