Skip to main content

2019 | OriginalPaper | Buchkapitel

Ontario: Federated Query Processing Against a Semantic Data Lake

verfasst von : Kemele M. Endris, Philipp D. Rohde, Maria-Esther Vidal, Sören Auer

Erschienen in: Database and Expert Systems Applications

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Data lakes enable flexible knowledge discovery and reduce the overhead of materialized data integration. Albeit effective for data storage, query execution over data lakes may be expensive, being demanded novel techniques to generate plans able to exploit the main characteristics of data lakes. We devise Ontario, a federated query processing approach tailored for large-scale heterogeneous data. Ontario provides efficient and effective query processing over a federation of heterogeneous data sources in a data lake. Ontario resorts to source descriptions named RDF Molecule Templates, i.e., abstract descriptions of the properties of the entities in a unified schema and their implementation in a data lake. We empirically evaluate the effectiveness of the Ontario optimization techniques over state-of-the-art benchmarks. The observed results suggest that Ontario can effectively select plans composed of subqueries that can be efficiently executed against heterogeneous data sources in a data lake.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
2.
Zurück zum Zitat Belleau, F., Nolin, M.-A., Tourigny, N., Rigault, P., Morissette, J.: Bio2RDF: towards a mashup to build bioinformatics knowledge systems. J. Biomed. Inf. 41(5), 706–716 (2008)CrossRef Belleau, F., Nolin, M.-A., Tourigny, N., Rigault, P., Morissette, J.: Bio2RDF: towards a mashup to build bioinformatics knowledge systems. J. Biomed. Inf. 41(5), 706–716 (2008)CrossRef
3.
Zurück zum Zitat Duggan, J., et al.: The BigDAWG polystore system. SIGMOD Rec. 44(2), 11–16 (2015)CrossRef Duggan, J., et al.: The BigDAWG polystore system. SIGMOD Rec. 44(2), 11–16 (2015)CrossRef
4.
Zurück zum Zitat Endris, K.M., Galkin, M., Lytra, I., Mami, M.N., Vidal, M.-E., Auer, S.: Querying interlinked data by bridging RDF molecule templates. TLDKS 39, 1–42 (2018) Endris, K.M., Galkin, M., Lytra, I., Mami, M.N., Vidal, M.-E., Auer, S.: Querying interlinked data by bridging RDF molecule templates. TLDKS 39, 1–42 (2018)
5.
Zurück zum Zitat Golshan, B., Halevy, A.Y., Mihaila, G.A., Tan, W.: Data integration: after the teenage years. In: 2017 Proceedings of the 36th ACM SIGMOD-SIGACT-SIGAI Symposium on Principles of Database Systems, PODS, pp. 101–106 (2017) Golshan, B., Halevy, A.Y., Mihaila, G.A., Tan, W.: Data integration: after the teenage years. In: 2017 Proceedings of the 36th ACM SIGMOD-SIGACT-SIGAI Symposium on Principles of Database Systems, PODS, pp. 101–106 (2017)
6.
Zurück zum Zitat Hasnain, A., et al.: BioFed: federated query processing over life sciences linked open data. J. Biomed. Seman. 8(1), 13:1–13:19 (2017)CrossRef Hasnain, A., et al.: BioFed: federated query processing over life sciences linked open data. J. Biomed. Seman. 8(1), 13:1–13:19 (2017)CrossRef
7.
Zurück zum Zitat Khan, Y., Zimmermann, A., Jha, A., Gadepally, V., D’Aquin, M., Sahay, R.: One size does not fit all: querying web polystores. IEEE Access 7, 9598–9617 (2019)CrossRef Khan, Y., Zimmermann, A., Jha, A., Gadepally, V., D’Aquin, M., Sahay, R.: One size does not fit all: querying web polystores. IEEE Access 7, 9598–9617 (2019)CrossRef
10.
Zurück zum Zitat Quix, C., Hai, R., Vatov, I.: GEMMS: a generic and extensible metadata management system for data lakes. In: 2016 28th International Conference on Advanced Information Systems Engineering CAiSE, pp. 129–136 (2016) Quix, C., Hai, R., Vatov, I.: GEMMS: a generic and extensible metadata management system for data lakes. In: 2016 28th International Conference on Advanced Information Systems Engineering CAiSE, pp. 129–136 (2016)
11.
Zurück zum Zitat Samwald, M., et al.: Linked open drug data for pharmaceutical research and development. J. Cheminformatics 3(1), 19 (2011)CrossRef Samwald, M., et al.: Linked open drug data for pharmaceutical research and development. J. Cheminformatics 3(1), 19 (2011)CrossRef
12.
Zurück zum Zitat Scharffe, F., et al.: Enabling linked data publication with the Datalift platform. In: AAAI 2012, 26th Conference on Artificial Intelligence, W10: Semantic Cities, Toronto, Canada, July 2012 Scharffe, F., et al.: Enabling linked data publication with the Datalift platform. In: AAAI 2012, 26th Conference on Artificial Intelligence, W10: Semantic Cities, Toronto, Canada, July 2012
15.
Zurück zum Zitat Walker, C., Alrehamy, H.: Personal data lake with data gravity pull. In: 2015 IEEE Fifth International Conference on Big Data and Cloud Computing, BDCLOUD 2015, pp. 160–167, Washington, DC, USA. IEEE Computer Society (2015) Walker, C., Alrehamy, H.: Personal data lake with data gravity pull. In: 2015 IEEE Fifth International Conference on Big Data and Cloud Computing, BDCLOUD 2015, pp. 160–167, Washington, DC, USA. IEEE Computer Society (2015)
16.
Zurück zum Zitat Weiss, C., Karras, P., Bernstein, A.: Hexastore: sextuple indexing for semantic web data management. PVLDB 1(1), 1008–1019 (2008) Weiss, C., Karras, P., Bernstein, A.: Hexastore: sextuple indexing for semantic web data management. PVLDB 1(1), 1008–1019 (2008)
Metadaten
Titel
Ontario: Federated Query Processing Against a Semantic Data Lake
verfasst von
Kemele M. Endris
Philipp D. Rohde
Maria-Esther Vidal
Sören Auer
Copyright-Jahr
2019
DOI
https://doi.org/10.1007/978-3-030-27615-7_29

Premium Partner