Skip to main content

2021 | OriginalPaper | Buchkapitel

Scalable Transformation of Big Geospatial Data into Linked Data

verfasst von : George Mandilaras, Manolis Koubarakis

Erschienen in: The Semantic Web – ISWC 2021

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

In the era of big data, a vast amount of geospatial data has become available originating from a large diversity of sources. In most cases, this data does not follow the linked data paradigm and the existing transformation tools have been proved ineffective due to the large volume and velocity of geospatial data. This is because none of the existing tools can utilize effectively the processing power of clusters of computers. We present the system GeoTriples-Spark which is able to massively transform big geospatial data into RDF graphs using Apache Spark. We evaluate GeoTriple-Spark’s performance and scalability in standalone and distributed environments and show that it exhibits superior performance and scalability when compared to all of its competitors.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
33
The system uses hyper-threading hence it has 16 physical cores.
 
Literatur
1.
Zurück zum Zitat Abdul, J., Alkathiri, M., Potdar, M.B.: Geospatial Hadoop (GS-Hadoop) an efficient mapreduce based engine for distributed processing of shapefiles. In: ICACCA (2016) Abdul, J., Alkathiri, M., Potdar, M.B.: Geospatial Hadoop (GS-Hadoop) an efficient mapreduce based engine for distributed processing of shapefiles. In: ICACCA (2016)
2.
Zurück zum Zitat Ali, W., Saleem, M., Yao, B., Hogan, A., Ngomo, A.N.: A Survey of RDF Stores & SPARQL Engines for Querying Knowledge Graphs. CoRR (2021) Ali, W., Saleem, M., Yao, B., Hogan, A., Ngomo, A.N.: A Survey of RDF Stores & SPARQL Engines for Querying Knowledge Graphs. CoRR (2021)
3.
Zurück zum Zitat Auer, S., Lehmann, J., Hellmann, S.: LinkedGeoData: adding a spatial dimension to the web of data. In: ISWC (2009) Auer, S., Lehmann, J., Hellmann, S.: LinkedGeoData: adding a spatial dimension to the web of data. In: ISWC (2009)
4.
Zurück zum Zitat Bereta, K., et al.: The copernicus app lab project: easy access to copernicus data. In: EDBT (2019) Bereta, K., et al.: The copernicus app lab project: easy access to copernicus data. In: EDBT (2019)
5.
Zurück zum Zitat Bereta, K., Koubarakis, M.: Ontop of geospatial databases. In: ISWC (2016) Bereta, K., Koubarakis, M.: Ontop of geospatial databases. In: ISWC (2016)
6.
Zurück zum Zitat Bereta, K., Koubarakis, M.: Creating virtual semantic graphs on top of big data from space. In: BiDS (2017) Bereta, K., Koubarakis, M.: Creating virtual semantic graphs on top of big data from space. In: BiDS (2017)
7.
Zurück zum Zitat Bilidas, D., Ioannidis, T., Mamoulis, N., Koubarakis, M.: Efficient storage and querying for big linked geospatial data: the system Strabo 2. Manuscript in preparation (2021) Bilidas, D., Ioannidis, T., Mamoulis, N., Koubarakis, M.: Efficient storage and querying for big linked geospatial data: the system Strabo 2. Manuscript in preparation (2021)
8.
Zurück zum Zitat Blower, J., Clifford, D., Goncalves, P., Koubarakis, M.: The MELODIES project: integrating diverse data using linked data and cloud computing. In: BiDS (2014) Blower, J., Clifford, D., Goncalves, P., Koubarakis, M.: The MELODIES project: integrating diverse data using linked data and cloud computing. In: BiDS (2014)
9.
Zurück zum Zitat Burgstaller, S., et al.: LEOpatra: a mobile application for smart fertilization based on Linked Data. In: HAICTA (2017) Burgstaller, S., et al.: LEOpatra: a mobile application for smart fertilization based on Linked Data. In: HAICTA (2017)
10.
Zurück zum Zitat Chentout, K., Vaisman, A.A.: Adding spatial support to R2RML mappings. In: OTM Workshops (2013) Chentout, K., Vaisman, A.A.: Adding spatial support to R2RML mappings. In: OTM Workshops (2013)
11.
Zurück zum Zitat Dimou, A., Sande, M.V., Colpaert, P., Verborgh, R., Mannens, E., de Walle, R.V.: RML: a generic language for integrated RDF mappings of heterogeneous data. In: LDOW (2014) Dimou, A., Sande, M.V., Colpaert, P., Verborgh, R., Mannens, E., de Walle, R.V.: RML: a generic language for integrated RDF mappings of heterogeneous data. In: LDOW (2014)
13.
Zurück zum Zitat Hoffart, J., Suchanek, F.M., Berberich, K., Weikum, G.: YAGO2: A Spatially and Temporally Enhanced Knowledge Base from Wikipedia (2013) Hoffart, J., Suchanek, F.M., Berberich, K., Weikum, G.: YAGO2: A Spatially and Temporally Enhanced Knowledge Base from Wikipedia (2013)
15.
Zurück zum Zitat Ismail, M., Gebremeskel, E., Kakantousis, T., Berthou, G., Dowling, J.: Hopsworks: improving user experience and development on hadoop with scalable. ICDCS, strongly consistent metadata. In: 2017 IEEE 37th International Conference on Distributed Computing Systems (ICDCS) (2017) Ismail, M., Gebremeskel, E., Kakantousis, T., Berthou, G., Dowling, J.: Hopsworks: improving user experience and development on hadoop with scalable. ICDCS, strongly consistent metadata. In: 2017 IEEE 37th International Conference on Distributed Computing Systems (ICDCS) (2017)
16.
Zurück zum Zitat Kaoudi, Z., Manolescu, I., Zampetakis, S.: Cloud-Based RDF Data Management (2020) Kaoudi, Z., Manolescu, I., Zampetakis, S.: Cloud-Based RDF Data Management (2020)
17.
Zurück zum Zitat Karalis, N., Mandilaras, G.M., Koubarakis, M.: Extending the YAGO2 knowledge graph with precise geospatial knowledge. In: ISWC (2019) Karalis, N., Mandilaras, G.M., Koubarakis, M.: Extending the YAGO2 knowledge graph with precise geospatial knowledge. In: ISWC (2019)
18.
Zurück zum Zitat Koubarakis, M., et al.: From copernicus big data to extreme earth analytics. In: EDBT (2019) Koubarakis, M., et al.: From copernicus big data to extreme earth analytics. In: EDBT (2019)
19.
Zurück zum Zitat Kyzirakos, K., et al.: The spatiotemporal RDF store strabon. In: SSTD (2013) Kyzirakos, K., et al.: The spatiotemporal RDF store strabon. In: SSTD (2013)
20.
Zurück zum Zitat Kyzirakos, K., et al.: Wildfire monitoring using satellite images, ontologies and Linked Geospatial Data. J. Web Semant. 24, 18–26 (2014) Kyzirakos, K., et al.: Wildfire monitoring using satellite images, ontologies and Linked Geospatial Data. J. Web Semant. 24, 18–26 (2014)
21.
Zurück zum Zitat Kyzirakos, K., et al.: GeoTriples: transforming geospatial data into RDF graphs using R2RML and RML mappings. J. Web Semant. 52, 16–32 (2018) Kyzirakos, K., et al.: GeoTriples: transforming geospatial data into RDF graphs using R2RML and RML mappings. J. Web Semant. 52, 16–32 (2018)
22.
Zurück zum Zitat Kyzirakos, K., Vlachopoulos, I., Savva, D., Manegold, S., Koubarakis, M.: GeoTriples: a tool for publishing geospatial data as RDF graphs using R2RML mappings. In: ISWC Posters (2014) Kyzirakos, K., Vlachopoulos, I., Savva, D., Manegold, S., Koubarakis, M.: GeoTriples: a tool for publishing geospatial data as RDF graphs using R2RML mappings. In: ISWC Posters (2014)
23.
Zurück zum Zitat de León, A., Saquicela, V., Vilches, L.M., Villazón-Terrazas, B., Priyatna, F., Corcho, O.: Geographical linked data: a spanish use case. In: I-SEMANTICS (2010) de León, A., Saquicela, V., Vilches, L.M., Villazón-Terrazas, B., Priyatna, F., Corcho, O.: Geographical linked data: a spanish use case. In: I-SEMANTICS (2010)
24.
Zurück zum Zitat Mandilaras, G., Pantazi, D.A., Koubarakis, M., Hughes, N., Everett, A., Kiærbech, A.: Ice monitoring with extremeearth. In: LASCAR (2020) Mandilaras, G., Pantazi, D.A., Koubarakis, M., Hughes, N., Everett, A., Kiærbech, A.: Ice monitoring with extremeearth. In: LASCAR (2020)
25.
Zurück zum Zitat Niazi, S., Ismail, M., Haridi, S., Dowling, J., Grohsschmiedt, S., Ronström, M.: HopsFS: scaling hierarchical file system metadata using NewSQL databases. In: FAST (2017) Niazi, S., Ismail, M., Haridi, S., Dowling, J., Grohsschmiedt, S., Ronström, M.: HopsFS: scaling hierarchical file system metadata using NewSQL databases. In: FAST (2017)
26.
Zurück zum Zitat Nikolaou, C., et al.: Sextant: visualizing time-evolving linked geospatial data. J. Web Semant. 35, 35–52 (2015) Nikolaou, C., et al.: Sextant: visualizing time-evolving linked geospatial data. J. Web Semant. 35, 35–52 (2015)
27.
Zurück zum Zitat Papadakis, G.A., Mandilaras, G., Nikos, M., Koubarakis, M.: Progressive, holistic geospatial interlinking. In: Web Conference (2021) Papadakis, G.A., Mandilaras, G., Nikos, M., Koubarakis, M.: Progressive, holistic geospatial interlinking. In: Web Conference (2021)
28.
Zurück zum Zitat Patroumpas, K., Alexakis, M., Giannopoulos, G., Athanasiou, S.: TripleGeo: an ETL Tool for transforming geospatial data into RDF triples. In: EDBT/ICDT (2014) Patroumpas, K., Alexakis, M., Giannopoulos, G., Athanasiou, S.: TripleGeo: an ETL Tool for transforming geospatial data into RDF triples. In: EDBT/ICDT (2014)
29.
Zurück zum Zitat Patroumpas, K., Skoutas, D., Mandilaras, G.M., Giannopoulos, G., Athanasiou, S.: Exposing points of interest as linked geospatial data. In: SSTD (2019) Patroumpas, K., Skoutas, D., Mandilaras, G.M., Giannopoulos, G., Athanasiou, S.: Exposing points of interest as linked geospatial data. In: SSTD (2019)
30.
Zurück zum Zitat Sherif, M.A., Dreßler, K., Smeros, P., Ngomo, A.N.: Radon - rapid discovery of topological relations. In: AAAI (2017) Sherif, M.A., Dreßler, K., Smeros, P., Ngomo, A.N.: Radon - rapid discovery of topological relations. In: AAAI (2017)
31.
Zurück zum Zitat Smeros, P., Koubarakis, M.: Discovering spatial and temporal links among RDF data. In: LDOW (2016) Smeros, P., Koubarakis, M.: Discovering spatial and temporal links among RDF data. In: LDOW (2016)
32.
Zurück zum Zitat Yu, J., Wu, J., Sarwat, M.: GeoSpark: a cluster computing framework for processing large-scale spatial data. In: SIGSPATIAL (2015) Yu, J., Wu, J., Sarwat, M.: GeoSpark: a cluster computing framework for processing large-scale spatial data. In: SIGSPATIAL (2015)
33.
Zurück zum Zitat Zaharia, M., et al.: Resilient distributed datasets: a fault-tolerant abstraction for in-memory cluster computing. In: USENIX (2012) Zaharia, M., et al.: Resilient distributed datasets: a fault-tolerant abstraction for in-memory cluster computing. In: USENIX (2012)
34.
Zurück zum Zitat Zaharia, M., et al.: Apache spark: a unified engine for big data processing. Commun. ACM 59(11), 56–65 (2016) Zaharia, M., et al.: Apache spark: a unified engine for big data processing. Commun. ACM 59(11), 56–65 (2016)
Metadaten
Titel
Scalable Transformation of Big Geospatial Data into Linked Data
verfasst von
George Mandilaras
Manolis Koubarakis
Copyright-Jahr
2021
DOI
https://doi.org/10.1007/978-3-030-88361-4_28

Premium Partner