Skip to main content

2016 | OriginalPaper | Buchkapitel

LD-LEx: Linked Dataset Link Extractor (Short Paper)

verfasst von : Ciro Baron Neto, Dimitris Kontokostas, Gustavo Publio, Kay Müller, Sebastian Hellmann, Eduardo Moletta

Erschienen in: On the Move to Meaningful Internet Systems: OTM 2016 Conferences

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

With the steady growth of linked datasets available on the web, it becomes increasingly necessary the creation of efficient approaches for analyzing, search and discover links between RDF datasets. In this paper, we describe LD-LEx, an architecture that creates the possibility of indexing RDF datasets using GridFS documents and probabilistic data structures called Bloom filter. Hence, our lightweight approach provides metadata about quantity and quality of links between datasets. Moreover, we explored these concepts indexing more than 2 billion triples from over a thousand of datasets, providing insights of Bloom filters behavior w.r.t. performance and memory footprint.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Alexander, K., Hausenblas, M.: Describing linked datasets - on the design and usage of void, the vocabulary of interlinked datasets. In: Linked Data on the Web Workshop (LDOW 2009), in Conjunction with 18th International World Wide Web Conference (WWW 09) (2009) Alexander, K., Hausenblas, M.: Describing linked datasets - on the design and usage of void, the vocabulary of interlinked datasets. In: Linked Data on the Web Workshop (LDOW 2009), in Conjunction with 18th International World Wide Web Conference (WWW 09) (2009)
2.
Zurück zum Zitat Baron Neto, C., Müller, K., Brümmer, M., Kontokostas, D., Hellmann, S.: Lod-vader: an interface to lod visualization, analyticsand discovery in real-time. In: Proceedings of the 25th International Conference Companion on World Wide Web, WWW 2016 Companion. International World Wide Web Conferences (2016) Baron Neto, C., Müller, K., Brümmer, M., Kontokostas, D., Hellmann, S.: Lod-vader: an interface to lod visualization, analyticsand discovery in real-time. In: Proceedings of the 25th International Conference Companion on World Wide Web, WWW 2016 Companion. International World Wide Web Conferences (2016)
3.
Zurück zum Zitat Beek, W., Rietveld, L., Bazoobandi, H.R., Wielemaker, J., Schlobach, S.: LOD laundromat: a uniform way of publishing other people’s dirty data. In: Mika, P., et al. (eds.) ISWC 2014. LNCS, vol. 8796, pp. 213–228. Springer, Heidelberg (2014). doi:10.1007/978-3-319-11964-9_14 Beek, W., Rietveld, L., Bazoobandi, H.R., Wielemaker, J., Schlobach, S.: LOD laundromat: a uniform way of publishing other people’s dirty data. In: Mika, P., et al. (eds.) ISWC 2014. LNCS, vol. 8796, pp. 213–228. Springer, Heidelberg (2014). doi:10.​1007/​978-3-319-11964-9_​14
4.
Zurück zum Zitat Bloom, B.H.: Space/time trade-offs in hash coding with allowable errors. Commun. ACM 13(7), 422–426 (1970)CrossRefMATH Bloom, B.H.: Space/time trade-offs in hash coding with allowable errors. Commun. ACM 13(7), 422–426 (1970)CrossRefMATH
5.
Zurück zum Zitat Brümmer, M., Baron, C., Ermilov, I., Freudenberg, M., Kontokostas, D., Hellmann, S.: DataID: towards semantically rich metadata for complex datasets. In: Proceedings of the 10th International Conference on Semantic Systems, SEM 2014, pp. 84–91. ACM (2014) Brümmer, M., Baron, C., Ermilov, I., Freudenberg, M., Kontokostas, D., Hellmann, S.: DataID: towards semantically rich metadata for complex datasets. In: Proceedings of the 10th International Conference on Semantic Systems, SEM 2014, pp. 84–91. ACM (2014)
6.
7.
Zurück zum Zitat Hose, K., Schenkel, R.: Towards benefit-based RDF source selection for SPARQL queries. In: Proceedings of the 4th International Workshop on Semantic Web Information Management, SWIM 2012, pp. 2:1–2:8. ACM, New York (2012) Hose, K., Schenkel, R.: Towards benefit-based RDF source selection for SPARQL queries. In: Proceedings of the 4th International Workshop on Semantic Web Information Management, SWIM 2012, pp. 2:1–2:8. ACM, New York (2012)
8.
Zurück zum Zitat F. Maali and J. Erickson. Data Catalog Vocabulary (DCAT). W3C recommendation, W3C, January 2014 F. Maali and J. Erickson. Data Catalog Vocabulary (DCAT). W3C recommendation, W3C, January 2014
9.
Zurück zum Zitat Nentwig, M., Hartung, M., Ngomo, A.-C.N., Rahm, E.: A survey of current link discovery frameworks. In: Semantic Web, pp. 1–18 (2015) (Preprint) Nentwig, M., Hartung, M., Ngomo, A.-C.N., Rahm, E.: A survey of current link discovery frameworks. In: Semantic Web, pp. 1–18 (2015) (Preprint)
10.
Zurück zum Zitat Neto, C.B., Kontokostas, D., Hellmann, S., Müller, K., Brümmer, M.: Assessing quantity and quality of links between linked data datasets. In: Proceedings of the Workshop on Linked Data on the Web Co-located with the 25th International World Wide Web Conference (WWW 2016), April 2016 Neto, C.B., Kontokostas, D., Hellmann, S., Müller, K., Brümmer, M.: Assessing quantity and quality of links between linked data datasets. In: Proceedings of the Workshop on Linked Data on the Web Co-located with the 25th International World Wide Web Conference (WWW 2016), April 2016
11.
Zurück zum Zitat Oren, E., Guéret, C., Schlobach, S.: Anytime query answering in RDF through evolutionary algorithms. In: Sheth, A., Staab, S., Dean, M., Paolucci, M., Maynard, D., Finin, T., Thirunarayan, K. (eds.) ISWC 2008. LNCS, vol. 5318, pp. 98–113. Springer, Heidelberg (2008). doi:10.1007/978-3-540-88564-1_7 CrossRef Oren, E., Guéret, C., Schlobach, S.: Anytime query answering in RDF through evolutionary algorithms. In: Sheth, A., Staab, S., Dean, M., Paolucci, M., Maynard, D., Finin, T., Thirunarayan, K. (eds.) ISWC 2008. LNCS, vol. 5318, pp. 98–113. Springer, Heidelberg (2008). doi:10.​1007/​978-3-540-88564-1_​7 CrossRef
12.
Zurück zum Zitat Putze, F., Sanders, P., Singler, J.: Cache-, Hash-, and Space-effcient bloom filters 14, 4:4.4–4:4.18 (2010) Putze, F., Sanders, P., Singler, J.: Cache-, Hash-, and Space-effcient bloom filters 14, 4:4.4–4:4.18 (2010)
13.
Zurück zum Zitat Williams, G.T.: Supporting identity reasoning in SPARQL using bloom filters. In: Advancing Reasoning on the Web: Scalability and Commonsense (ARea 2008) (2008) Williams, G.T.: Supporting identity reasoning in SPARQL using bloom filters. In: Advancing Reasoning on the Web: Scalability and Commonsense (ARea 2008) (2008)
Metadaten
Titel
LD-LEx: Linked Dataset Link Extractor (Short Paper)
verfasst von
Ciro Baron Neto
Dimitris Kontokostas
Gustavo Publio
Kay Müller
Sebastian Hellmann
Eduardo Moletta
Copyright-Jahr
2016
DOI
https://doi.org/10.1007/978-3-319-48472-3_45