Skip to main content

2017 | OriginalPaper | Buchkapitel

Comparison and Analysis of RDF Data Using SPARQL, HIVE, PIG in Hadoop

verfasst von : Anshul Chandel, Deepak Garg

Erschienen in: Computing and Network Sustainability

Verlag: Springer Singapore

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

In the modern generation of “Semantic Web Data”, cloud data services play a important role. These services are based on the MapReduce Programming Model. Hadoop is an open source implementation of MapReduce. Hadoop based extensions such as PIG and HIVE are query languages which provide high level data flow. Although SPARQL is considered as the backbone of the semantic web based applications but in this paper we introduce HIVE and PIG for querying RDF data. The goal of the paper is to compare the results of SPARQL, HIVE and PIG and analyze the retrieval time for a query in RDF data.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Schätzle A, Przyjaciel-Zablocki M, Lausen G (2011) PigSPARQL: mapping SPARQL to pig latin. In: Proceedings of the international workshop on semantic web information management. ACM Schätzle A, Przyjaciel-Zablocki M, Lausen G (2011) PigSPARQL: mapping SPARQL to pig latin. In: Proceedings of the international workshop on semantic web information management. ACM
2.
Zurück zum Zitat Anyanwu K, Kim H, Ravindra P (2013) Algebraic optimization for processing graph pattern queries in the cloud. Internet Comput IEEE 17(2):52–61CrossRef Anyanwu K, Kim H, Ravindra P (2013) Algebraic optimization for processing graph pattern queries in the cloud. Internet Comput IEEE 17(2):52–61CrossRef
3.
Zurück zum Zitat Lehmann J, Isele R, Jakob M, Jentzsch A, Kontokostas D, Mendes PN, Bizer C (2015) DBpedia–a large-scale, multilingual knowledge base extracted from Wikipedia. Semant Web 6(2):167–195 Lehmann J, Isele R, Jakob M, Jentzsch A, Kontokostas D, Mendes PN, Bizer C (2015) DBpedia–a large-scale, multilingual knowledge base extracted from Wikipedia. Semant Web 6(2):167–195
4.
Zurück zum Zitat Schätzle A, Przyjaciel-Zablocki M, Neu A, Lausen G (2014) Sempala: interactive SPARQL query processing on hadoop. In: The semantic Web– ISWC 2014. Springer International Publishing, pp 164–179 Schätzle A, Przyjaciel-Zablocki M, Neu A, Lausen G (2014) Sempala: interactive SPARQL query processing on hadoop. In: The semantic Web– ISWC 2014. Springer International Publishing, pp 164–179
5.
Zurück zum Zitat Thusoo A, Sarma JS, Jain N, Shao Z, Chakka P, Anthony S, Murthy R (2009) Hive: a warehousing solution over a map-reduce framework. Proc VLDB Endow 2(2):1626–1629CrossRef Thusoo A, Sarma JS, Jain N, Shao Z, Chakka P, Anthony S, Murthy R (2009) Hive: a warehousing solution over a map-reduce framework. Proc VLDB Endow 2(2):1626–1629CrossRef
6.
Zurück zum Zitat Quilitz B, Leser U (2008) Querying distributed RDF data sources with SPARQL. Springer, Heidelberg, pp 524–538 Quilitz B, Leser U (2008) Querying distributed RDF data sources with SPARQL. Springer, Heidelberg, pp 524–538
7.
Zurück zum Zitat Olston C, Reed B, Srivastava U, Kumar R, Tomkins A (2008) Pig latin: a not-so-foreign language for data processing. In Proceedings of the 2008 ACM SIGMOD international conference on Management of data (pp. 1099–1110). ACM Olston C, Reed B, Srivastava U, Kumar R, Tomkins A (2008) Pig latin: a not-so-foreign language for data processing. In Proceedings of the 2008 ACM SIGMOD international conference on Management of data (pp. 1099–1110). ACM
8.
Zurück zum Zitat Kim H, Ravindra P, Anyanwu K (2011) From sparql to mapreduce: the journey using a nested triplegroup algebra. Proc VLDB Endow 4(12):1426–1429 Kim H, Ravindra P, Anyanwu K (2011) From sparql to mapreduce: the journey using a nested triplegroup algebra. Proc VLDB Endow 4(12):1426–1429
9.
Zurück zum Zitat Ravindra P, Kim H, Anyanwu K (2011) An intermediate algebra for optimizing RDF graph pattern matching on MapReduce. In: The semantic web: research and applications. Springer, Heidelberg, pp 46–61 Ravindra P, Kim H, Anyanwu K (2011) An intermediate algebra for optimizing RDF graph pattern matching on MapReduce. In: The semantic web: research and applications. Springer, Heidelberg, pp 46–61
10.
Zurück zum Zitat Ismail AS, Al-Feel H, Mokhtar HM (2015) Querying DBpedia using HIVE-QL. In: Proceedings of the 14th international conference on telecommunications and informatics (TELE-INFO ‘15) proceedings of the 2nd international conference on power. pp 102–108 Ismail AS, Al-Feel H, Mokhtar HM (2015) Querying DBpedia using HIVE-QL. In: Proceedings of the 14th international conference on telecommunications and informatics (TELE-INFO ‘15) proceedings of the 2nd international conference on power. pp 102–108
11.
Zurück zum Zitat Ravindra, P., Hong, S., Kim, H., Anyanwu, K.: Efficient processing of RDF graph pattern matching on MapReduce platforms. In: Proceedings of the second international workshop on Data intensive computing in the clouds, ACM, 13–20(2011) Ravindra, P., Hong, S., Kim, H., Anyanwu, K.: Efficient processing of RDF graph pattern matching on MapReduce platforms. In: Proceedings of the second international workshop on Data intensive computing in the clouds, ACM, 13–20(2011)
12.
Zurück zum Zitat Arias M, Fernández JD, Martínez-Prieto MA, de la Fuente P (2011) An empirical study of real-world SPARQL queries Arias M, Fernández JD, Martínez-Prieto MA, de la Fuente P (2011) An empirical study of real-world SPARQL queries
13.
Zurück zum Zitat Thusoo A, Sarma JS, Jain N, Shao Z, Chakka P, Zhang N, Murthy R (2010) Hive-a petabyte scale data warehouse using hadoop. In: 2010 IEEE 26th International Conference on Data Engineering (ICDE). IEEE, pp 996–1005 Thusoo A, Sarma JS, Jain N, Shao Z, Chakka P, Zhang N, Murthy R (2010) Hive-a petabyte scale data warehouse using hadoop. In: 2010 IEEE 26th International Conference on Data Engineering (ICDE). IEEE, pp 996–1005
Metadaten
Titel
Comparison and Analysis of RDF Data Using SPARQL, HIVE, PIG in Hadoop
verfasst von
Anshul Chandel
Deepak Garg
Copyright-Jahr
2017
Verlag
Springer Singapore
DOI
https://doi.org/10.1007/978-981-10-3935-5_37

Neuer Inhalt