Skip to main content
Erschienen in:
Buchtitelbild

2017 | OriginalPaper | Buchkapitel

Traffic Analytics for Linked Data Publishers

verfasst von : Luca Costabello, Pierre-Yves Vandenbussche, Gofran Shukair, Corine Deliot, Neil Wilson

Erschienen in: The Semantic Web

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

We present a traffic analytics platform for servers that publish Linked Data. To the best of our knowledge, this is the first system that mines access logs of registered Linked Data servers to extract traffic insights on daily basis and without human intervention. The framework extracts Linked Data-specific traffic metrics from log records of HTTP lookups and SPARQL queries, and provides insights not available in traditional web analytics tools. Among all, we detect visitor sessions with a variant of hierarchical agglomerative clustering. We also identify workload peaks of SPARQL endpoints by detecting heavy and light SPARQL queries with supervised learning. The platform has been tested on 13 months of access logs of the British National Bibliography RDF dataset.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Arlitt, M.: Characterizing web user sessions. ACM SIGMETRICS Perform. Eval. Rev. 28(2), 50–63 (2000)CrossRef Arlitt, M.: Characterizing web user sessions. ACM SIGMETRICS Perform. Eval. Rev. 28(2), 50–63 (2000)CrossRef
2.
Zurück zum Zitat Buil-Aranda, C., Hogan, A., Umbrich, J., Vandenbussche, P.-Y.: SPARQL web-querying infrastructure: Ready for action? In: Alani, H., Kagal, L., Fokoue, A., Groth, P., Biemann, C., Parreira, J.X., Aroyo, L., Noy, N., Welty, C., Janowicz, K. (eds.) ISWC 2013. LNCS, vol. 8219, pp. 277–293. Springer, Heidelberg (2013). doi:10.1007/978-3-642-41338-4_18CrossRef Buil-Aranda, C., Hogan, A., Umbrich, J., Vandenbussche, P.-Y.: SPARQL web-querying infrastructure: Ready for action? In: Alani, H., Kagal, L., Fokoue, A., Groth, P., Biemann, C., Parreira, J.X., Aroyo, L., Noy, N., Welty, C., Janowicz, K. (eds.) ISWC 2013. LNCS, vol. 8219, pp. 277–293. Springer, Heidelberg (2013). doi:10.​1007/​978-3-642-41338-4_​18CrossRef
3.
Zurück zum Zitat Costabello, L., Vandenbussche, P., Shukair, G., Deliot, C., Wilson, N.: Access logs don’t lie: Towards traffic analytics for linked data publishers. In: Proceedings of ISWC Posters & Demos Track (2016) Costabello, L., Vandenbussche, P., Shukair, G., Deliot, C., Wilson, N.: Access logs don’t lie: Towards traffic analytics for linked data publishers. In: Proceedings of ISWC Posters & Demos Track (2016)
4.
Zurück zum Zitat Demartini, G., Enchev, I., Wylot, M., Gapany, J., Cudré-Mauroux, P.: BowlognaBench—Benchmarking RDF analytics. In: Aberer, K., Damiani, E., Dillon, T. (eds.) SIMPDA 2011. LNBIP, vol. 116, pp. 82–102. Springer, Heidelberg (2012). doi:10.1007/978-3-642-34044-4_5CrossRef Demartini, G., Enchev, I., Wylot, M., Gapany, J., Cudré-Mauroux, P.: BowlognaBench—Benchmarking RDF analytics. In: Aberer, K., Damiani, E., Dillon, T. (eds.) SIMPDA 2011. LNBIP, vol. 116, pp. 82–102. Springer, Heidelberg (2012). doi:10.​1007/​978-3-642-34044-4_​5CrossRef
5.
Zurück zum Zitat Dividino, R., Gröner, G.: Which of the following SPARQL queries are similar? why? In: Proceedings of LD4IE Workshop (2013) Dividino, R., Gröner, G.: Which of the following SPARQL queries are similar? why? In: Proceedings of LD4IE Workshop (2013)
6.
Zurück zum Zitat Fasel, D., Zumstein, D.: A fuzzy data warehouse approach for web analytics. In: Lytras, M.D., Damiani, E., Carroll, J.M., Tennyson, R.D., Avison, D., Naeve, A., Dale, A., Lefrere, P., Tan, F., Sipior, J., Vossen, G. (eds.) WSKS 2009. LNCS (LNAI), vol. 5736, pp. 276–285. Springer, Heidelberg (2009). doi:10.1007/978-3-642-04754-1_29CrossRef Fasel, D., Zumstein, D.: A fuzzy data warehouse approach for web analytics. In: Lytras, M.D., Damiani, E., Carroll, J.M., Tennyson, R.D., Avison, D., Naeve, A., Dale, A., Lefrere, P., Tan, F., Sipior, J., Vossen, G. (eds.) WSKS 2009. LNCS (LNAI), vol. 5736, pp. 276–285. Springer, Heidelberg (2009). doi:10.​1007/​978-3-642-04754-1_​29CrossRef
7.
Zurück zum Zitat Gallego, M.A., Fernández, J.D., Martínez-Prieto, M.A., de la Fuente, P.: An empirical study of real-world SPARQL queries. In: Proceedings of USEWOD (2011) Gallego, M.A., Fernández, J.D., Martínez-Prieto, M.A., de la Fuente, P.: An empirical study of real-world SPARQL queries. In: Proceedings of USEWOD (2011)
8.
Zurück zum Zitat Halfaker, A., Keyes, O., Kluver, D., Thebault-Spieker, J., Nguyen, T., Shores, K., Uduwage, A., Warncke-Wang, M.: User session identification based on strong regularities in inter-activity time. In: Proceedings of WWW, pp. 410–418 (2015) Halfaker, A., Keyes, O., Kluver, D., Thebault-Spieker, J., Nguyen, T., Shores, K., Uduwage, A., Warncke-Wang, M.: User session identification based on strong regularities in inter-activity time. In: Proceedings of WWW, pp. 410–418 (2015)
9.
Zurück zum Zitat Hasan, R., Gandon, F.: A machine learning approach to SPARQL query performance prediction. In: Proceedings of WI, vol. 1, pp. 266–273. IEEE (2014) Hasan, R., Gandon, F.: A machine learning approach to SPARQL query performance prediction. In: Proceedings of WI, vol. 1, pp. 266–273. IEEE (2014)
10.
Zurück zum Zitat Heath, T., Bizer, C.: Linked Data: Evolving the Web into a Global Data Space. Synthesis Lectures on the Semantic Web. Morgan & Claypool, Palo Alto (2011) Heath, T., Bizer, C.: Linked Data: Evolving the Web into a Global Data Space. Synthesis Lectures on the Semantic Web. Morgan & Claypool, Palo Alto (2011)
12.
Zurück zum Zitat Mehrzadi, D., Feitelson, D.G.: On extracting session data from activity logs. In: Proceedings of ISS, p. 3. ACM (2012) Mehrzadi, D., Feitelson, D.G.: On extracting session data from activity logs. In: Proceedings of ISS, p. 3. ACM (2012)
13.
Zurück zum Zitat Möller, K., Hausenblas, K., Cyganiak, R., Handschuh, S.: Learning from linked open data usage: Patterns & metrics. In: Proceedings of Web Science (2010) Möller, K., Hausenblas, K., Cyganiak, R., Handschuh, S.: Learning from linked open data usage: Patterns & metrics. In: Proceedings of Web Science (2010)
14.
Zurück zum Zitat Murray, G.C., Lin, J., Chowdhury, A.: Identification of user sessions with hierarchical agglomerative clustering. In: ASIS&T, vol. 43(1), 1–9 (2006)CrossRef Murray, G.C., Lin, J., Chowdhury, A.: Identification of user sessions with hierarchical agglomerative clustering. In: ASIS&T, vol. 43(1), 1–9 (2006)CrossRef
15.
Zurück zum Zitat Pallis, G., Angelis, L., Vakali, A.: Model-based cluster analysis for web users sessions. In: Hacid, M.-S., Murray, N.V., Raś, Z.W., Tsumoto, S. (eds.) ISMIS 2005. LNCS (LNAI), vol. 3488, pp. 219–227. Springer, Heidelberg (2005). doi:10.1007/11425274_23CrossRef Pallis, G., Angelis, L., Vakali, A.: Model-based cluster analysis for web users sessions. In: Hacid, M.-S., Murray, N.V., Raś, Z.W., Tsumoto, S. (eds.) ISMIS 2005. LNCS (LNAI), vol. 3488, pp. 219–227. Springer, Heidelberg (2005). doi:10.​1007/​11425274_​23CrossRef
16.
Zurück zum Zitat Pérez, J., Arenas, M., Gutierrez, C.: Semantics and complexity of SPARQL. In: Cruz, I., Decker, S., Allemang, D., Preist, C., Schwabe, D., Mika, P., Uschold, M., Aroyo, L.M. (eds.) ISWC 2006. LNCS, vol. 4273, pp. 30–43. Springer, Heidelberg (2006). doi:10.1007/11926078_3CrossRef Pérez, J., Arenas, M., Gutierrez, C.: Semantics and complexity of SPARQL. In: Cruz, I., Decker, S., Allemang, D., Preist, C., Schwabe, D., Mika, P., Uschold, M., Aroyo, L.M. (eds.) ISWC 2006. LNCS, vol. 4273, pp. 30–43. Springer, Heidelberg (2006). doi:10.​1007/​11926078_​3CrossRef
17.
Zurück zum Zitat Petridou, S.G., Koutsonikola, V.A., Vakali, A.I., Papadimitriou, G.I.: Time-aware web users’ clustering. IEEE Trans. Knowl. Data Eng. 20(5), 653–667 (2008)CrossRef Petridou, S.G., Koutsonikola, V.A., Vakali, A.I., Papadimitriou, G.I.: Time-aware web users’ clustering. IEEE Trans. Knowl. Data Eng. 20(5), 653–667 (2008)CrossRef
18.
Zurück zum Zitat Picalausa, F., Vansummeren, S.: What are real SPARQL queries like? In: Proceedings of SWIM, p. 7. ACM (2011) Picalausa, F., Vansummeren, S.: What are real SPARQL queries like? In: Proceedings of SWIM, p. 7. ACM (2011)
19.
Zurück zum Zitat Schmidt, M., Meier, M., Lausen, G.: Foundations of SPARQL query optimization. In: ICDT, pp. 4–33. ACM (2010) Schmidt, M., Meier, M., Lausen, G.: Foundations of SPARQL query optimization. In: ICDT, pp. 4–33. ACM (2010)
20.
Zurück zum Zitat Ye, C., Wilson, M.L., Rodden, T.: Develop, implement, and improve a web session detection model. In: Proceedings of IIiX, pp. 336–338. ACM (2014) Ye, C., Wilson, M.L., Rodden, T.: Develop, implement, and improve a web session detection model. In: Proceedings of IIiX, pp. 336–338. ACM (2014)
Metadaten
Titel
Traffic Analytics for Linked Data Publishers
verfasst von
Luca Costabello
Pierre-Yves Vandenbussche
Gofran Shukair
Corine Deliot
Neil Wilson
Copyright-Jahr
2017
DOI
https://doi.org/10.1007/978-3-319-58068-5_1

Neuer Inhalt