Skip to main content

2020 | OriginalPaper | Buchkapitel

Leveraging Pattern Mining Techniques for Efficient Keyword Search on Data Graphs

verfasst von : Xinge Lu, Dimitri Theodoratos, Aggeliki Dimitriou

Erschienen in: Web Information Systems Engineering

Verlag: Springer Singapore

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Graphs model complex relationships among objects in a variety of web applications. Keyword search is a promising method for extraction of data from data graphs and exploration. However, keyword search faces the so called performance scalability problem which hinders its widespread use on data graphs.
In this paper, we address the performance scalability problem by leveraging techniques developed for graph pattern mining. We focus on avoiding the generation of redundant intermediate results when the keyword queries are evaluated. We define a canonical form for the isomorphic representations of the intermediate results and we show how it can be checked incrementally and efficiently. We devise rules that prune the search space without sacrificing completeness and we integrate them in a query evaluation algorithm. Our experimental results show that our approach outperforms previous ones by orders of magnitude and displays smooth scalability.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Agrawal, S., Chaudhuri, S., Das, G.: DBXplorer: a system for keyword-based search over relational databases. In: IEEE ICDE, pp. 5–16 (2002) Agrawal, S., Chaudhuri, S., Das, G.: DBXplorer: a system for keyword-based search over relational databases. In: IEEE ICDE, pp. 5–16 (2002)
2.
Zurück zum Zitat Bao, Z., Zeng, Y., Jagadish, H.V., Ling, T.W.: Exploratory keyword search with interactive input. In: ACM SIGMOD, pp. 871–876 (2015) Bao, Z., Zeng, Y., Jagadish, H.V., Ling, T.W.: Exploratory keyword search with interactive input. In: ACM SIGMOD, pp. 871–876 (2015)
3.
Zurück zum Zitat Bhalotia, G., Hulgeri, A., Nakhe, C., Chakrabarti, S., Sudarshan, S.: Keyword searching and browsing in databases using banks. In: ICDE, pp. 431–440 (2002) Bhalotia, G., Hulgeri, A., Nakhe, C., Chakrabarti, S., Sudarshan, S.: Keyword searching and browsing in databases using banks. In: ICDE, pp. 431–440 (2002)
5.
Zurück zum Zitat Dimitriou, A., Theodoratos, D., Sellis, T.K.: Top-k-size keyword search on tree structured data. Inf. Syst. 47, 178–193 (2015)CrossRef Dimitriou, A., Theodoratos, D., Sellis, T.K.: Top-k-size keyword search on tree structured data. Inf. Syst. 47, 178–193 (2015)CrossRef
6.
Zurück zum Zitat Elbassuoni, S., Blanco, R.: Keyword search over RDF graphs. In: ACM CIKM, pp. 237–242 (2011) Elbassuoni, S., Blanco, R.: Keyword search over RDF graphs. In: ACM CIKM, pp. 237–242 (2011)
7.
Zurück zum Zitat Feng, J., Li, G., Wang, J.: Finding top-k answers in keyword search over relational databases using tuple units. IEEE ICDE 23(12), 1781–1794 (2011) Feng, J., Li, G., Wang, J.: Finding top-k answers in keyword search over relational databases using tuple units. IEEE ICDE 23(12), 1781–1794 (2011)
8.
Zurück zum Zitat Golenberg, K., Kimelfeld, B., Sagiv, Y.: Keyword proximity search in complex data graphs. In: Proceedings of the ACM SIGMOD, pp. 927–940 (2008) Golenberg, K., Kimelfeld, B., Sagiv, Y.: Keyword proximity search in complex data graphs. In: Proceedings of the ACM SIGMOD, pp. 927–940 (2008)
9.
Zurück zum Zitat He, H., Wang, H., Yang, J., Yu, P.S.: BLINKS: ranked keyword searches on graphs. In: ACM SIGMOD, pp. 305–316 (2007) He, H., Wang, H., Yang, J., Yu, P.S.: BLINKS: ranked keyword searches on graphs. In: ACM SIGMOD, pp. 305–316 (2007)
10.
Zurück zum Zitat Hristidis, V., Gravano, L., Papakonstantinou, Y.: Efficient ir-style keyword search over relational databases. In: VLDB, pp. 850–861 (2003) Hristidis, V., Gravano, L., Papakonstantinou, Y.: Efficient ir-style keyword search over relational databases. In: VLDB, pp. 850–861 (2003)
11.
Zurück zum Zitat Hristidis, V., Papakonstantinou, Y.: DISCOVER: keyword search in relational databases. In: VLDB, pp. 670–681 (2002) Hristidis, V., Papakonstantinou, Y.: DISCOVER: keyword search in relational databases. In: VLDB, pp. 670–681 (2002)
12.
Zurück zum Zitat Kacholia, V., Pandit, S., Chakrabarti, S., Sudarshan, S., Desai, R., Karambelkar, H.: Bidirectional expansion for keyword search on graph databases. In: VLDB, pp. 505–516 (2005) Kacholia, V., Pandit, S., Chakrabarti, S., Sudarshan, S., Desai, R., Karambelkar, H.: Bidirectional expansion for keyword search on graph databases. In: VLDB, pp. 505–516 (2005)
13.
Zurück zum Zitat Kargar, M., An, A., Cercone, N., Godfrey, P., Szlichta, J., Yu, X.: Meaningful keyword search in relational databases with large and complex schema. In: IEEE ICDE, pp. 411–422 (2015) Kargar, M., An, A., Cercone, N., Godfrey, P., Szlichta, J., Yu, X.: Meaningful keyword search in relational databases with large and complex schema. In: IEEE ICDE, pp. 411–422 (2015)
14.
Zurück zum Zitat Le, T.N., Ling, T.W.: Survey on keyword search over XML documents. SIGMOD Rec. 45(3), 17–28 (2016)CrossRef Le, T.N., Ling, T.W.: Survey on keyword search over XML documents. SIGMOD Rec. 45(3), 17–28 (2016)CrossRef
15.
Zurück zum Zitat Liu, F. Yu, C., Meng, W., Chowdhury, A.: Effective keyword search in relational databases. In: ACM SIGMOD, pp. 563–574 (2006) Liu, F. Yu, C., Meng, W., Chowdhury, A.: Effective keyword search in relational databases. In: ACM SIGMOD, pp. 563–574 (2006)
16.
Zurück zum Zitat Liu, Z., Chen, Y.: Processing keyword search on XML: a survey. World Wide Web 14(5–6), 671–707 (2011)CrossRef Liu, Z., Chen, Y.: Processing keyword search on XML: a survey. World Wide Web 14(5–6), 671–707 (2011)CrossRef
17.
Zurück zum Zitat Markowetz, A., Yang, Y., Papadias, D.: Keyword search on relational data streams. In: ACM SIGMOD, pp. 605–616 (2007) Markowetz, A., Yang, Y., Papadias, D.: Keyword search on relational data streams. In: ACM SIGMOD, pp. 605–616 (2007)
18.
Zurück zum Zitat Nijssen, S., Kok, J.N.: Efficient discovery of frequent unordered trees. In: MGTS, pp. 55–64 (2003) Nijssen, S., Kok, J.N.: Efficient discovery of frequent unordered trees. In: MGTS, pp. 55–64 (2003)
19.
Zurück zum Zitat Zaki, M.J.: Efficiently mining frequent trees in a forest. In: ACM SIGKDD, pp. 71–80 (2002) Zaki, M.J.: Efficiently mining frequent trees in a forest. In: ACM SIGKDD, pp. 71–80 (2002)
20.
Zurück zum Zitat Zaki, M.J.: Efficiently mining frequent embedded unordered trees. Fundam. Inform. 66(1–2), 33–52 (2005)MathSciNetMATH Zaki, M.J.: Efficiently mining frequent embedded unordered trees. Fundam. Inform. 66(1–2), 33–52 (2005)MathSciNetMATH
Metadaten
Titel
Leveraging Pattern Mining Techniques for Efficient Keyword Search on Data Graphs
verfasst von
Xinge Lu
Dimitri Theodoratos
Aggeliki Dimitriou
Copyright-Jahr
2020
Verlag
Springer Singapore
DOI
https://doi.org/10.1007/978-981-15-3281-8_10