Skip to main content

2019 | OriginalPaper | Buchkapitel

Learning DMEs from Positive and Negative Examples

verfasst von : Yeting Li, Chunmei Dong, Xinyu Chu, Haiming Chen

Erschienen in: Database Systems for Advanced Applications

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

The presence of a schema for XML documents has numerous advantages. Unfortunately, many XML documents in practice are not accompanied by a (valid) schema. Therefore, it is essential to devise algorithms to infer schemas from XML documents. The fundamental task in XML schema inference is learning regular expressions. In this paper we consider unordered XML, where the relative order among siblings is ignored, and focus on the subclass called disjunctive multiplicity expressions (DMEs) which are proposed for unordered XML. Previous work in this direction lacks inference algorithms that support for learning DME from both positive and negative examples. In this paper, we provide an algorithm to learn DMEs from both positive and negative examples based on genetic algorithms.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Unordered concatenation can be viewed as a weaker form of interleaving.
 
Literatur
1.
Zurück zum Zitat Abiteboul, S., Bourhis, P., Vianu, V.: Highly expressive query languages for unordered data trees. Theory Comput. Syst. 57(4), 927–966 (2015)MathSciNetCrossRef Abiteboul, S., Bourhis, P., Vianu, V.: Highly expressive query languages for unordered data trees. Theory Comput. Syst. 57(4), 927–966 (2015)MathSciNetCrossRef
2.
Zurück zum Zitat Benedikt, M., Fan, W., Geerts, F.: Xpath satisfiability in the presence of DTDs. J. ACM 55(2), 8:1–8:79 (2008)MathSciNetCrossRef Benedikt, M., Fan, W., Geerts, F.: Xpath satisfiability in the presence of DTDs. J. ACM 55(2), 8:1–8:79 (2008)MathSciNetCrossRef
3.
Zurück zum Zitat Bex, G.J., Neven, F., Vansummeren, S.: Inferring XML schema definitions from XML Data. In: Proceedings of the 33rd International Conference on VLDB, pp. 998–1009 (2007) Bex, G.J., Neven, F., Vansummeren, S.: Inferring XML schema definitions from XML Data. In: Proceedings of the 33rd International Conference on VLDB, pp. 998–1009 (2007)
4.
Zurück zum Zitat Boneva, I., Ciucanu, R., Staworko, S.: Simple schemas for unordered XML. In: Proceedings of the 16th International Conference on WebDB, pp. 13–18 (2013) Boneva, I., Ciucanu, R., Staworko, S.: Simple schemas for unordered XML. In: Proceedings of the 16th International Conference on WebDB, pp. 13–18 (2013)
5.
Zurück zum Zitat Che, D., Aberer, K., Özsu, M.T.: Query optimization in XML structured-document databases. J. VLDB 15(3), 263–289 (2006)CrossRef Che, D., Aberer, K., Özsu, M.T.: Query optimization in XML structured-document databases. J. VLDB 15(3), 263–289 (2006)CrossRef
6.
Zurück zum Zitat Ciucanu, R., Staworko, S.: Learning schemas for unordered XML. In: Proceedings of the 14th International Conference on DBPL (2013) Ciucanu, R., Staworko, S.: Learning schemas for unordered XML. In: Proceedings of the 14th International Conference on DBPL (2013)
8.
Zurück zum Zitat Grijzenhout, S., Marx, M.: The quality of the XML Web. J. Web Sem 19, 59–68 (2013)CrossRef Grijzenhout, S., Marx, M.: The quality of the XML Web. J. Web Sem 19, 59–68 (2013)CrossRef
11.
Zurück zum Zitat Martens, W., Neven, F.: Frontiers of tractability for typechecking simple XML transformations. In: Proceedings of the 23rd International Conference on PODS, pp. 23–34 (2004) Martens, W., Neven, F.: Frontiers of tractability for typechecking simple XML transformations. In: Proceedings of the 23rd International Conference on PODS, pp. 23–34 (2004)
13.
Zurück zum Zitat Staworko, S., Boneva, I., Gayo, J.E.L., Hym, S., Prud’hommeaux, E.G., Solbrig, H.R.: Complexity and expressiveness of shex for RDF. In: Proceedings of the 18th International Conference on ICDT, pp. 195–211 (2015) Staworko, S., Boneva, I., Gayo, J.E.L., Hym, S., Prud’hommeaux, E.G., Solbrig, H.R.: Complexity and expressiveness of shex for RDF. In: Proceedings of the 18th International Conference on ICDT, pp. 195–211 (2015)
14.
Zurück zum Zitat Zhang, X., Li, Y., Cui, F., Dong, C., Chen, H.: Inference of a concise regular expression considering interleaving from XML documents. In: Phung, D., Tseng, V.S., Webb, G.I., Ho, B., Ganji, M., Rashidi, L. (eds.) PAKDD 2018. LNCS (LNAI), vol. 10938, pp. 389–401. Springer, Cham (2018). https://doi.org/10.1007/978-3-319-93037-4_31CrossRef Zhang, X., Li, Y., Cui, F., Dong, C., Chen, H.: Inference of a concise regular expression considering interleaving from XML documents. In: Phung, D., Tseng, V.S., Webb, G.I., Ho, B., Ganji, M., Rashidi, L. (eds.) PAKDD 2018. LNCS (LNAI), vol. 10938, pp. 389–401. Springer, Cham (2018). https://​doi.​org/​10.​1007/​978-3-319-93037-4_​31CrossRef
Metadaten
Titel
Learning DMEs from Positive and Negative Examples
verfasst von
Yeting Li
Chunmei Dong
Xinyu Chu
Haiming Chen
Copyright-Jahr
2019
DOI
https://doi.org/10.1007/978-3-030-18590-9_61