Skip to main content
Erschienen in: Data Mining and Knowledge Discovery 2/2020

23.12.2019

Mining relaxed functional dependencies from data

verfasst von: Loredana Caruccio, Vincenzo Deufemia, Giuseppe Polese

Erschienen in: Data Mining and Knowledge Discovery | Ausgabe 2/2020

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Relaxed functional dependencies (rfds) are properties expressing important relationships among data. Thanks to the introduction of approximations in data comparison and/or validity, they can capture constraints useful for several purposes, such as the identification of data inconsistencies or patterns of semantically related data. Nevertheless, rfds can provide benefits only if they can be automatically discovered from data. In this paper we present an rfd discovery algorithm relying on a lattice structured search space, previously used for fd discovery, new pruning strategies, and a new candidate rfd validation method. An experimental evaluation demonstrates the discovery performances of the proposed algorithm on real datasets, also providing a comparison with other algorithms.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Anhänge
Nur mit Berechtigung zugänglich
Literatur
Zurück zum Zitat Flach PA, Savnik I (1999) Database dependency discovery: a machine learning approach. AI Commun 12(3):139–160MathSciNet Flach PA, Savnik I (1999) Database dependency discovery: a machine learning approach. AI Commun 12(3):139–160MathSciNet
Zurück zum Zitat Ilyas IF, Markl V, Haas P, Brown P, Aboulnaga A (2004) CORDS: automatic discovery of correlations and soft functional dependencies. In: Proceedings of the 2004 ACM SIGMOD international conference on management of data, SIGMOD ’04, pp 647–658. https://doi.org/10.1145/1007568.1007641 Ilyas IF, Markl V, Haas P, Brown P, Aboulnaga A (2004) CORDS: automatic discovery of correlations and soft functional dependencies. In: Proceedings of the 2004 ACM SIGMOD international conference on management of data, SIGMOD ’04, pp 647–658. https://​doi.​org/​10.​1145/​1007568.​1007641
Zurück zum Zitat Johnson DS, Garey MR (1979) Computers and intractability: a guide to the theory of NP-completeness. WH Freeman, New YorkMATH Johnson DS, Garey MR (1979) Computers and intractability: a guide to the theory of NP-completeness. WH Freeman, New YorkMATH
Zurück zum Zitat Kleinberg J, Tardos E (2006) Algorithm design. Pearson Education India, New Delhi Kleinberg J, Tardos E (2006) Algorithm design. Pearson Education India, New Delhi
Zurück zum Zitat Levenshtein VI (1966) Binary codes capable of correcting deletions, insertions, and reversals. Sov Phys Dokl 10(8):707–710MathSciNet Levenshtein VI (1966) Binary codes capable of correcting deletions, insertions, and reversals. Sov Phys Dokl 10(8):707–710MathSciNet
Zurück zum Zitat Nambiar U, Kambhampati S (2004) Mining approximate functional dependencies and concept similarities to answer imprecise queries. In: Proceedings of the 7th international workshop on the web and databases, WebDB ’04, pp 73–78. https://doi.org/10.1145/1017074.1017093 Nambiar U, Kambhampati S (2004) Mining approximate functional dependencies and concept similarities to answer imprecise queries. In: Proceedings of the 7th international workshop on the web and databases, WebDB ’04, pp 73–78. https://​doi.​org/​10.​1145/​1017074.​1017093
Zurück zum Zitat Song S (2010) Data dependencies in the presence of difference. PhD thesis, The Hong Kong University Song S (2010) Data dependencies in the presence of difference. PhD thesis, The Hong Kong University
Zurück zum Zitat Song S, Sun Y, Zhang A, Chen L, Wang J (2018) Enriching data imputation under similarity rule constraints. To appear in IEEE transactions on knowledge and data engineering Song S, Sun Y, Zhang A, Chen L, Wang J (2018) Enriching data imputation under similarity rule constraints. To appear in IEEE transactions on knowledge and data engineering
Zurück zum Zitat Szlichta J, Golab L, Srivastava D (2015) On axiomatization and inference complexity over a hierarchy of functional dependencies. In: Proceedings of the 9th Alberto Mendelzon international workshop on foundations of data management, AMW ’15 Szlichta J, Golab L, Srivastava D (2015) On axiomatization and inference complexity over a hierarchy of functional dependencies. In: Proceedings of the 9th Alberto Mendelzon international workshop on foundations of data management, AMW ’15
Zurück zum Zitat Wyss C, Giannella C, Robertson E (2001) FastFDs: a heuristic-driven, depth-first algorithm for mining functional dependencies from relation instances extended abstract. In: Proceedings of the 3rd international conference on data warehousing and knowledge discovery, DaWaK ’01, pp 101–110. https://doi.org/10.1007/3-540-44801-2_11 Wyss C, Giannella C, Robertson E (2001) FastFDs: a heuristic-driven, depth-first algorithm for mining functional dependencies from relation instances extended abstract. In: Proceedings of the 3rd international conference on data warehousing and knowledge discovery, DaWaK ’01, pp 101–110. https://​doi.​org/​10.​1007/​3-540-44801-2_​11
Metadaten
Titel
Mining relaxed functional dependencies from data
verfasst von
Loredana Caruccio
Vincenzo Deufemia
Giuseppe Polese
Publikationsdatum
23.12.2019
Verlag
Springer US
Erschienen in
Data Mining and Knowledge Discovery / Ausgabe 2/2020
Print ISSN: 1384-5810
Elektronische ISSN: 1573-756X
DOI
https://doi.org/10.1007/s10618-019-00667-7

Weitere Artikel der Ausgabe 2/2020

Data Mining and Knowledge Discovery 2/2020 Zur Ausgabe

Premium Partner