Skip to main content

2017 | OriginalPaper | Buchkapitel

Utility Aware Clustering for Publishing Transactional Data

verfasst von : Michael Bewong, Jixue Liu, Lin Liu, Jiuyong Li

Erschienen in: Advances in Knowledge Discovery and Data Mining

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

This work aims to maximise the utility of published data for the partition-based anonymisation of transactional data. We make an observation that, by optimising the clustering i.e. horizontal partitioning, the utility of published data can significantly be improved without affecting the privacy guarantees. We present a new clustering method with a specially designed distance function that considers the effect of sensitive terms in the privacy goal as part of the clustering process. In this way, when the clustering minimises the total intra-cluster distances of the partition, the utility loss is also minimised. We present two algorithms DocClust and DetK for clustering transactions and determining the best number of clusters respectively.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Barbaro, M., Zeller, T.: A face is exposed for AOL searcher no. 4417749. The New York Times (2006) Barbaro, M., Zeller, T.: A face is exposed for AOL searcher no. 4417749. The New York Times (2006)
2.
Zurück zum Zitat Byun, J., Kamra, A., Bertino, E., Li, N.: Efficient k-anonymization using clustering techniques. In: DASFAA, pp. 188–200 (2007) Byun, J., Kamra, A., Bertino, E., Li, N.: Efficient k-anonymization using clustering techniques. In: DASFAA, pp. 188–200 (2007)
3.
Zurück zum Zitat Ghinita, G., Kalnis, P., Tao, Y.: Anonymous publication of sensitive transactional data. IEEE TKDE 23(2), 161–174 (2011) Ghinita, G., Kalnis, P., Tao, Y.: Anonymous publication of sensitive transactional data. IEEE TKDE 23(2), 161–174 (2011)
4.
Zurück zum Zitat Goldberger, J., Tassa, T.: Efficient anonymizations with enhanced utility. TDP 3(2), 149–175 (2010)MathSciNet Goldberger, J., Tassa, T.: Efficient anonymizations with enhanced utility. TDP 3(2), 149–175 (2010)MathSciNet
5.
Zurück zum Zitat Liu, J., Wang, K.: Anonymizing bag-valued sparse data by semantic similarity-based clustering. KIS 35(2), 435–461 (2013) Liu, J., Wang, K.: Anonymizing bag-valued sparse data by semantic similarity-based clustering. KIS 35(2), 435–461 (2013)
6.
Zurück zum Zitat Loukides, G., Liagouris, J., Gkoulalas-Divanis, A., Terrovitis, M.: Disassociation for electronic health record privacy. JBI 50, 46–61 (2014) Loukides, G., Liagouris, J., Gkoulalas-Divanis, A., Terrovitis, M.: Disassociation for electronic health record privacy. JBI 50, 46–61 (2014)
7.
Zurück zum Zitat Loukides, G., Liagouris, J., Gkoulalas-Divanis, A., Terrovitis, M.: Utility-constrained electronic health record data publishing through generalization and disassociation. In: Medical Data Privacy Handbook, pp. 149–177 (2015) Loukides, G., Liagouris, J., Gkoulalas-Divanis, A., Terrovitis, M.: Utility-constrained electronic health record data publishing through generalization and disassociation. In: Medical Data Privacy Handbook, pp. 149–177 (2015)
8.
Zurück zum Zitat Machanavajjhala, A., Gehrke, J., Kifer, D., Venkitasubramaniam, M.: l-Diversity: privacy beyond k-anonymity. In: ICDE, p. 24 (2006) Machanavajjhala, A., Gehrke, J., Kifer, D., Venkitasubramaniam, M.: l-Diversity: privacy beyond k-anonymity. In: ICDE, p. 24 (2006)
9.
Zurück zum Zitat Terrovitis, M., Liagouris, J., Mamoulis, N., Skiadopoulos, S.: Privacy preservation by disassociation. PVLDB 5(10), 944–955 (2012) Terrovitis, M., Liagouris, J., Mamoulis, N., Skiadopoulos, S.: Privacy preservation by disassociation. PVLDB 5(10), 944–955 (2012)
10.
Zurück zum Zitat Terrovitis, M., Mamoulis, N., Kalnis, P.: Local and global recoding methods for anonymizing set-valued data. VLDB J. 20(1), 83–106 (2011)CrossRef Terrovitis, M., Mamoulis, N., Kalnis, P.: Local and global recoding methods for anonymizing set-valued data. VLDB J. 20(1), 83–106 (2011)CrossRef
11.
Zurück zum Zitat Zheng, Z., Kohavi, R., Mason, L.: Real world performance of association rule algorithms. In: ACM SIGKDD, pp. 401–406 (2001) Zheng, Z., Kohavi, R., Mason, L.: Real world performance of association rule algorithms. In: ACM SIGKDD, pp. 401–406 (2001)
12.
Zurück zum Zitat Zhu, H., Ye, X.: Achieving k-anonymity via a density-based clustering method. In: WAIM, pp. 745–752 (2007) Zhu, H., Ye, X.: Achieving k-anonymity via a density-based clustering method. In: WAIM, pp. 745–752 (2007)
Metadaten
Titel
Utility Aware Clustering for Publishing Transactional Data
verfasst von
Michael Bewong
Jixue Liu
Lin Liu
Jiuyong Li
Copyright-Jahr
2017
DOI
https://doi.org/10.1007/978-3-319-57529-2_38