Skip to main content

2016 | OriginalPaper | Buchkapitel

Brushing—An Algorithm for Data Deduplication

verfasst von : Prasun Dutta, Pratik Pattnaik, Rajesh Kumar Sahu

Erschienen in: Information Systems Design and Intelligent Applications

Verlag: Springer India

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Deduplication is mainly used to solve the problem of space and is known as a space-efficient technique. A two step algorithm called ‘brushing’ has been proposed in this paper to solve individual file deduplication. The main aim of the algorithm is to overcome the space related problem, at the same time the algorithm also takes care of time complexity problem. The proposed algorithm has extremely low RAM overhead. The first phase of the algorithm checks the similar entities and removes them thus grouping only unique entities and in the second phase while the unique file is hashed, the unique entities are represented as index values thereby reducing the size of the file to a great extent. Test results shows that if a file contains 40–50 % duplicate data, then this technique reduces the size up to 2/3 of the file. This algorithm has a high deduplication throughput on the file system.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Suprativ Saha, Avik Samanta, A brief review along with a New Proposed Approach of Data De duplication, ACER 2013, pp. 223–231 (2013). Suprativ Saha, Avik Samanta, A brief review along with a New Proposed Approach of Data De duplication, ACER 2013, pp. 223–231 (2013).
2.
Zurück zum Zitat Srivatsa Maddodi, GirijaV.Attigeri, Dr.Karunakar A.K, Data de duplication techniques and analysis, Third International Conference on Emerging Trends in Engineering and Technology, IEEE computer Society (2010). Srivatsa Maddodi, GirijaV.Attigeri, Dr.Karunakar A.K, Data de duplication techniques and analysis, Third International Conference on Emerging Trends in Engineering and Technology, IEEE computer Society (2010).
3.
Zurück zum Zitat Yoshihiro Tsuchiya, Takashi Watanabe, DBLK: De duplication for Primary Block Storage, IEEE (2011). Yoshihiro Tsuchiya, Takashi Watanabe, DBLK: De duplication for Primary Block Storage, IEEE (2011).
4.
Zurück zum Zitat Jingwei Ma, Bin Zhao, Gang Wang, Xiaoguang Liu, Adaptive Pipeline for De duplication, IEEE 2012 (2012). Jingwei Ma, Bin Zhao, Gang Wang, Xiaoguang Liu, Adaptive Pipeline for De duplication, IEEE 2012 (2012).
5.
Zurück zum Zitat Amrita Upadhyay, Pratibha R Balihalli, ShashibhushanIvaturi, Shrisha Rao, De duplication and Compression Techniques in Cloud Design, IEEE (2012). Amrita Upadhyay, Pratibha R Balihalli, ShashibhushanIvaturi, Shrisha Rao, De duplication and Compression Techniques in Cloud Design, IEEE (2012).
6.
Zurück zum Zitat Jingxin Feng, Jiri Schindler, A De duplication Study for Host-side Caches in Virtualized Data Center Environments, IEEE (2013). Jingxin Feng, Jiri Schindler, A De duplication Study for Host-side Caches in Virtualized Data Center Environments, IEEE (2013).
Metadaten
Titel
Brushing—An Algorithm for Data Deduplication
verfasst von
Prasun Dutta
Pratik Pattnaik
Rajesh Kumar Sahu
Copyright-Jahr
2016
Verlag
Springer India
DOI
https://doi.org/10.1007/978-81-322-2755-7_23

Premium Partner