Skip to main content

2016 | OriginalPaper | Buchkapitel

Stacked Robust Autoencoder for Classification

verfasst von : Janki Mehta, Kavya Gupta, Anupriya Gogna, Angshul Majumdar, Saket Anand

Erschienen in: Neural Information Processing

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

In this work we propose an l p -norm data fidelity constraint for training the autoencoder. Usually the Euclidean distance is used for this purpose; we generalize the l 2 -norm to the l p -norm; smaller values of p make the problem robust to outliers. The ensuing optimization problem is solved using the Augmented Lagrangian approach. The proposed l p -norm Autoencoder has been tested on benchmark deep learning datasets – MNIST, CIFAR-10 and SVHN. We have seen that the proposed robust autoencoder yields better results than the standard autoencoder (l 2 -norm) and deep belief network for all of these problems.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
3.
Zurück zum Zitat Shi, M., Lukas, M.A.: An L1 estimation algorithm with degeneracy and linear constraints. Comput. Stat. Data Anal. 39(1), 35–55 (2002)CrossRefMATH Shi, M., Lukas, M.A.: An L1 estimation algorithm with degeneracy and linear constraints. Comput. Stat. Data Anal. 39(1), 35–55 (2002)CrossRefMATH
4.
Zurück zum Zitat Wang, L., Gordon, M.D., Zhu, J.: Regularized least absolute deviations regression and an efficient algorithm for parameter tuning. In: IEEE ICDM, pp. 690–700 (2006) Wang, L., Gordon, M.D., Zhu, J.: Regularized least absolute deviations regression and an efficient algorithm for parameter tuning. In: IEEE ICDM, pp. 690–700 (2006)
5.
Zurück zum Zitat Barrodale, I., Roberts, F.D.K.: An improved algorithm for discrete L1 linear approximation. SIAM J. Numer. Anal. 10(5), 839–848 (1973)MathSciNetCrossRefMATH Barrodale, I., Roberts, F.D.K.: An improved algorithm for discrete L1 linear approximation. SIAM J. Numer. Anal. 10(5), 839–848 (1973)MathSciNetCrossRefMATH
6.
Zurück zum Zitat Schlossmacher, E.J.: An iterative technique for absolute deviations curve fitting. J. Am. Stat. Assoc. 68(344), 857–859 (1973)CrossRefMATH Schlossmacher, E.J.: An iterative technique for absolute deviations curve fitting. J. Am. Stat. Assoc. 68(344), 857–859 (1973)CrossRefMATH
7.
Zurück zum Zitat Wesolowsky, G.O.: A new descent algorithm for the least absolute value regression problem. Commun. Stat. Simul. Comput. B10(5), 479–491 (1981)CrossRefMATH Wesolowsky, G.O.: A new descent algorithm for the least absolute value regression problem. Commun. Stat. Simul. Comput. B10(5), 479–491 (1981)CrossRefMATH
8.
Zurück zum Zitat Li, Y., Arce, G.R.: A maximum likelihood approach to least absolute deviation regression. EURASIP J. Appl. Sig. Process. 12, 1762–1769 (2004)MathSciNetCrossRef Li, Y., Arce, G.R.: A maximum likelihood approach to least absolute deviation regression. EURASIP J. Appl. Sig. Process. 12, 1762–1769 (2004)MathSciNetCrossRef
9.
Zurück zum Zitat Rumelhart, D.E., Hinton, G.E., Williams, R.J.: Learning representations by back-propagating errors. Nature 323, 533–536 (1986)CrossRef Rumelhart, D.E., Hinton, G.E., Williams, R.J.: Learning representations by back-propagating errors. Nature 323, 533–536 (1986)CrossRef
10.
Zurück zum Zitat Baldi, P., Hornik, K.: Neural networks and principal component analysis: learning from examples without local minima. Neural Netw. 2, 53–58 (1989)CrossRef Baldi, P., Hornik, K.: Neural networks and principal component analysis: learning from examples without local minima. Neural Netw. 2, 53–58 (1989)CrossRef
11.
Zurück zum Zitat Vincent, P., Larochelle, H., Lajoie, I., Bengio, Y., Manzagol, P.A.: Stacked denoising autoen coders: learning useful representations in a deep network with a local denoising criterion. J. Mach. Learn. Res. 11, 3371–3408 (2010)MathSciNetMATH Vincent, P., Larochelle, H., Lajoie, I., Bengio, Y., Manzagol, P.A.: Stacked denoising autoen coders: learning useful representations in a deep network with a local denoising criterion. J. Mach. Learn. Res. 11, 3371–3408 (2010)MathSciNetMATH
12.
Zurück zum Zitat Chartrand, R.: Nonconvex splitting for regularized low-rank + sparse decomposition. IEEE Trans. Sig. Process. 60, 5810–5819 (2012)MathSciNetCrossRef Chartrand, R.: Nonconvex splitting for regularized low-rank + sparse decomposition. IEEE Trans. Sig. Process. 60, 5810–5819 (2012)MathSciNetCrossRef
13.
Zurück zum Zitat Majumdar, A., Ward, R.K.: On the choice of compressed sensing priors: an experimental study. Sig. Process. Image Commun. 27(9), 1035–1048 (2012)CrossRef Majumdar, A., Ward, R.K.: On the choice of compressed sensing priors: an experimental study. Sig. Process. Image Commun. 27(9), 1035–1048 (2012)CrossRef
14.
Zurück zum Zitat Rifai, S., Vincent, P., Muller, X., Glorot, X., Bengio, Y.: Contractive auto-encoders: explicit invariance during feature extraction. In: ICML (2011) Rifai, S., Vincent, P., Muller, X., Glorot, X., Bengio, Y.: Contractive auto-encoders: explicit invariance during feature extraction. In: ICML (2011)
15.
Zurück zum Zitat Wright, J., Yang, A.Y., Ganesh, A., Sastry, S.S., Ma, Y.: Robust face recognition via sparse representation. IEEE Trans. Pattern Anal. Mach. Intell. 31, 210–227 (2009)CrossRef Wright, J., Yang, A.Y., Ganesh, A., Sastry, S.S., Ma, Y.: Robust face recognition via sparse representation. IEEE Trans. Pattern Anal. Mach. Intell. 31, 210–227 (2009)CrossRef
16.
Zurück zum Zitat Masci, J., Meier, U., Cireşan, D., Schmidhuber, J.: Stacked convolutional auto-encoders for hierarchical feature extraction. In: Honkela, T. (ed.) ICANN 2011, Part I. LNCS, vol. 6791, pp. 52–59. Springer, Heidelberg (2011)CrossRef Masci, J., Meier, U., Cireşan, D., Schmidhuber, J.: Stacked convolutional auto-encoders for hierarchical feature extraction. In: Honkela, T. (ed.) ICANN 2011, Part I. LNCS, vol. 6791, pp. 52–59. Springer, Heidelberg (2011)CrossRef
17.
Zurück zum Zitat Lee, H., Grosse, R., Ng, A.: Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations. In: ICML (2009) Lee, H., Grosse, R., Ng, A.: Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations. In: ICML (2009)
Metadaten
Titel
Stacked Robust Autoencoder for Classification
verfasst von
Janki Mehta
Kavya Gupta
Anupriya Gogna
Angshul Majumdar
Saket Anand
Copyright-Jahr
2016
DOI
https://doi.org/10.1007/978-3-319-46675-0_66

Premium Partner