nach oben

Erschienen in:

2018 | OriginalPaper | Buchkapitel

Refining the Pose: Training and Use of Deep Recurrent Autoencoders for Improving Human Pose Estimation

verfasst von : Niall McLaughlin, Jesus Martinez del Rincon

Erschienen in: Articulated Motion and Deformable Objects

Verlag: Springer International Publishing

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Abstract

In this paper, a discriminative human pose estimation system based on deep learning is proposed for monocular video-sequences. Our approach combines a simple but efficient Convolutional Neural Network that directly regresses the 3D pose estimation with a recurrent denoising autoencoder that provides pose refinement using the temporal information contained in the sequence of previous frames. Our architecture is also able to provide an integrated training between both parts in order to better model the space of activities, where noisy but realistic poses produced by the partially trained CNN are used to enhance the training of the autoencoder. The system has been evaluated in two standard datasets, HumanEva-I and Human3.6M, comprising more than 15 different activities. We show that our simple architecture can provide state of the art results.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel Mammographic Mass Segmentation Using Fuzzy C–means and Decision Trees

Nächstes Kapitel How Can Deep Neural Networks Be Generated Efficiently for Devices with Limited Resources?

Bo, L., Sminchisescu, C.: Twin gaussian processes for structured prediction. IJCV (2010)

Bogo, F., Kanazawa, A., Lassner, C., Gehler, P., Romero, J., Black, M.J.: Keep it smpl: Automatic estimation of 3d human pose and shape from a single image. In: ECCV (2016)CrossRef

Coskun, H., Achilles, F., DiPietro, R., Navab, N., Tombari, F.: Long short-term memory kalman filters:recurrent neural estimators for pose regularization. In: ICCV (2017)

Gall, J., Rosenhahn, B., Brox, T., Seidel, H.P.: Optimization and filtering for human motion capture. IJCV (2010)

Hochreiter, S., Schmidhuber, J.: Long short-term memory. Neural computation 9(8), 1735–1780 (1997)CrossRef

Ionescu, C., Papava, I., Olaru, V., Sminchisescu, C.: Human3.6m: Large scale datasets and predictive methods for 3d human sensing in natural environments. PAMI (2014)CrossRef

Kingma, D., Ba, J.: Adam: A method for stochastic optimization. arXiv preprint arXiv:1412.6980 (2014)

Lewandowski, M., Martinez, J., Makris, D., Nebel, J.C.: Temporal extension of laplacian eigenmaps for unsupervised dimensionality reduction of time series. In: ICPR (2010)

Lin, M., Liang, X., Wang, K., Lin, L.: Recurrent 3d pose sequence machines. In: CVPR (2017)

10.

Mehta, D., H.Rhodin, Casas, D., Sotnychenko, O., Xu, W., Theobalt, C.: Monocular 3d human pose estimation in the wild using improved cnn supervision. In: 3DV (2017)

11.

Milbich, T., Bautista, M., Sutter, E., Ommer, B.: Unsupervised video understanding by reconciliation of posture similarities (2017)

12.

Moreno-Noguer, F.: 3d human pose estimation from a single image via distance matrix regression. In: CVPR (2017)

13.

Newell, A., Yang, K., Deng, J.: Stacked hourglass networks for human pose estimation. In: ECCV. pp. 483–499. Springer (2016)CrossRef

14.

Popa, A.I., Zanfir, M., Sminchisescu, C.: Deep multitask architecture for integrated 2d and 3d human sensing (2017)

15.

Sanzari, M., Ntouskos, V., Pirri, F.: Bayesian image based 3d pose estimation. In: ECCV. pp. 566–582. Springer (2016)CrossRef

16.

Sigal, L., Balan, A.O., Black, M.J.: Humaneva: Synchronized video and motion capture dataset and baseline for evaluation of articulated human motion. IJCV 87(1), 4–27 (2010)CrossRef

17.

Sun, K., Lan, C., Xing, J., Zeng, W., Liu, D., Wang, J.: Human pose estimation using global and local normalization. In: arXiv:1709.07220v1 (2017)

18.

Tekin, B., Katircioglu, I., Salzmann, M., Lepetit, V., Fua, P.: Structured prediction of 3d human pose with deep neural networks. In: BMVC (2016)

19.

Tekin, B., Márquez-Neila, P., Salzmann, M., Fua, P.: Fusing 2d uncertainty and 3d cues for monocular body pose estimation. In: ICCV (2017)

20.

Tekin, B., Sun, X., Wang, X., Lepetit, V., Fua, P.: Predicting people’s 3d poses from short sequences. arXiv preprint arXiv:1504.08200 (2015)

21.

Tome, D., Russell, C., Agapito, L.: Lifting from the deep: Convolutional 3d pose estimation from a single image. In: CVPR (2017)

22.

Toshev, A., Szegedy, C.: Deeppose: Human pose estimation via deep neural networks. In: CVPR. pp. 1653–1660 (2014)

23.

Vincent, P., Larochelle, H., Lajoie, I., Bengio, Y., Manzagol, P.A.: Stacked denoising autoencoders. Journal of Machine Learning Research 11(Dec), 3371–3408 (2010)

24.

Zhou, X., Zhu, M., Leonardos, S., Derpanis, K., Daniilidis, K.: Sparseness meets deepness: 3d human pose estimation from monocular video. In: CVPR (2016)

25.

Zhou, X., Huang, Q., Sun, X., Xue, X., Wei, Y.: Towards 3d human pose estimation in the wild: a weakly-supervised approach. In: ICCV (2017)

Titel: Refining the Pose: Training and Use of Deep Recurrent Autoencoders for Improving Human Pose Estimation
verfasst von: Niall McLaughlin
Jesus Martinez del Rincon
Verlag: Springer International Publishing
Buch: Articulated Motion and Deformable Objects
Print ISBN: 978-3-319-94543-9

Electronic ISBN: 978-3-319-94544-6

Copyright-Jahr: 2018
DOI: https://doi.org/10.1007/978-3-319-94544-6_2

Springer Professional

Abstract

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"