Skip to main content

2021 | OriginalPaper | Buchkapitel

Light-Weight Distilled HRNet for Facial Landmark Detection

verfasst von : Ziye Tong, Shenqi Lai, Zhenhua Chai

Erschienen in: Pattern Recognition. ICPR International Workshops and Challenges

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

A light-weight facial landmark detection model is proposed in this paper (we named it “LDHRNet”), which can be trained in an end-to-end fashion and could perform precise facial landmark detection in various conditions including those with large pose, exaggerated expression, non-uniform lighting and occlusions. Firstly, in order to deal with these challenging cases above, a light-weight HRNet (LHRNet) structure is proposed as the backbone while the bottleneck block is used to replace the standard residual block in the original HRNet and the group convolution is used to replace the standard convolution in the original HRNet. Then in order to prevent the accuracy loss by the coordinates quantization, we use function named dual soft argmax (DSA) to map the heatmap response to final coordinates. And then we proposed Similarity-FeatureMap knowledge distillation model which guides the training of a student network such that input pairs that produce similar (dissimilar) feature maps in the pre-trained teacher network produce similar (dissimilar) feature maps in the student network. Finally, we combine the distillation loss and NME loss to train our model. The best result 79.10% for AUC is achieved on the validation set.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Anhänge
Nur mit Berechtigung zugänglich
Literatur
1.
Zurück zum Zitat He, K., Zhang, X., Ren, S., Sun, J.: Deep residual learning for image recognition. In: CVPR (2016) He, K., Zhang, X., Ren, S., Sun, J.: Deep residual learning for image recognition. In: CVPR (2016)
2.
Zurück zum Zitat Howard, A., et al.: Searching for mobilenetv3. In: ICCV (2019) Howard, A., et al.: Searching for mobilenetv3. In: ICCV (2019)
3.
Zurück zum Zitat Köstinger, M., Wohlhart, P., Roth, P.M., Bischof, H.: Annotated facial landmarks in the wild: a large-scale, real-world database for facial landmark localization. In: ICCVW (2011) Köstinger, M., Wohlhart, P., Roth, P.M., Bischof, H.: Annotated facial landmarks in the wild: a large-scale, real-world database for facial landmark localization. In: ICCVW (2011)
4.
Zurück zum Zitat Lai, S., Chai, Z., Li, S., Meng, H., Yang, M., Wei, X.: Enhanced normalized mean error loss for robust facial landmark detection. In: BMVC (2019) Lai, S., Chai, Z., Li, S., Meng, H., Yang, M., Wei, X.: Enhanced normalized mean error loss for robust facial landmark detection. In: BMVC (2019)
5.
Zurück zum Zitat Lai, S., Chai, Z., Wei, X.: Improved hourglass structure for high performance facial landmark detection. In: ICMEW (2019) Lai, S., Chai, Z., Wei, X.: Improved hourglass structure for high performance facial landmark detection. In: ICMEW (2019)
6.
Zurück zum Zitat Liu, Y., et al.: Grand challenge of 106-point facial landmark localization. In: ICMEW (2019) Liu, Y., et al.: Grand challenge of 106-point facial landmark localization. In: ICMEW (2019)
8.
Zurück zum Zitat Nibali, A., He, Z., Morgan, S., Prendergast, L.: Numerical coordinate regression with convolutional neural networks. CoRR (2018) Nibali, A., He, Z., Morgan, S., Prendergast, L.: Numerical coordinate regression with convolutional neural networks. CoRR (2018)
9.
Zurück zum Zitat Park, W., Kim, D., Lu, Y., Cho, M.: Relational knowledge distillation. In: CVPR (2019) Park, W., Kim, D., Lu, Y., Cho, M.: Relational knowledge distillation. In: CVPR (2019)
10.
Zurück zum Zitat Ren, S., Cao, X., Wei, Y., Sun, J.: Face alignment at 3000 FPS via regressing local binary features. In: CVPR (2014) Ren, S., Cao, X., Wei, Y., Sun, J.: Face alignment at 3000 FPS via regressing local binary features. In: CVPR (2014)
11.
Zurück zum Zitat Sun, K., Xiao, B., Liu, D., Wang, J.: Deep high-resolution representation learning for human pose estimation. In: CVPR (2019) Sun, K., Xiao, B., Liu, D., Wang, J.: Deep high-resolution representation learning for human pose estimation. In: CVPR (2019)
13.
Zurück zum Zitat Ting, Z., Guo-Jun, Q., Bin, X., Jingdong, W.: Interleaved group convolutions for deep neural networks. In: ICCV (2017) Ting, Z., Guo-Jun, Q., Bin, X., Jingdong, W.: Interleaved group convolutions for deep neural networks. In: ICCV (2017)
14.
Zurück zum Zitat Tung, F., Mori, G.: Similarity-preserving knowledge distillation. In: ICCV (2019) Tung, F., Mori, G.: Similarity-preserving knowledge distillation. In: ICCV (2019)
15.
Zurück zum Zitat Wu, Y., Hassner, T., Kim, K., Medioni, G.G., Natarajan, P.: Facial landmark detection with tweaked convolutional neural networks. IEEE TPAMI 40(12), 3067–3074 (2018)CrossRef Wu, Y., Hassner, T., Kim, K., Medioni, G.G., Natarajan, P.: Facial landmark detection with tweaked convolutional neural networks. IEEE TPAMI 40(12), 3067–3074 (2018)CrossRef
Metadaten
Titel
Light-Weight Distilled HRNet for Facial Landmark Detection
verfasst von
Ziye Tong
Shenqi Lai
Zhenhua Chai
Copyright-Jahr
2021
DOI
https://doi.org/10.1007/978-3-030-68821-9_35