Skip to main content

2015 | OriginalPaper | Buchkapitel

Beyond HOG: Learning Local Parts for Object Detection

verfasst von : Chenjie Huang, Zheng Qin, Kaiping Xu, Guolong Wang, Tao Xu

Erschienen in: Advances in Multimedia Information Processing -- PCM 2015

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Histogram of Oriented Gradients (HOG) features have laid solid foundation for object detection in recent years for its both accuracy and speed. However, the expressivity of HOG is limited because the simple gradient features may ignore some important local information about objects and HOG is actually data-independent. In this paper, we propose to replace HOG by a parts-based representation, Histogram of Local Parts (HLP), for object detection under sliding window framework. HLP can capture richer and larger local patterns of objects and are more expressive than HOG. Specifically, we adopt Sparse Nonnegative Matrix Factorization to learn an over-complete parts-based dictionary from data. Then we can obtain HLP representation for a local patch by aggregating the Local Parts coefficients of pixels in this patch. Like DPM, we can train a supervised model with HLP given the latent positions of roots and parts of objects. Extensive experiments on INRIA and PASCAL datasets verify the superiority of HLP to state-of-the-art HOG-based methods for object detection, which shows that HLP is more effective than HOG.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Bourdev, L., Malik, J.: Poselets: body part detectors trained using 3d human pose annotations. In: ICCV (2009) Bourdev, L., Malik, J.: Poselets: body part detectors trained using 3d human pose annotations. In: ICCV (2009)
2.
Zurück zum Zitat Cai, D., He, X., Han, J., Huang, T.S.: Graph regularized nonnegative matrix factorization for data representation. TPAMI 33(8), 1548–1560 (2011)CrossRef Cai, D., He, X., Han, J., Huang, T.S.: Graph regularized nonnegative matrix factorization for data representation. TPAMI 33(8), 1548–1560 (2011)CrossRef
3.
Zurück zum Zitat Dalal, N., Triggs, B.: Histograms of oriented gradients for human detection. In: CVPR (2005) Dalal, N., Triggs, B.: Histograms of oriented gradients for human detection. In: CVPR (2005)
4.
Zurück zum Zitat Dikmen, M., Hoiem, D., Huang, T.S.: A data-driven method for feature transformation. In: CVPR (2012) Dikmen, M., Hoiem, D., Huang, T.S.: A data-driven method for feature transformation. In: CVPR (2012)
5.
Zurück zum Zitat Ding, G., Guo, Y., Zhou, J.: Collective matrix factorization hashing for multimodal data. In: CVPR (2014) Ding, G., Guo, Y., Zhou, J.: Collective matrix factorization hashing for multimodal data. In: CVPR (2014)
6.
Zurück zum Zitat Divvala, S., Efros, A., Hebert, M.: How important are deformable parts in the deformable parts model? In: ECCV (2012) Divvala, S., Efros, A., Hebert, M.: How important are deformable parts in the deformable parts model? In: ECCV (2012)
7.
Zurück zum Zitat Dollar, P., Tu, Z., Perona, P., Belongie, S.: Integral channel features. In: BMVC (2009) Dollar, P., Tu, Z., Perona, P., Belongie, S.: Integral channel features. In: BMVC (2009)
8.
Zurück zum Zitat Everingham, M., Gool, L.V., Williams, C., Winn, J., Zisserman, A.: The pascal visual object classes (voc) challenge. IJCV 88(2), 303–338 (2010)CrossRef Everingham, M., Gool, L.V., Williams, C., Winn, J., Zisserman, A.: The pascal visual object classes (voc) challenge. IJCV 88(2), 303–338 (2010)CrossRef
9.
Zurück zum Zitat Felzenszwalb, P.F., Girshick, R.B., McAllester, D.A., Ramanan, D.: Object detection with discriminatively trained part-based models. TPAMI 32(9), 1627–1645 (2010)CrossRef Felzenszwalb, P.F., Girshick, R.B., McAllester, D.A., Ramanan, D.: Object detection with discriminatively trained part-based models. TPAMI 32(9), 1627–1645 (2010)CrossRef
10.
Zurück zum Zitat Girshick, R., Felzenszwalb, P., McAllester, D.: Object detection with grammar models. In: NIPS (2011) Girshick, R., Felzenszwalb, P., McAllester, D.: Object detection with grammar models. In: NIPS (2011)
11.
Zurück zum Zitat Guo, Y., Ding, G., Jin, X., Wang, J.: Learning predictable and discriminative attributes for visual recognition. In: AAAI (2015) Guo, Y., Ding, G., Jin, X., Wang, J.: Learning predictable and discriminative attributes for visual recognition. In: AAAI (2015)
12.
Zurück zum Zitat Hoyer, P.O.: Non-negative matrix factorization with sparseness constraints. JMLR 5, 1457–1469 (2004)MathSciNetMATH Hoyer, P.O.: Non-negative matrix factorization with sparseness constraints. JMLR 5, 1457–1469 (2004)MathSciNetMATH
13.
Zurück zum Zitat Hussain, S., Kuntzmann, L., Triggs, B.: Feature sets and dimensionality reduction for visual object detection. In: BMVC (2010) Hussain, S., Kuntzmann, L., Triggs, B.: Feature sets and dimensionality reduction for visual object detection. In: BMVC (2010)
14.
Zurück zum Zitat Lee, D.D., Seung, H.S.: Learning the parts of objects by nonnegative matrix factorization. Nature 401(6755), 788–791 (1999)CrossRef Lee, D.D., Seung, H.S.: Learning the parts of objects by nonnegative matrix factorization. Nature 401(6755), 788–791 (1999)CrossRef
15.
Zurück zum Zitat Lowe, D.G.: Object recognition from local scale-invariant features. In: ICCV (1999) Lowe, D.G.: Object recognition from local scale-invariant features. In: ICCV (1999)
16.
Zurück zum Zitat Malisiewicz, T., Gupta, A., Efros, A.: Ensemble of exemplar-svms for object detection and beyond. In: ICCV (2011) Malisiewicz, T., Gupta, A., Efros, A.: Ensemble of exemplar-svms for object detection and beyond. In: ICCV (2011)
17.
Zurück zum Zitat Pirsiavash, H., Ramanan, D., Fowlkes, C.: Bilinear classifiers for visual recognition. In: NIPS (2009) Pirsiavash, H., Ramanan, D., Fowlkes, C.: Bilinear classifiers for visual recognition. In: NIPS (2009)
18.
Zurück zum Zitat Ren, X., Ramanan, D.: Histograms of sparse codes for object detection. In: CVPR (2013) Ren, X., Ramanan, D.: Histograms of sparse codes for object detection. In: CVPR (2013)
19.
Zurück zum Zitat Roshtkhari, M.J., Levine, M.D.: Online dominant and anomalous behavior detection in videos. In: CVPR (2013) Roshtkhari, M.J., Levine, M.D.: Online dominant and anomalous behavior detection in videos. In: CVPR (2013)
20.
Zurück zum Zitat Schwartz, W., Kembhavi, A., Harwood, D., Davis, L.: Human detection using partial least squares analysis. In: ICCV (2009) Schwartz, W., Kembhavi, A., Harwood, D., Davis, L.: Human detection using partial least squares analysis. In: ICCV (2009)
21.
Zurück zum Zitat Vedaldi, A., Gulshan, V., Varma, M., Zisserman, A.: Multiple kernels for object detection. In: ICCV (2009) Vedaldi, A., Gulshan, V., Varma, M., Zisserman, A.: Multiple kernels for object detection. In: ICCV (2009)
22.
Zurück zum Zitat Vijayanarasimhan, S., Grauman, K.: Efficient region search for object detection. In: CVPR (2011) Vijayanarasimhan, S., Grauman, K.: Efficient region search for object detection. In: CVPR (2011)
23.
Zurück zum Zitat Viola, P.A., Jones, M.J.: Rapid object detection using a boosted cascade of simple features. In: CVPR (2001) Viola, P.A., Jones, M.J.: Rapid object detection using a boosted cascade of simple features. In: CVPR (2001)
24.
Zurück zum Zitat Wachsmuth, M.W.O.E., Perrett, D.I.: Recognition of objects and their component parts: responses of single units in the temporal cortex of the macaque. Cereb. Cortex 4(5), 509–522 (1994)CrossRef Wachsmuth, M.W.O.E., Perrett, D.I.: Recognition of objects and their component parts: responses of single units in the temporal cortex of the macaque. Cereb. Cortex 4(5), 509–522 (1994)CrossRef
25.
Zurück zum Zitat Wang, J., Yang, J., Yu, K., Lv, F., Huang, T.S., Gong, Y.: Locality-constrained linear coding for image classification. In: CVPR 2010 (2010) Wang, J., Yang, J., Yu, K., Lv, F., Huang, T.S., Gong, Y.: Locality-constrained linear coding for image classification. In: CVPR 2010 (2010)
26.
Zurück zum Zitat Xiao, J., Hays, J., Ehinger, K., Oliva, A., Torralba, A.: Sun database: large-scale scene recognition from abbey to zoo. In: CVPR (2010) Xiao, J., Hays, J., Ehinger, K., Oliva, A., Torralba, A.: Sun database: large-scale scene recognition from abbey to zoo. In: CVPR (2010)
27.
Zurück zum Zitat Yang, Y., Ramanan, D.: Articulated pose estimation with flexible mixtures-of-parts. In: CVPR (2011) Yang, Y., Ramanan, D.: Articulated pose estimation with flexible mixtures-of-parts. In: CVPR (2011)
28.
Zurück zum Zitat Zhu, X., Ramanan, D.: Face detection, pose estimation, and landmark localization in the wild. In: CVPR (2012) Zhu, X., Ramanan, D.: Face detection, pose estimation, and landmark localization in the wild. In: CVPR (2012)
Metadaten
Titel
Beyond HOG: Learning Local Parts for Object Detection
verfasst von
Chenjie Huang
Zheng Qin
Kaiping Xu
Guolong Wang
Tao Xu
Copyright-Jahr
2015
DOI
https://doi.org/10.1007/978-3-319-24075-6_28

Neuer Inhalt