Skip to main content

2017 | OriginalPaper | Buchkapitel

Optimizing CNN-Based Object Detection Algorithms on Embedded FPGA Platforms

verfasst von : Ruizhe Zhao, Xinyu Niu, Yajie Wu, Wayne Luk, Qiang Liu

Erschienen in: Applied Reconfigurable Computing

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Algorithms based on Convolutional Neural Network (CNN) have recently been applied to object detection applications, greatly improving their performance. However, many devices intended for these algorithms have limited computation resources and strict power consumption constraints, and are not suitable for algorithms designed for GPU workstations. This paper presents a novel method to optimise CNN-based object detection algorithms targeting embedded FPGA platforms. Given parameterised CNN hardware modules, an optimisation flow takes network architectures and resource constraints as input, and tunes hardware parameters with algorithm-specific information to explore the design space and achieve high performance. The evaluation shows that our design model accuracy is above 85% and, with optimised configuration, our design can achieve 49.6 times speed-up compared with software implementation.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Bosi, B., et al.: Reconfigurable pipelined 2-D convolvers for fast digital signal processing. IEEE Trans. VLSI Syst. 7(3), 299–308 (1999)CrossRef Bosi, B., et al.: Reconfigurable pipelined 2-D convolvers for fast digital signal processing. IEEE Trans. VLSI Syst. 7(3), 299–308 (1999)CrossRef
2.
Zurück zum Zitat Chakradhar, S., et al.: A dynamically configurable coprocessor for convolutional neural networks. In: ISCA (2010) Chakradhar, S., et al.: A dynamically configurable coprocessor for convolutional neural networks. In: ISCA (2010)
3.
4.
Zurück zum Zitat Farabet, C., et al.: NeuFlow: a runtime-reconfigurable dataflow processor for vision. In: ECVW (2011) Farabet, C., et al.: NeuFlow: a runtime-reconfigurable dataflow processor for vision. In: ECVW (2011)
5.
Zurück zum Zitat Girshick, R.: Fast R-CNN. In: ICCV (2015) Girshick, R.: Fast R-CNN. In: ICCV (2015)
6.
7.
Zurück zum Zitat Qiu, J., et al.: Going deeper with embedded FPGA platform for convolutional neural network. In: FPGA (2016) Qiu, J., et al.: Going deeper with embedded FPGA platform for convolutional neural network. In: FPGA (2016)
10.
Zurück zum Zitat Ren, S., et al.: Faster R-CNN: towards real-time object detection with region proposal networks. In: NIPS (2015) Ren, S., et al.: Faster R-CNN: towards real-time object detection with region proposal networks. In: NIPS (2015)
11.
Zurück zum Zitat Simonyan, K., Zisserman, A.: Very deep convolutional networks for large-scale image recognition. ImageNet Challenge (2014) Simonyan, K., Zisserman, A.: Very deep convolutional networks for large-scale image recognition. ImageNet Challenge (2014)
12.
Zurück zum Zitat Suda, N., et al.: Scalable and modularized RTL compilation of convolutional neural networks onto FPGA. In: FPL (2016) Suda, N., et al.: Scalable and modularized RTL compilation of convolutional neural networks onto FPGA. In: FPL (2016)
13.
Zurück zum Zitat Suda, N., et al.: Throughput-optimized OpenCL-based FPGA accelerator for large-scale convolutional neural networks. In: FPGA (2016) Suda, N., et al.: Throughput-optimized OpenCL-based FPGA accelerator for large-scale convolutional neural networks. In: FPGA (2016)
14.
Zurück zum Zitat Szegedy, C., et al.: Going deeper with convolutions. In: CVPR (2015) Szegedy, C., et al.: Going deeper with convolutions. In: CVPR (2015)
15.
Zurück zum Zitat Zeiler, M.D., Fergus, R.: Visualizing and understanding convolutional networks. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) ECCV 2014. LNCS, vol. 8689, pp. 818–833. Springer, Cham (2014). doi:10.1007/978-3-319-10590-1_53 Zeiler, M.D., Fergus, R.: Visualizing and understanding convolutional networks. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) ECCV 2014. LNCS, vol. 8689, pp. 818–833. Springer, Cham (2014). doi:10.​1007/​978-3-319-10590-1_​53
16.
Zurück zum Zitat Zhang, C., et al.: Optimizing FPGA-based accelerator design for deep convolutional neural networks. In: FPGA (2015) Zhang, C., et al.: Optimizing FPGA-based accelerator design for deep convolutional neural networks. In: FPGA (2015)
Metadaten
Titel
Optimizing CNN-Based Object Detection Algorithms on Embedded FPGA Platforms
verfasst von
Ruizhe Zhao
Xinyu Niu
Yajie Wu
Wayne Luk
Qiang Liu
Copyright-Jahr
2017
DOI
https://doi.org/10.1007/978-3-319-56258-2_22

Neuer Inhalt