Skip to main content
Erschienen in: Neural Processing Letters 8/2023

24.10.2023

Dynamic Goal Tracking for Differential Drive Robot Using Deep Reinforcement Learning

verfasst von: Mahrukh Shahid, Semab Naimat Khan, Khawaja Fahad Iqbal, Sara Ali, Yasar Ayaz

Erschienen in: Neural Processing Letters | Ausgabe 8/2023

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

To ensure the steady navigation for robot stable controls are one of the basic requirements. Control values selection is highly environment dependent. To ensure reusability of control parameter, system needs to generalize over the environment. Adding adaptability in robots to perform effectively in the environments with no prior knowledge reinforcement leaning is a promising approach. However, tuning hyper parameters and attaining correlation between state space and reward function to train a stable reinforcement learning agent is a challenge. This paper is focused, to design a continuous reward function to minimize the sparsity and stabilizes the policy convergence, to attain control generalization for differential drive robot. To achieve that, Twin Delayed Deep Deterministic Policy Gradient is implemented on PyBullet Racecar model in Open-AIGym environment. System was trained to achieve smart primitive control policy, moving forward in the direction of goal by maintaining an appropriate distance from walls to avoid collision. Resulting policy was tested on unseen environments including dynamic goal environment, boundary free environment and continuous path environment on which it outperformed Deep Deterministic Policy Gradient.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
9.
Zurück zum Zitat Fujimoto S, Hoof H, Meger D (2018) Addressing function approximation error in actor-critic methods. 35th International conference on machine learning 80, pp 1587–1596 Fujimoto S, Hoof H, Meger D (2018) Addressing function approximation error in actor-critic methods. 35th International conference on machine learning 80, pp 1587–1596
10.
Zurück zum Zitat Lillicrap TP, Hunt JJ, Pritzel A, Heess N, Erez T, Tassa Y, Silver D, Wierstra D (2016) Continuous control with deep reinforcement learning. 4th International conference on learning representations (ICLR) Lillicrap TP, Hunt JJ, Pritzel A, Heess N, Erez T, Tassa Y, Silver D, Wierstra D (2016) Continuous control with deep reinforcement learning. 4th International conference on learning representations (ICLR)
16.
Zurück zum Zitat Konda V, Tsitsiklis J (1999) Actor-critic algorithms. Advances in Neural Information Processing Systems 12 Konda V, Tsitsiklis J (1999) Actor-critic algorithms. Advances in Neural Information Processing Systems 12
18.
Zurück zum Zitat Devidze R, Radanovic G, Kamalaruban P, Singla A (2021) Explicable reward design for reinforcement learning agents. Adv Neural Inf Process Syst 34:20118–20131 Devidze R, Radanovic G, Kamalaruban P, Singla A (2021) Explicable reward design for reinforcement learning agents. Adv Neural Inf Process Syst 34:20118–20131
19.
20.
Zurück zum Zitat Brockman G, Cheung V, Pettersson L, Schneider J, Schulman J, Tang J, Zaremba W (2016) Openai gym. arXiv preprint arXiv:1606.01540 Brockman G, Cheung V, Pettersson L, Schneider J, Schulman J, Tang J, Zaremba W (2016) Openai gym. arXiv preprint arXiv:​1606.​01540
21.
Zurück zum Zitat Koenig N (2004) Howard A (2004) Design and use paradigms for gazebo, an open-source multi-robot simulator. IEEE/RSJ International conference on intelligent robots and systems (IROS) vol 3, pp 2149–2154 Koenig N (2004) Howard A (2004) Design and use paradigms for gazebo, an open-source multi-robot simulator. IEEE/RSJ International conference on intelligent robots and systems (IROS) vol 3, pp 2149–2154
Metadaten
Titel
Dynamic Goal Tracking for Differential Drive Robot Using Deep Reinforcement Learning
verfasst von
Mahrukh Shahid
Semab Naimat Khan
Khawaja Fahad Iqbal
Sara Ali
Yasar Ayaz
Publikationsdatum
24.10.2023
Verlag
Springer US
Erschienen in
Neural Processing Letters / Ausgabe 8/2023
Print ISSN: 1370-4621
Elektronische ISSN: 1573-773X
DOI
https://doi.org/10.1007/s11063-023-11390-2

Weitere Artikel der Ausgabe 8/2023

Neural Processing Letters 8/2023 Zur Ausgabe

Neuer Inhalt