Skip to main content

2021 | OriginalPaper | Buchkapitel

On Finite Approximations to Markov Decision Processes with Recursive and Nonlinear Discounting

verfasst von : Fan Deng, Xin Guo, Yi Zhang

Erschienen in: Modern Trends in Controlled Stochastic Processes:

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

In this paper, finite approximation schemes are justified for Markov decision processes in Borel spaces with recursive and nonlinear discounting. Explicit error bounds are obtained in terms of the system primitives. This allows one to solve the original problem approximately up to any given accuracy, by solving a sequence of problems in finite spaces.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Aliprantis, C., Border, K.: Infinite Dimensional Analysis. Springer, Heidelberg (2006)MATH Aliprantis, C., Border, K.: Infinite Dimensional Analysis. Springer, Heidelberg (2006)MATH
2.
Zurück zum Zitat Altman, E.: Constrained Markov Decision Processes. Chapman and Hall/CRC, Boca Raton (1999)MATH Altman, E.: Constrained Markov Decision Processes. Chapman and Hall/CRC, Boca Raton (1999)MATH
4.
Zurück zum Zitat Bertsekas, D.: Convergence of discretization procedures in dynamic programming. IEEE Trans. Autom. Control 20, 415–419 (1975)MathSciNetCrossRef Bertsekas, D.: Convergence of discretization procedures in dynamic programming. IEEE Trans. Autom. Control 20, 415–419 (1975)MathSciNetCrossRef
5.
Zurück zum Zitat Cioletti, L., Oliveira, E.: Applications of variable discounting dynamic programming to iterated function systems and related problems. Nonlinearity 32, 853–883 (2019)MathSciNetCrossRef Cioletti, L., Oliveira, E.: Applications of variable discounting dynamic programming to iterated function systems and related problems. Nonlinearity 32, 853–883 (2019)MathSciNetCrossRef
6.
Zurück zum Zitat Dufour, F., Prieto-Rumeau, T.: Approximation of infinite horizon discounted cost Markov decision processes. In: Hernández-Hernández, D., Minjárez-Sosa, J. (eds.) Optimization, Control, and Applications of Stochastic Systems, pp. 59–76. Birkhäuser, Boston (2012)CrossRef Dufour, F., Prieto-Rumeau, T.: Approximation of infinite horizon discounted cost Markov decision processes. In: Hernández-Hernández, D., Minjárez-Sosa, J. (eds.) Optimization, Control, and Applications of Stochastic Systems, pp. 59–76. Birkhäuser, Boston (2012)CrossRef
7.
Zurück zum Zitat Dufour, F., Prieto-Rumeau, T.: Approximation of Markov decision processes with general state space. J. Math. Anal. Appl. 388, 1254–1267 (2012)MathSciNetCrossRef Dufour, F., Prieto-Rumeau, T.: Approximation of Markov decision processes with general state space. J. Math. Anal. Appl. 388, 1254–1267 (2012)MathSciNetCrossRef
8.
Zurück zum Zitat Feinberg, E.A., Kasyanov, P., Zadoianchuk, N.: Berge’s theorem for noncompact image sets. J. Math. Anal. Appl. 397, 255–259 (2013)MathSciNetCrossRef Feinberg, E.A., Kasyanov, P., Zadoianchuk, N.: Berge’s theorem for noncompact image sets. J. Math. Anal. Appl. 397, 255–259 (2013)MathSciNetCrossRef
9.
Zurück zum Zitat Hernández-Lerma, O., Lasserre, J.: Discrete-Time Markov Control Processes. Springer, New York (1996)CrossRef Hernández-Lerma, O., Lasserre, J.: Discrete-Time Markov Control Processes. Springer, New York (1996)CrossRef
10.
Zurück zum Zitat Jaśkiewicz, A., Matkowski, J., Nowak, A.: Persistently optimal policies in stochastic dynamic programming with generalized discounting. Math. Oper. Res. 38, 108–121 (2013)MathSciNetCrossRef Jaśkiewicz, A., Matkowski, J., Nowak, A.: Persistently optimal policies in stochastic dynamic programming with generalized discounting. Math. Oper. Res. 38, 108–121 (2013)MathSciNetCrossRef
11.
Zurück zum Zitat Jaśkiewicz, A., Matkowski, J., Nowak, A.: On variable discounting in dynamic programming: applications to resource extraction and other economic models. Ann. Oper. Res. 220, 263–278 (2014)MathSciNetCrossRef Jaśkiewicz, A., Matkowski, J., Nowak, A.: On variable discounting in dynamic programming: applications to resource extraction and other economic models. Ann. Oper. Res. 220, 263–278 (2014)MathSciNetCrossRef
12.
Zurück zum Zitat Jaśkiewicz, A., Matkowski, J., Nowak, A.: Generalized discounting in dynamic programming with unbounded returns. Oper. Res. Lett. 42, 231–233 (2014) Jaśkiewicz, A., Matkowski, J., Nowak, A.: Generalized discounting in dynamic programming with unbounded returns. Oper. Res. Lett. 42, 231–233 (2014)
13.
Zurück zum Zitat Kuntz, J., Thomas, P., Stan, G., Barahona, M.: Approximations of countably-infinite linear programs over bounded measure spaces. SIAM J. Optim. (2020). Preprint available via arXiv:1810.03658v3 Kuntz, J., Thomas, P., Stan, G., Barahona, M.: Approximations of countably-infinite linear programs over bounded measure spaces. SIAM J. Optim. (2020). Preprint available via arXiv:​1810.​03658v3
14.
Zurück zum Zitat Piunovskiy, A., Zhang, Y.: Continuous-Time Markov Decision Processes. Springer, Cham (2020)CrossRef Piunovskiy, A., Zhang, Y.: Continuous-Time Markov Decision Processes. Springer, Cham (2020)CrossRef
15.
16.
Zurück zum Zitat Saldi, N., Linder, T., Yüksel, S.: Finite Approximations in Discrete-Time Stochastic Control. Springer, Cham (2018)CrossRef Saldi, N., Linder, T., Yüksel, S.: Finite Approximations in Discrete-Time Stochastic Control. Springer, Cham (2018)CrossRef
17.
Zurück zum Zitat Sennott, L.: Stochastic Dynamic Programming and the Control of Queueing Systems. Wiley, New York (1999)MATH Sennott, L.: Stochastic Dynamic Programming and the Control of Queueing Systems. Wiley, New York (1999)MATH
Metadaten
Titel
On Finite Approximations to Markov Decision Processes with Recursive and Nonlinear Discounting
verfasst von
Fan Deng
Xin Guo
Yi Zhang
Copyright-Jahr
2021
DOI
https://doi.org/10.1007/978-3-030-76928-4_11