1981 | OriginalPaper | Buchkapitel
Nearly Optimal Stationary Strategies for the Total Reward Markov Decision Process
verfasst von : Ir. J. van der Wal
Erschienen in: DGOR
Verlag: Springer Berlin Heidelberg
Enthalten in: Professional Book Archive
Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.
Wählen Sie Textabschnitte aus um mit Künstlicher Intelligenz passenden Patente zu finden. powered by
Markieren Sie Textabschnitte, um KI-gestützt weitere passende Inhalte zu finden. powered by
Consider a Markov decision process with countable state space S and finite action space A. If in state i∈S action a∈A is taken then we get an immediate reward r(i,a) and the system makes a transition to state j with probability p(i,a,j). We assume $$ \mathop \Sigma \limits_{{\rm{j}} \in {\rm{S}}} \,{\rm{p(i,a,j)}}\,{\rm{ = }}\,{\rm{1}} $$.