Skip to main content

2018 | OriginalPaper | Buchkapitel

Policy Synthesis for Collective Dynamics

verfasst von : Paul Piho, Jane Hillston

Erschienen in: Quantitative Evaluation of Systems

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

In this paper we consider the problem of policy synthesis for systems of large numbers of simple interacting agents where dynamics of the system change through information spread via broadcast communication. By modifying the existing modelling language Carma and giving it a semantics in terms of continuous time Markov decision processes we introduce a natural way of formulating policy synthesis problems for such systems. However, solving policy synthesis problems is difficult since all non-trivial models result in very large state spaces. To combat this we propose an approach exploiting the results on fluid approximations of continuous time Markov chains to obtain estimates of optimal policies.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Buchholz, P., Dohndorf, I., Scheftelowitsch, D.: Optimal decisions for continuous time Markov decision processes over finite planning horizons. Comput. OR 77, 267–278 (2017)MathSciNetCrossRef Buchholz, P., Dohndorf, I., Scheftelowitsch, D.: Optimal decisions for continuous time Markov decision processes over finite planning horizons. Comput. OR 77, 267–278 (2017)MathSciNetCrossRef
3.
Zurück zum Zitat Gast, N., Gaujal, B.: A mean field approach for optimization in discrete time. Discrete Event Dyn. Syst. 21(1), 63–101 (2011)MathSciNetCrossRef Gast, N., Gaujal, B.: A mean field approach for optimization in discrete time. Discrete Event Dyn. Syst. 21(1), 63–101 (2011)MathSciNetCrossRef
4.
Zurück zum Zitat Kurtz, T.G.: Solutions of ordinary differential equations as limits of pure jump Markov processes. J. Appl. Probab. 7(1), 49–58 (1970)MathSciNetCrossRef Kurtz, T.G.: Solutions of ordinary differential equations as limits of pure jump Markov processes. J. Appl. Probab. 7(1), 49–58 (1970)MathSciNetCrossRef
6.
Zurück zum Zitat Piho, P., Georgoulas, A., Hillston, J.: Goals and resource constraints in CARMA. In: Proceedings of the Ninth International Workshop on the Practical Application of Stochastic Modelling (PASM), pp. 155–172 (2018) Piho, P., Georgoulas, A., Hillston, J.: Goals and resource constraints in CARMA. In: Proceedings of the Ninth International Workshop on the Practical Application of Stochastic Modelling (PASM), pp. 155–172 (2018)
7.
Zurück zum Zitat Jonsson, B., Larsen, K.G.: Specification and refinement of probabilistic processes. In: Proceedings of the Sixth Annual Symposium on Logic in Computer Science (LICS 1991), pp. 266–277 (1991) Jonsson, B., Larsen, K.G.: Specification and refinement of probabilistic processes. In: Proceedings of the Sixth Annual Symposium on Logic in Computer Science (LICS 1991), pp. 266–277 (1991)
8.
Zurück zum Zitat Caillaud, B., Delahaye, B., Larsen, K.G., Legay, A., Pedersen, M.L., Wasowski, A.: Constraint Markov chains. Theor. Comput. Sci. 412(34), 4373–4404 (2011)MathSciNetCrossRef Caillaud, B., Delahaye, B., Larsen, K.G., Legay, A., Pedersen, M.L., Wasowski, A.: Constraint Markov chains. Theor. Comput. Sci. 412(34), 4373–4404 (2011)MathSciNetCrossRef
10.
Zurück zum Zitat De Nicola, R., Latella, D., Loreti, M., Massink, M.: A uniform definition of stochastic process calculi. ACM Comput. Surv. 46(1), 5:1–5:35 (2013)CrossRef De Nicola, R., Latella, D., Loreti, M., Massink, M.: A uniform definition of stochastic process calculi. ACM Comput. Surv. 46(1), 5:1–5:35 (2013)CrossRef
12.
Zurück zum Zitat Bartocci, E., Bortolussi, L., Brázdil, T., Milios, D., Sanguinetti, G.: Policy learning in continuous-time Markov decision processes using Gaussian processes. Perform. Eval. 116, 84–100 (2017)CrossRef Bartocci, E., Bortolussi, L., Brázdil, T., Milios, D., Sanguinetti, G.: Policy learning in continuous-time Markov decision processes using Gaussian processes. Perform. Eval. 116, 84–100 (2017)CrossRef
13.
Zurück zum Zitat Billingsley, P.: Convergence of Probability Measures, 2nd edn. Wiley, New York (1999)CrossRef Billingsley, P.: Convergence of Probability Measures, 2nd edn. Wiley, New York (1999)CrossRef
15.
Zurück zum Zitat Peters, J., Schaal, S.: Reinforcement learning of motor skills with policy gradients. Neural Netw. 21(4), 682–697 (2008)CrossRef Peters, J., Schaal, S.: Reinforcement learning of motor skills with policy gradients. Neural Netw. 21(4), 682–697 (2008)CrossRef
16.
Zurück zum Zitat Van Kampen, N.: Stochastic Processes in Physics and Chemistry. North-Holland Personal Library. Elsevier Science, Amsterdam (2011)MATH Van Kampen, N.: Stochastic Processes in Physics and Chemistry. North-Holland Personal Library. Elsevier Science, Amsterdam (2011)MATH
Metadaten
Titel
Policy Synthesis for Collective Dynamics
verfasst von
Paul Piho
Jane Hillston
Copyright-Jahr
2018
DOI
https://doi.org/10.1007/978-3-319-99154-2_22