Skip to main content

2014 | OriginalPaper | Buchkapitel

Efficiency of Static Knowledge Bias in Monte-Carlo Tree Search

verfasst von : Kokolo Ikeda, Simon Viennot

Erschienen in: Computers and Games

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Monte-Carlo methods are currently the best known algorithms for the game of Go. It is already shown that Monte-Carlo simulations based on a probability model containing static knowledge of the game are more efficient than random simulations. Some programs also use such probability models in the tree search policy to limit the search to a subset of the legal moves or to bias the search. However, this aspect is not so well documented. In this paper, we describe more precisely how static knowledge can be used to improve the tree search policy. We show experimentally the efficiency of the proposed method by a large number of games played against open source Go programs.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Brugmann, B.: Monte Carlo Go. Technical report, Max-Planck Institute of Physics (1993) Brugmann, B.: Monte Carlo Go. Technical report, Max-Planck Institute of Physics (1993)
2.
Zurück zum Zitat Kocsis, L., Szepesvári, C.: Bandit based Monte-Carlo planning. In: Fürnkranz, J., Scheffer, T., Spiliopoulou, M. (eds.) ECML 2006. LNCS (LNAI), vol. 4212, pp. 282–293. Springer, Heidelberg (2006) Kocsis, L., Szepesvári, C.: Bandit based Monte-Carlo planning. In: Fürnkranz, J., Scheffer, T., Spiliopoulou, M. (eds.) ECML 2006. LNCS (LNAI), vol. 4212, pp. 282–293. Springer, Heidelberg (2006)
3.
Zurück zum Zitat Coulom, R.: Computing Elo ratings of move patterns in the game of go. J. Int. Comput. Games Assoc. 30(4), 198–208 (2007) Coulom, R.: Computing Elo ratings of move patterns in the game of go. J. Int. Comput. Games Assoc. 30(4), 198–208 (2007)
4.
Zurück zum Zitat Chaslot, G., Winands, M., Uiterwijk, J., van den Herik, H., Bouzy, B.: Progressive strategies for Monte-Carlo tree search. New Math. Nat. Comput. 4(3), 343–357 (2008)CrossRefMATHMathSciNet Chaslot, G., Winands, M., Uiterwijk, J., van den Herik, H., Bouzy, B.: Progressive strategies for Monte-Carlo tree search. New Math. Nat. Comput. 4(3), 343–357 (2008)CrossRefMATHMathSciNet
7.
Zurück zum Zitat Enzenberger, M., Müller, M., Arneson, B., Segal, R.: Fuego - an open-source framework for board games and go engine based on Monte Carlo tree search. IEEE Trans. Comput. Intell. AI Games 2(4), 259–270 (2010)CrossRef Enzenberger, M., Müller, M., Arneson, B., Segal, R.: Fuego - an open-source framework for board games and go engine based on Monte Carlo tree search. IEEE Trans. Comput. Intell. AI Games 2(4), 259–270 (2010)CrossRef
8.
Zurück zum Zitat Chaslot, G., Fiter, C., Hoock, J.-B., Rimmel, A., Teytaud, O.: Adding expert knowledge and exploration in Monte-Carlo tree search. In: van den Herik, H.J., Spronck, P. (eds.) ACG 2009. LNCS, vol. 6048, pp. 1–13. Springer, Heidelberg (2010) CrossRef Chaslot, G., Fiter, C., Hoock, J.-B., Rimmel, A., Teytaud, O.: Adding expert knowledge and exploration in Monte-Carlo tree search. In: van den Herik, H.J., Spronck, P. (eds.) ACG 2009. LNCS, vol. 6048, pp. 1–13. Springer, Heidelberg (2010) CrossRef
9.
Zurück zum Zitat Gelly, S., Silver, D.: Monte-Carlo tree search and rapid action value estimation in computer go. Artif. Intell. 175(11), 1856–1875 (2011)CrossRefMathSciNet Gelly, S., Silver, D.: Monte-Carlo tree search and rapid action value estimation in computer go. Artif. Intell. 175(11), 1856–1875 (2011)CrossRefMathSciNet
10.
Zurück zum Zitat Huang, S.C.: New heuristics for Monte Carlo tree search applied to the game of go. Ph.D. thesis, National Taiwan Normal University (2011) Huang, S.C.: New heuristics for Monte Carlo tree search applied to the game of go. Ph.D. thesis, National Taiwan Normal University (2011)
11.
Zurück zum Zitat Baudis, P.: MCTS with information sharing. Master thesis, Charles University in Prague (2011) Baudis, P.: MCTS with information sharing. Master thesis, Charles University in Prague (2011)
12.
Zurück zum Zitat Baudiš, P., Gailly, J.: PACHI: state of the art open source go program. In: van den Herik, H.J., Plaat, A. (eds.) ACG 2011. LNCS, vol. 7168, pp. 24–38. Springer, Heidelberg (2012) CrossRef Baudiš, P., Gailly, J.: PACHI: state of the art open source go program. In: van den Herik, H.J., Plaat, A. (eds.) ACG 2011. LNCS, vol. 7168, pp. 24–38. Springer, Heidelberg (2012) CrossRef
14.
Zurück zum Zitat Ikeda,K., Viennot, S.: Production of various strategies and position control for Monte-Carlo go - entertaining human players. In: IEEE Conference on Computational Intelligence in Games, pp. 145–152 (2013) Ikeda,K., Viennot, S.: Production of various strategies and position control for Monte-Carlo go - entertaining human players. In: IEEE Conference on Computational Intelligence in Games, pp. 145–152 (2013)
Metadaten
Titel
Efficiency of Static Knowledge Bias in Monte-Carlo Tree Search
verfasst von
Kokolo Ikeda
Simon Viennot
Copyright-Jahr
2014
DOI
https://doi.org/10.1007/978-3-319-09165-5_3