- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
264 :名無し名人[sage]:2017/04/06(木) 07:47:42.34 ID:1S/dQum4 - >>255
チェスや将棋の探索について知りたかったらstockfishのコードを読めばいい 一流プログラマ達が20年以上かけて作り上げたものだ ターン数はオーダー見積もりで局面のよっては当然100より大きい 1局面にかかる時間 = 0.0001 [ミリ秒] × 100 [ターン] × 10000 [回] =1 [秒] これは小学生でもできる算数だぞ クラスタを使えばもう少し速くなるがモンテカルロで統計的に有意な結果を出すにはこの程度の時間がかかる 高校生レベルの統計知識と小学生レベルの算数を除いてはアルファ碁の記述の説明はあっているよ 半々で混ぜているバリューネットをモンテカルロの改良だと解釈するのはモンテカルロ脳だが (モンテカルロ脳のやつらは99%バリューネットでもモンテカルロの改良と言い張るだろう) 小学生レベルの算数ができれば分かるようにMTCSで統計的に有効な勝率(評価値)が確保できてるのは数手くらいだ その下の展開はモンテカルロの重みを変えているだけで探索が深まっているわけではない (ここをスムーズにつないでいるのがMCTSの肝) モンテカルロ評価関数は精度を高めるほど回数が必要で重くなるので原理的に軽くすることができない だから深い探索が出来ないので弱い モンテカルロを止めれば精度が高く深い探索を探求することも可能になるので 他のゲームと同じように囲碁でも将来はその方向に行くだろう 囲碁でまともな評価関数が実現されたのはアルファ碁が出来てから コンピュータ囲碁の開発はまだ始まったばかりだ
|
- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
266 :名無し名人[sage]:2017/04/06(木) 08:58:09.40 ID:1S/dQum4 - >>265
実装の話じゃなくて統計学的な原理の話だ 原理的に無理なことはどうやっても実装できない そのリバーシのコードは現在のコンピュータリバーシの中でどれくらいの強さなんだ? それを考えればMCTSが以下に使えないかが分かるだろ モンテカルロに限らずソフトの根本的な改良はほとんど書き換えるものだ 10年後のソフトの中に現在のコードはほとんど残ってないだろ
|
- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
270 :名無し名人[sage]:2017/04/06(木) 09:34:11.63 ID:1S/dQum4 - >>265
今ざっと見たがMCTSじゃなくて原始モンテカルロのコードだろ 木の展開が実装されてない そのコードでの評価値というのは勝率のこと(白番の場合は黒番の反転) 回数は魔法数として最初で手で与えている この回数の決め方の話だよ 今時間ないので続きは後で 聞きたいことがあったら書いておくといい
|