トップページ > 囲碁・オセロ > 2017年02月22日 > oa/mSQMD

書き込み順位&時間帯一覧

42 位/172 ID中時間01234567891011121314151617181920212223Total
書き込み数0000000000020000000000002



使用した名前一覧書き込んだスレッド一覧
名無し名人
コンピューター囲碁ソフトについて語るスレ48 [無断転載禁止]©2ch.net

書き込みレス一覧

コンピューター囲碁ソフトについて語るスレ48 [無断転載禁止]©2ch.net
721 :名無し名人[sage]:2017/02/22(水) 11:17:14.51 ID:oa/mSQMD
>>718
モンテカルロ木探索の木探索の部分は、最善手を選ぶよ。
ただ、その評価値が、ある確率に従っているというだけ。

その確率は、上でも書いたけど、仮想プレイヤーであるプレイアウト関数の勝率。
プレイアウト関数は、双方があるロジック(全くのランダムでも良いが、それだと弱い)
に従って、ある程度の手のバラつきを持って着手した時の、勝敗の集計。

モンテカルロ木探索だと、どの手にプレイアウトを割り当てるかという問題があり、
単純な加重平均ではないけど、評価値となるルートの勝率は、その加重平均みたい
な計算で求まる。

大事なのは、評価値の勝率の絶対値は重要視されていない点。あくまで大小関係が
正しければ、手の選択は間違えない。評価値が50%だから、勝率50%と短絡しては
いけない。
コンピューター囲碁ソフトについて語るスレ48 [無断転載禁止]©2ch.net
722 :名無し名人[sage]:2017/02/22(水) 11:25:00.41 ID:oa/mSQMD
>>721に補足。

あくまで思考実験であるが、無制限のメモリーで無限の時間プレイアウトを行うと、
ついには終局までツリー展開が進む。その時点では、主だった木を展開してメモリー
上に保持しているという差はあれど、min-Max探索となんら変わらなくなる。
つまり、その時点での完全読みと一致する。

その時点での勝率は、ほぼゼロかほぼ100%となる(囲碁に引き分けはないので)。
ほぼと書いたのは、思考実験としては0%、100%で構わないのだけど、数学的には
limで0%や100%に近づいていくという意味だから。

つまり、囲碁ソフトが有限の時間内で、プレイアウトを途中で打ち切って出した評価値
である勝率は、0%や100%に向かっていく途中の段階に過ぎないという事。しかも、
ツリー展開の具合では、ツリーが展開されるたびに、フラフラ上下を繰り返す可能性を
持っている。途中段階で50%という答えが出たからと言って、それが勝率50%という
意味ではない。


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。