トップページ > 囲碁・オセロ > 2017年08月24日 > S+6i8WdC

書き込み順位&時間帯一覧

19 位/101 ID中時間01234567891011121314151617181920212223Total
書き込み数1000000000000000000010002



使用した名前一覧書き込んだスレッド一覧
名無し名人
コンピューター囲碁ソフトについて語るスレ51 [無断転載禁止]©2ch.net

書き込みレス一覧

コンピューター囲碁ソフトについて語るスレ51 [無断転載禁止]©2ch.net
629 :名無し名人[sage]:2017/08/24(木) 00:03:29.27 ID:S+6i8WdC
>>626
アルファ碁だってロールアウトは、ただの線形回帰だよ。

UCTは、勝率+UCB1の大きさによって手を選択する。
1.勝率については、ロールアウトとバリューネットの加重平均
2.UCB1値を、ポリシーネットで調整する事で、プレイアウト選択率の調整
この2つによって、ただのMCTSにアンサンブル効果を付け足したのがアルファ碁。

自分は別ゲームでアルファ碁的なものを作っているけど、2のポリシーネット部分
については、かなり容易にオーバーライドされる印象で、探索時間の節約にしか
効いていない印象。アルファ碁論文では、ここが5段相当だと自慢しているけど、
目くらましだと思うな。

1の勝率については、ロールアウトのウェイトが50%あるという事で、実はロール
アウトの精度も、DCNN部分と同じ程度の重要性を持っている。そして、これまでの
MCTSな囲碁AIの、それぞれの工夫は、このロールアウト関数にあったと思う。
適度なランダムさと適度な正確さが必要だからね。

一番大事なのは、仮に教師データから作られたとしても、違う目的で生成されて、
長所短所が違う評価の仕組みを組み合わせる事で生じた、アンサンブル効果が
かなり重要なのではないかと思っている。

僕が個性と表現したのは、ロールアウト関数部分だよ。もしかしたら、ここの余計な
工夫が弱さの原因かもしれないけどね。
コンピューター囲碁ソフトについて語るスレ51 [無断転載禁止]©2ch.net
648 :名無し名人[sage]:2017/08/24(木) 20:11:57.28 ID:S+6i8WdC
むしろ、アルファ碁逃げたとケチつけるやつと、

アルファ碁を持ち上げずに、Zenけなすやつと、

両者ともけなしたいだけの、目くそ鼻くその争い。


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。