トップページ > 囲碁・オセロ > 2017年05月07日 > JfppqZV1

書き込み順位&時間帯一覧

2 位/137 ID中時間01234567891011121314151617181920212223Total
書き込み数0000000002010002000000005



使用した名前一覧書き込んだスレッド一覧
名無し名人
コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net

書き込みレス一覧

コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
951 :名無し名人[sage]:2017/05/07(日) 09:27:46.47 ID:JfppqZV1
>>950
論文嫁。

プレイアウトは最後までやってる。
プレイアウトの勝率と評価値を50%づつ加算して、その数字を使って、
UCB1に該当する値を計算している。

つまり、プレイアウトと評価関数の合議。
コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
952 :名無し名人[sage]:2017/05/07(日) 09:30:04.39 ID:JfppqZV1
付け足しておくと、アルファ碁は、

プレイアウトとバリューネット(評価関数)の合議に対して、

ポリシーネットによるPMCTS(UCB1計算における定数C部分の
格差を次の手により変える)で、割り当てを変える形での合議

という構造になっていて、3種類の評価関数(プレイアウトを含む)の
合議と捉えて良いかと思われる。
コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
958 :名無し名人[sage]:2017/05/07(日) 11:28:32.71 ID:JfppqZV1
>>956
当時はアルファ碁見てすげーと思っていたけど、今年のコンピュータ将棋選手権で
PonanzaChainerは、スポンサーつけて同じくらいの規模のマシン投入していた。

で、結果は2位。

逆に、この差の意味を考えてしまう。
コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
963 :名無し名人[sage]:2017/05/07(日) 15:03:51.75 ID:JfppqZV1
>>959
学習は数日単位だからな。

でも、あの深い段数のネットワークの計算するだけで、1局面あたりms単位の
時間がかかるわけで。その時間は、ゲームAIの探索においては、かなり致命的
な遅さなので、GPUでの遅延評価が必要になってる。

トータルの使用時間における比率では学習のウェイトが高いけど、ゲームプレイ
においては、速度アップのためにマシンパワーがいるって事。
コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
964 :名無し名人[sage]:2017/05/07(日) 15:11:48.45 ID:JfppqZV1
>>960
その発想は無かった。
電源切ったらウェイトの記憶が消えそうだけど(笑)

ワンチップマイコンやFPGAとかなら…

誰かやらない?


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。