- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
951 :名無し名人[sage]:2017/05/07(日) 09:27:46.47 ID:JfppqZV1 - >>950
論文嫁。 プレイアウトは最後までやってる。 プレイアウトの勝率と評価値を50%づつ加算して、その数字を使って、 UCB1に該当する値を計算している。 つまり、プレイアウトと評価関数の合議。
|
- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
952 :名無し名人[sage]:2017/05/07(日) 09:30:04.39 ID:JfppqZV1 - 付け足しておくと、アルファ碁は、
プレイアウトとバリューネット(評価関数)の合議に対して、 ポリシーネットによるPMCTS(UCB1計算における定数C部分の 格差を次の手により変える)で、割り当てを変える形での合議 という構造になっていて、3種類の評価関数(プレイアウトを含む)の 合議と捉えて良いかと思われる。
|
- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
958 :名無し名人[sage]:2017/05/07(日) 11:28:32.71 ID:JfppqZV1 - >>956
当時はアルファ碁見てすげーと思っていたけど、今年のコンピュータ将棋選手権で PonanzaChainerは、スポンサーつけて同じくらいの規模のマシン投入していた。 で、結果は2位。 逆に、この差の意味を考えてしまう。
|
- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
963 :名無し名人[sage]:2017/05/07(日) 15:03:51.75 ID:JfppqZV1 - >>959
学習は数日単位だからな。 でも、あの深い段数のネットワークの計算するだけで、1局面あたりms単位の 時間がかかるわけで。その時間は、ゲームAIの探索においては、かなり致命的 な遅さなので、GPUでの遅延評価が必要になってる。 トータルの使用時間における比率では学習のウェイトが高いけど、ゲームプレイ においては、速度アップのためにマシンパワーがいるって事。
|
- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
964 :名無し名人[sage]:2017/05/07(日) 15:11:48.45 ID:JfppqZV1 - >>960
その発想は無かった。 電源切ったらウェイトの記憶が消えそうだけど(笑) ワンチップマイコンやFPGAとかなら… 誰かやらない?
|