必死チェッカーもどき囲碁・オセロ > 2017年04月02日 > wOD+ok9e

トップページ > 囲碁・オセロ > 2017年04月02日 > wOD+ok9e

書き込み順位＆時間帯一覧

5 位/161 ID中	時間	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	Total
5 位/161 ID中	書き込み数	0	0	0	0	0	0	0	0	0	2	0	0	0	0	0	1	0	0	0	1	1	0	0	0	5

使用した名前一覧	書き込んだスレッド一覧
名無し名人	コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net

書き込みレス一覧

コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
203 ：名無し名人[sage]：2017/04/02(日) 09:06:47.27 ID:wOD+ok9e: 評価関数だけでレーティング上がるとか、いまだに信じられないんだけどなぁ。

コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
207 ：名無し名人[sage]：2017/04/02(日) 09:15:20.84 ID:wOD+ok9e: >>204
だって学習が進むにつれて、重箱の隅みたいな状況に対する対応を学ぶ事になるわけだぜ。
出現頻度もレアだろ。

そんなの学習しながら、線形以上のペースでレーティングがあがるとか、詐欺にしか思えない。

コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
221 ：名無し名人[sage]：2017/04/02(日) 15:51:42.49 ID:wOD+ok9e: 構造と処理の重さが想像つくなら、実行時間のボトルネックになっているのは
プレイアウトではなく、UCBに対する重み付けのポリシーネットと、プレイアウトに
荷重平均されるバリューネットの計算である事はわかるはず。

コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
222 ：名無し名人[sage]：2017/04/02(日) 19:56:57.73 ID:wOD+ok9e: >>220
PC１台で強いって事は、ディープラーニングの非同期計算待ちの間、
代わりに使用している、単純な線形ソフトマックスなポリシーネットだけで
そんくらいのレートまで行くと言っているようなものじゃないかと。

だって、PC１台じゃ、明らかに計算間に合わないよ。
計算間に合わないと、キューに留まっている間に、どんどんツリー展開が
進んで、結局ディープ版のポリシーネットの値は使わないという事になる。
そして、キューに溜まっている間は、UCBの定数Cを動的に減らして、下位
枝にプレイアウトを割り振らないようになっていくから、余計に線形ソフト
マックスなポリシーネットの性能に依存するようになるはず。

つまりディープラーニングで改善するレートは２００程度と。

コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
224 ：名無し名人[sage]：2017/04/02(日) 20:30:03.36 ID:wOD+ok9e: とすると、分散しているのは、

１．４０CPUでUCTのプロセスを並列探索
２．１７００強のGPUでディープラーニングの計算

というわけなので、ディープラーニングはおろか、プレイアウト回数すら減少する
ので、ますます線形ソフトマックスなポリシーネットへの依存が高まる。

※このページは、『２ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の２ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。