- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
412 :名無し名人[sage]:2017/04/11(火) 21:48:35.19 ID:E3WxH+WA - >>406
>貴方は「今後は脱モンテカルロが目指される」と主張してるの? レスを読めば分かるようにそんな主張はしていない 書いてある通りだが少し背景を補足してまとめると アルファ碁により同精度での比較においてモンテカルロより1000倍以上軽い深層学習の評価関数が実現された 評価関数が大きく革新された以上、今後の探索部の開発はゲームプログラミングの常識的に新しい評価関数に基づいて行われるのが常識である つまり、1000倍以上も重いモンテカルロは不要になる(脱モンテカルロになる)というのが常識的な開発進行である というキチガイ以外は誰もが認めている事実を書いているだけ その事実を共通の前提として 全く根拠はないが囲碁は特殊なゲームでモンテカルロが例外的に有効なゲームだと思うので脱モンテカルロは誰もやらない と主張している人がおり、その意見に対して根拠のない妄想を書くなよとおれは主張している >googleはモンテカルロを使わない探索方式を開発しているが公表していない、みたいな書き方してるけど。 もちろん俺はこんなことは書いていない >>391にしても自分で「combine」(意味は改良ではなく結合)と引用しておきながら「MCTSへの改良」とデマを書く 目の前の文章すら読めないんだよな
|
- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
414 :名無し名人[sage]:2017/04/11(火) 21:52:29.66 ID:E3WxH+WA - >>408
全て間違っている あんたの妄想はもういい
|
- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
416 :名無し名人[sage]:2017/04/11(火) 22:03:07.53 ID:E3WxH+WA - >>413
珍しくまともな書き込み 一つ質問だが「既存の最強クラスのオセロプログラムの中盤と、御せるレベルのAI」というのは 計算コストを揃えた上での比較? 合議の場合に片方だけ計算コストを増やして(例えばモンテカルロ部分の計算は別枠にしている等)比較する場合があるので念のため あと探索部の改良というのはゲーム中にプレイアウトを行っている? それとも探索部のパラメーターの強化学習時にモンテカルロを使っているということ? アルファ碁が汎用性を売りにしているのはその通り 一般的に汎用性の高いプログラムは専門分野においては専門プログラムに劣る 最強の囲碁ソフトを目指すという目的においては汎用性はマイナスになってしまうという問題がある
|
- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
419 :名無し名人[sage]:2017/04/11(火) 22:40:46.52 ID:E3WxH+WA - >>417
なるほど面白い オセロのプログラムは素人なので感覚がつかめないのでもう少し聞かせて欲しい (序盤と終盤はDBで確定していて中盤の二十数手が思考領域という程度の知識しかない) 20秒も考えさせれば通常の探索の方は20手くらいは読めると思う 一方でプレイアウトは総合計でいいので20秒にどれくらいやっているのか? 囲碁の例から類推すると統計的に有意なプレイアウトを稼げているノードはそんなに深くないと思うんだが
|
- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
420 :名無し名人[sage]:2017/04/11(火) 22:44:45.28 ID:E3WxH+WA - >>418
変だと思う点があるのなら指摘すればいい 印象操作はいらない プログラムの話をしたいだけだ
|
- コンピューター囲碁ソフトについて語るスレ50 [無断転載禁止]©2ch.net
424 :名無し名人[sage]:2017/04/11(火) 23:48:40.38 ID:E3WxH+WA - >>421
ルートで10万プレイアウトだと統計的に必要な1000回(やや少なく見積もっている)以上が確保されているのは5手くらいの深さか? 実質5手くらいの深さの探索で20手以上の深さの探索と互角だというこということは モンテカルロの勝率予測(評価値)の方が通常の評価関数の評価値よりも圧倒的に精度が高くなっている 実際に数千回のプレイアウトのMCTSと探索深さ1固定の通常評価関数とで対戦させるとMCTSが圧倒的に勝つはず 気になるのなら試して見て欲しい ちなみにアルファ碁の論文によるとアルファ碁の深層学習の評価関数では両者が互角になっており深層学習の評価関数は精度が高い(代わりに重い) この結果が意味しているのは通常評価関数の精度が低すぎる(学習が上手く行っていない)ということだろう 「既に存在する棋譜から作った」と書いているが圧倒的に棋譜の数が足りないんだと予想する(もしくは関数の設計自体がよくない) 近年の流れである(そしてアルファ碁でも採用されている)強化学習を取り入れると格段に強くなると思うので試してみるといい >>422 おれも汎用性の価値や意義は認めている パフォーマンスを改善する可能性も認めている(おれ自身がやっている) その辺の意見は同じだ
|