- 柯潔 vs AlphaGo part4 [無断転載禁止]©2ch.net
323 :名無し名人[sage]:2017/05/27(土) 21:20:09.74 ID:yuFydSpH - >>307
アルファ碁のディープラーニングのモデル見ればわかるけど、直前8手に関する 情報も入力に入れているよ。 アルファ碁以外でも、やってる方も意味不明としながら、直前の手の流れを入れた 方が、学習の精度が上がると、どこかで報告されていたはず。 それがあったうえで、流れを無視した手を打ってると考えると、結構悩ましいのよね。
|
- 柯潔 vs AlphaGo part4 [無断転載禁止]©2ch.net
325 :名無し名人[sage]:2017/05/27(土) 21:27:02.18 ID:yuFydSpH - >>303
将棋の方(佐藤名人vsponanza)で出ていた話だけど、佐藤名人の敗着が穴熊に 囲うための金の移動の手だったとか。ソフトの評価的には、穴熊の評価が低くて、 そんな形で王を囲ってる暇があったら攻めろという事みたい。 他にも、AIは片美濃急戦が大好きとか。 棋士が、人間はどうしても、自分の王を囲って安心できる状態になってから攻めに 移りたいんだけど、コンピュータはそれを良しとしないと言っていた。 安全と評価できたら安心感を求めないという事なのかな。
|
- 柯潔 vs AlphaGo part4 [無断転載禁止]©2ch.net
375 :名無し名人[sage]:2017/05/27(土) 22:09:08.85 ID:yuFydSpH - >>352
あれは人工脳じゃありません。万能関数近似装置です。 不明な関数に対して、インプットが与えられた時のアウトプットを近似するの。 アウトプットが近い値になるように学習をしていく。 学習が上手くできていたら、過去に学習したもの、そのものじゃなくても、 それなりに正しそうなアウトプットを近似として出力する。 大局観というのが何を指すのかわからんが、途中局面のインプットでゲームの 結果の予想であるアウトプットを近似できるという事を、大局観と呼ぶのなら、 大局観を学習していると捉えても良いかとは思うけど。
|
- 柯潔 vs AlphaGo part4 [無断転載禁止]©2ch.net
381 :名無し名人[sage]:2017/05/27(土) 22:11:12.99 ID:yuFydSpH - >>358
「論文で発表する」という事は、他者がその論文をもとに検証できるようにするという意味。 パソコンへの移植はわからんけど、未公開部分も、わかる人には十分にわかる部分を 割愛程度の内容じゃないと、検証不可能な論文になって、価値がなくなる。
|
- __Alpha Go vs 柯潔が意外にも接戦だった件__ [無断転載禁止]©2ch.net
55 :名無し名人[sage]:2017/05/27(土) 22:15:16.93 ID:yuFydSpH - 別に1目半(中国ルールでは半目)の勝ちを目指しているわけではない。
途中で圧倒的な大差がついたら、終局に向かって勝率が高い紛れの無い手 を選択するうちに差が半目まで縮む事もあるというだけの事。 対戦相手が真剣に負け差を減らしてくると、半目差になっちゃうだけだと思う。 その辺の下手っぴだと、大差負けのままだと思う。
|
- 柯潔 vs AlphaGo part4 [無断転載禁止]©2ch.net
398 :名無し名人[sage]:2017/05/27(土) 22:24:48.45 ID:yuFydSpH - >>386
前バージョンのアルファ碁については、必要十分な情報は公開されているよ。 >>387 ポリシーネット部分を組んで公開している人はいたよ。 将棋で1位になったelmoも、その技術を流用しているしね。 >>388 AI開発者はプライドがあるし、超えたいと考えるから、全く同じものは作らないよ。 DeepZenGoのZen時代からの癖を見る限り、プレイアウト関数については 昔から使っているものを、そのまま使用しているんじゃないかと思う。 ちょっと想像が飛躍しすぎだけど。
|