必死チェッカーもどき囲碁・オセロ > 2017年05月27日 > yuFydSpH

トップページ > 囲碁・オセロ > 2017年05月27日 > yuFydSpH

書き込み順位＆時間帯一覧

39 位/307 ID中	時間	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	Total
39 位/307 ID中	書き込み数	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	2	4	0	6

使用した名前一覧	書き込んだスレッド一覧
名無し名人	柯潔 vs AlphaGo　part4 [無断転載禁止]©2ch.net ＿＿Alpha Go　vs　柯潔が意外にも接戦だった件＿＿ [無断転載禁止]©2ch.net

書き込みレス一覧

柯潔 vs AlphaGo　part4 [無断転載禁止]©2ch.net
323 ：名無し名人[sage]：2017/05/27(土) 21:20:09.74 ID:yuFydSpH: >>307
アルファ碁のディープラーニングのモデル見ればわかるけど、直前８手に関する
情報も入力に入れているよ。

アルファ碁以外でも、やってる方も意味不明としながら、直前の手の流れを入れた
方が、学習の精度が上がると、どこかで報告されていたはず。

それがあったうえで、流れを無視した手を打ってると考えると、結構悩ましいのよね。

柯潔 vs AlphaGo　part4 [無断転載禁止]©2ch.net
325 ：名無し名人[sage]：2017/05/27(土) 21:27:02.18 ID:yuFydSpH: >>303
将棋の方（佐藤名人ｖｓponanza）で出ていた話だけど、佐藤名人の敗着が穴熊に
囲うための金の移動の手だったとか。ソフトの評価的には、穴熊の評価が低くて、
そんな形で王を囲ってる暇があったら攻めろという事みたい。

他にも、AIは片美濃急戦が大好きとか。

棋士が、人間はどうしても、自分の王を囲って安心できる状態になってから攻めに
移りたいんだけど、コンピュータはそれを良しとしないと言っていた。

安全と評価できたら安心感を求めないという事なのかな。

柯潔 vs AlphaGo　part4 [無断転載禁止]©2ch.net
375 ：名無し名人[sage]：2017/05/27(土) 22:09:08.85 ID:yuFydSpH: >>352
あれは人工脳じゃありません。万能関数近似装置です。
不明な関数に対して、インプットが与えられた時のアウトプットを近似するの。
アウトプットが近い値になるように学習をしていく。

学習が上手くできていたら、過去に学習したもの、そのものじゃなくても、
それなりに正しそうなアウトプットを近似として出力する。

大局観というのが何を指すのかわからんが、途中局面のインプットでゲームの
結果の予想であるアウトプットを近似できるという事を、大局観と呼ぶのなら、
大局観を学習していると捉えても良いかとは思うけど。

柯潔 vs AlphaGo　part4 [無断転載禁止]©2ch.net
381 ：名無し名人[sage]：2017/05/27(土) 22:11:12.99 ID:yuFydSpH: >>358
「論文で発表する」という事は、他者がその論文をもとに検証できるようにするという意味。

パソコンへの移植はわからんけど、未公開部分も、わかる人には十分にわかる部分を
割愛程度の内容じゃないと、検証不可能な論文になって、価値がなくなる。

＿＿Alpha Go　vs　柯潔が意外にも接戦だった件＿＿ [無断転載禁止]©2ch.net
55 ：名無し名人[sage]：2017/05/27(土) 22:15:16.93 ID:yuFydSpH: 別に１目半（中国ルールでは半目）の勝ちを目指しているわけではない。

途中で圧倒的な大差がついたら、終局に向かって勝率が高い紛れの無い手
を選択するうちに差が半目まで縮む事もあるというだけの事。

対戦相手が真剣に負け差を減らしてくると、半目差になっちゃうだけだと思う。
その辺の下手っぴだと、大差負けのままだと思う。

柯潔 vs AlphaGo　part4 [無断転載禁止]©2ch.net
398 ：名無し名人[sage]：2017/05/27(土) 22:24:48.45 ID:yuFydSpH: >>386
前バージョンのアルファ碁については、必要十分な情報は公開されているよ。

>>387
ポリシーネット部分を組んで公開している人はいたよ。
将棋で１位になったelmoも、その技術を流用しているしね。

>>388
AI開発者はプライドがあるし、超えたいと考えるから、全く同じものは作らないよ。

DeepZenGoのZen時代からの癖を見る限り、プレイアウト関数については
昔から使っているものを、そのまま使用しているんじゃないかと思う。
ちょっと想像が飛躍しすぎだけど。

※このページは、『２ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の２ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。