- アルファ碁が囲碁歴3日のビギナーAIに100連敗
67 :名無し名人[]:2017/10/30(月) 00:09:35.49 ID:Ihrgck6/ - >>54
628: [sage] 2017/10/24(火) 23:46:51.76 ID:oNEai5gA >> 517 >各種報道で「3日でアルファ碁に100連勝する強さになった」みたいに言われてるけどあれって正しいの? >3日経過時点ではあくまで肩を並べた状態で、100連勝したのは40日経過時点の最強verの話じゃないの? > >原文読んだ人とか教えてくれ 遅レスすまん 原文より下記 1.グラフがあるよ 2.AlphaGoのバージョンが3つある。 3.AlphaGo Lee(対セドル)と、AlphaGo Master(対カケツ)と、AlphaGo Zero(40 block)(今回の新バージョン)と 4.学習効果の初期のアップが急激で、AlphaGo Zero(40 block)は3日でAlphaGo Leeのレーティングに達する 5.21日で、AlphaGo Master(対カケツ)のレーティングに達する 4.40日で、AlphaGo Masterを完全に上回るレーティング 5.結局下記で、”100連勝したのは3日経過時点のverの話”でOK (Figure 3b などを見ると、プロとの一致率はAlphaGo Lee が上なので、プロとの一致率が足を引っ張っている可能性もある) (参考) "Surprisingly, AlphaGo Zero outperformed AlphaGo Lee after just 36 h. In comparison, AlphaGo Lee was trained over several months. After 72 h, we evaluated AlphaGo Zero against the exact version of AlphaGo Lee that defeated Lee Sedol, under the same 2 h time controls and match conditions that were used in the man? machine match in Seoul (see Methods). AlphaGo Zero used a single machine with 4 tensor processing units (TPUs)29, whereas AlphaGo Lee was distributed over many machines and used 48 TPUs. AlphaGo Zero defeated AlphaGo Lee by 100 games to 0 (see Extended Data Fig. 1 and Supplementary Information)." 棋譜のフォルダー名(”Not Full Strength”):”Extended Data Figure 1 - Not Full Strength AlphaGo Zero 20 block vs AlphaGo Lee” https://deepmind.com/blog/alphago-zero-learning-scratch/ AlphaGo Zero: Learning from scratch Demis Hassabis David Silver DeepMind Wednesday, 18 October 2017 (抜粋) Read the paper doi:10.1038/nature24270 Nature 2017(3 5 4 | N AT U R E | VO L 5 5 0 | 1 9 o c to b er 2 0 1 7) https://www.nature.com/articles/nature24270.epdf?author_access_token=VJXbVjaSHxFoctQQ4p2k4tRgN0jAjWel9jnR3ZoTv0PVW4gB86EEpGqTRDtpIz-2rmo8-KG06gqVobU5NSCFeHILHcVFUeMsbvwS-lxjqQGg98faovwjxeTUgZAUMnRQ http://medaka.5ch.net/test/read.cgi/gamestones/1508065320/628
|