- コンピューター囲碁ソフトについて語るスレ27
696 :名無し名人[sage]:2014/04/02(水) 19:17:32.19 ID:2zXk1uC7 - >>689
モンテカルロの場合、シミュレーションで400手とか進んでしまうので手数が多くて 勝敗の原因がどこにあるか特定できないので学習が非常に難しい。 ランダム要素が入っているので雑音が多いのも困る。 さらにプロは目数を最大にしようするのに、ソフトは勝率を最大化しようとする。 目標が違っている状態で上手く学習できるのかということもある。 要するに棋譜からの学習とモンテカルロは相性が最悪なわけだよ。 そこでERICAの人は9路に限定して手数を縮め、勝率を最大化しようとする ソフト同士の棋譜から学習するという苦肉の策でやったわけだが、9路盤では どこも隅のそばであるので、隅の周りのパターンしか学習できないので上手くないし 大きなパターンを学習すると複数の隅にまたがってしまうので19路じゃ使い物にならない。 またEloRatingの手法は探索することをあきらめているので、相性は問題にならないが、 一切読みが入っていないので棋譜に出てこなかったパターンは決して学習できない。 形が悪いのを承知で打っているような場面でも、プロが打つんだからいい形に決まってる という嫌な感じの学習になっている。 というわけで、モンテカルロのプレイアウトで使っている特徴と 全く同じ特徴で評価関数を作って、それでαβ法のソフトを新規に作ってボナメソで学習して その学習した値をpowするなりして、モンテカルロのソフトに持ってくるようなややこしい形に 近い将来なっていくんであろうという話。
|
- コンピューター囲碁ソフトについて語るスレ27
697 :名無し名人[sage]:2014/04/02(水) 19:33:36.28 ID:2zXk1uC7 - >>690
>外の石が単独で生きるかどうかも必要だよねw 一部分を切り出して部分図を作って解こうということなので、 外の石のさらに外を詰める方法が存在しないので決して取ることができない。 というわけで、それは必要ない。 部分図の切り出し位置を間違えてしまったや、そもそも切り出してはいけなかった場合は 探索して得られたその部分の最善手順が実は最善ではないという事態が生じるので、 死活・ヨセ探索の結果をそのまま使うと非常にまずい。 ただ元々プレイアウト中では悪手を頻繁に打つのが仕様なので、 プレイアウト中で使う分にはその程度の失敗なら許容されると思うんだよ。
|
- コンピューター囲碁ソフトについて語るスレ27
698 :名無し名人[sage]:2014/04/02(水) 19:44:58.74 ID:2zXk1uC7 - >>691
>素人が考えつく単純なアイデアの類はすべて試されているだろうな そうなんだけれど、そうじゃない。 今まではモンテカルロのソフトを強くしていけば自然に死活やヨセも強くなっていくんで 死活・ヨセ専用のアルゴリズムとかいらないやって雰囲気だったと思う。 今はモンテカルロの進歩が止まってしまってトップクラスの人はやることがあまりない状況に なっていると思われ、死活・ヨセ方面、αβ法方面に向かっていくのが自然ではないかと。 2年後の天頂7辺りの宣伝文にはたぶんそんなことが書いてあると予想する。
|