必死チェッカーもどきゲ製作技術 > 2017年07月12日

トップページ > ゲ製作技術 > 2017年07月12日 > b5nvOjQF

書き込み順位＆時間帯一覧

8 位/60 ID中	時間	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	Total
8 位/60 ID中	書き込み数	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	2	0	0	0	2

使用した名前一覧	書き込んだスレッド一覧
310	【オセロ,将棋】ボードゲーム【囲碁,War】

書き込みレス一覧

【オセロ,将棋】ボードゲーム【囲碁,War】
901 ：310[sage]：2017/07/12(水) 20:10:09.86 ID:b5nvOjQF: 直ったようで何より(^^/

自分は合流させてません。
合流させるメリットよりデメリットの方が大きそうだったので考える事をやめました。

モンテカルロ木DB化って、よくよく考えたらQ学習みたいなものではないかと思います。
Q学習だと全部のノードにQ値を持つので、結局全局面保持することになります。
現在Deep Q学習が主流になってるのは、Q値をディープラーニングで近似計算する
事で、全局面のQ値を保持しなくても良くするためという側面もあるかと思います。

で、Q学習だと考えるなら、時々変な手を混ぜて木をきちんと分岐させるってのが、
強化学習の肝ではないかと思います。

当方、完全読み切りのバグとり完了。
ニューラルネットのライブラリも大体できて、1900譜で４０手目以後を学習してみました。
やっぱ、疎行列対応の行列パッケージでの計算は、tiny_dnnと比較して圧倒的に早い
です。

データが少ないのと、同一の記譜内からテストデータ取っているのもあるのですが、
テスト誤差は十分小さな値になるのですが、FFOの盤面を評価させると、いまいち
合っていない感じで、あまり汎化できていない感じす。もっと記譜増やします。

やっつけで作ったmcts部分をきちっとさせるのと、とりあえず持っている評価関数
で、puct化できるか、ロールアウトの後半の精度を上げられるか、検討開始です。
強化学習までまだ遠いなぁ。でも、少し背中が見えてきたかな。

【オセロ,将棋】ボードゲーム【囲碁,War】
902 ：310[sage]：2017/07/12(水) 20:27:07.87 ID:b5nvOjQF: 記譜集めですが、８手までランダム着手していたら、
９手目で白全滅という記譜が取れました（汗

※このページは、『２ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の２ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。