- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
761 :名無し名人[sage]:2015/12/04(金) 12:39:08.27 ID:s4yHOYe/ - >ところが、ひようら王同士の自己対戦を1手1〜3秒1スレッド6並列×3PCで行なって、棋譜を2000局ほど作り、
>それで学習させるだけでなんとひようら王と同等か少し強くぐらいの強さになったわけですよ。これにはびっくり! この書き方だと曖昧でよくわからんな 前回のBishop Learningさせたひまうら王からの指し継ぎではないっぽい? 「次回は序盤を改善するためにBishop Learningを改良して」ってあるから、指し継ぎの話は次回やるのかも
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
763 :名無し名人[sage]:2015/12/04(金) 12:48:24.95 ID:s4yHOYe/ - Bishop Learningでは上手くいかず、自己対戦棋譜から学習すると上手くいくのは何故なんだろう
レートが低いソフトだと、深い探索よりも浅い探索を繰り返したもののほうが妥当性があるのか あるいは、学習に使うといった長い目では平均的には妥当になるとか(モンテカルロをやっているような感じに近いのかも)
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
764 :名無し名人[sage]:2015/12/04(金) 12:53:11.64 ID:s4yHOYe/ - ttp://wdoor.c.u-tokyo.ac.jp/shogi/view/2015/12/04/wdoor+floodgate-600-10+HimauraOuV280_rev20151204+gpsfish_normal_1c+20151204120005.csa
ひまうら王穴熊っぽいのを自力で学習しつつある
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
769 :名無し名人[sage]:2015/12/04(金) 13:05:56.96 ID:s4yHOYe/ - >>765
Bishop Learningは技巧ミニ(5五将棋)で発明されて、5五将棋だと上手くいってた手法 本将棋の技巧はボナンザメソッドみたいな定番の学習方法を使ってるんじゃないかな
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
776 :名無し名人[sage]:2015/12/04(金) 14:31:47.51 ID:s4yHOYe/ - やね氏は序盤の改善方法がBishop Learning + 指し継ぎによる棋譜の学習であって、
KPPKPE次元下げ+まともな探索部+従来の学習方法を使えば ひようら王同士の自己対戦からの学習のみでもレート自体上がって行く的な書き方をしてたけど そうじゃなかったら自己対戦で棋力を上げるにはBishop Learningが必須っていう結論になるはずだし(それは書いてない) ID:lRnAPoTG←こいつ理解力足りないんじゃね?
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
777 :名無し名人[sage]:2015/12/04(金) 14:35:45.30 ID:s4yHOYe/ - >>774
Bishop Learningの方向性がおかしいだとか俺は一言も書いてないんだが 深い探索で学習するよりも、浅い探索を繰り返したもののほうが 平均ではモンテカルロみたになって学習が上手くいくのか?って話 お前の日本語力どれだけだよ
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
785 :名無し名人[sage]:2015/12/04(金) 16:09:49.21 ID:s4yHOYe/ - GA将の方法論が間違ってたって言ったら匿名で実名を叩いてることになるのか
人格批判と技術の批判ごっちゃになってる奴ら大丈夫か
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
787 :名無し名人[sage]:2015/12/04(金) 16:32:32.85 ID:s4yHOYe/ - 必要性云々で言ったら、まずルサンチマンどうこう書く必要性がないな
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
807 :名無し名人[sage]:2015/12/04(金) 20:20:44.55 ID:s4yHOYe/ - >>802
自己対戦棋譜からの学習はすでに色んなソフト(ponanzaとか)でやってるとは思うけど まっさらな評価関数のソフトの自己対戦から、ならたぶんその通り しかし自己対戦の棋譜からの学習でのレートの伸びが止まるのが 普通より早かったりするかもしれないからその辺は検証しないとダメだと思うが
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
808 :名無し名人[sage]:2015/12/04(金) 20:26:24.56 ID:s4yHOYe/ - 山本一将@ひまわり @kyamamoto9120 6分6分前
これは確かやった人居たと思う。 いつかのGPWで、半教師あり学習として。 802 名無し名人 構造的に自己対戦棋譜で教師あり学習をやる人が誰もいなかったのは確かだが らしい
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
813 :名無し名人[sage]:2015/12/04(金) 20:36:26.51 ID:s4yHOYe/ - これでレートが頭打ちにならないって実験結果が出たら
将棋の強化学習はもはや電気代だけの問題になってしまうが山本一将氏とかはどうするんだろう いかに電気代を節約して既存のソフトと同レベルになるかを競うんだろうか
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
821 :名無し名人[sage]:2015/12/04(金) 21:24:10.42 ID:s4yHOYe/ - >>818
羽生さんの「桂馬を横に動かせばいいんです」がダメになったな まあ実用性を言い出すと将棋自体実用性皆無だからその辺は
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
828 :名無し名人[sage]:2015/12/04(金) 21:55:43.66 ID:s4yHOYe/ - 初期局面をランダムにすればいつかたどり着くかもなあ
|
- ▲コンピュータ将棋スレッド90▽ [転載禁止]©2ch.net
840 :名無し名人[sage]:2015/12/04(金) 22:33:24.51 ID:s4yHOYe/ - >>838の言うとおりで
と金に手作業でペナルティつけるみたいな話だよなあ
|