- 【統計分析】機械学習・データマイニング4
78 :デフォルトの名無しさん[]:2014/08/27(水) 01:42:13.93 ID:SAfS5G3A - 最近色々調べてる。
Rを使ってて(Pythonも簡単なプログラムは組める。) randomForestとh2oとcaretを試してるところ。 色々調べるとチューニングする方法が良くわからない。 ramdomForestパッケージにはtuneRFと数調節でチューニングする方法をネット上でみつけて その方法を試してみる予定。 caretの方もネット上でチューニングする方法が記載されてるサイトがあって そこの真似したらちょっと予想精度があがった。 しかし本当にその方法が良いのか良くわからない。 パラメーターの検索範囲をグリッドであたえてるんだけど その与え方がトライアンドエラーで、グラフで可視化して このあたりが良さげってところを選んでやってみた。 ようはチューニングする方法が良くわからない。 良いサイトあったら教えてください。 あるいは良い本があれば教えて欲しい。 caret 等パラメーターの決め方 http://tjo.hatenablog.com/entry/2013/09/02/190449 caret本家のパラメータチューニング関係の文書 http://topepo.github.io/caret/training.html
|
- 【統計分析】機械学習・データマイニング4
80 :デフォルトの名無しさん[]:2014/08/27(水) 01:47:27.93 ID:SAfS5G3A - いろいろ調べたら
RandomForestが性能良いっていうサイトがいくつかみつかった。 Deep Learningがコンテストでブッチギリっていうサイトがいくつかみつかった。 向き不向きがあるんだろうけど、どっちが性能良いことになってるの? gbmが良いっていうサイトもあったし。例としてはsvmを使ったものが多い。 irisデータでやってる範囲ではあまり差がないんだけど 性能一番良いのはDeep Learningで良いのかな? ようなどの手法が今一番性能良いことになってる? 向き不向きについても知りたい。知ってる人いたら教えてください。
|
- 【統計分析】機械学習・データマイニング4
81 :デフォルトの名無しさん[]:2014/08/27(水) 01:52:55.52 ID:SAfS5G3A - 計算結果がでてくるってことでブラックボックスとして
あつかってしまってる。 原理を詳しく知ってた方が、特徴(向き、不向きとか)とかも理解しやすいだろうし 調節方法についても理解しやすいとか、上手く調節できそうな気がしてます。 原理がわかりやすく解説されてるサイトとか 文献とか教えてください。 特に知りたいのは、RandomForest, Deep Learning, SVM, GBM (ネットでみてて性能良いっていう種類については知りたい) よろしくお願いします。
|
- 【統計分析】機械学習・データマイニング4
82 :デフォルトの名無しさん[]:2014/08/27(水) 01:54:29.39 ID:SAfS5G3A - >>79
フリーソフトの性能があがってるからじゃないの? Rの方が良いように思うけどな。 RでもRcmdrとかRStudioとか使えばGUIっぽくなるよ。 速度もRcppつかえば爆速になるし。 Juliaが爆速らしいじゃん。LLVMつかっててJITで動くらしい。
|
- 【統計分析】機械学習・データマイニング4
83 :デフォルトの名無しさん[]:2014/08/27(水) 02:00:54.08 ID:SAfS5G3A - >>67
両方使えた方が良いと思う。 利用先がまったく違うと思う。 Maximaと平行してPython+Sympyも勉強した方が良いと思う。 使い方はほぼ同じ。 Sympyの方がC言語のコード生成の機能が優れてると思う。 (数式を関数にする機能。Fortranにもできたはず。Python関数にもできたかな?) RもOctave とかScilab, 速度が爆速って噂のあるJuliaとか似たソフトあるので 平行してこれらの使い方を調べると理解しやすいように思う。 機械学習関係で使うなら R と Python+パッケージ かな。 Maximaではやりにくいと思う。遅いし機械学習用のパッケージあまり見たことない。 (探せばあるのかもしれんが)
|