トップページ > プログラム > 2014年08月27日 > SAfS5G3A

書き込み順位&時間帯一覧

13 位/199 ID中時間01234567891011121314151617181920212223Total
書き込み数0410000000000000000000005



使用した名前一覧書き込んだスレッド一覧
デフォルトの名無しさん
【統計分析】機械学習・データマイニング4

書き込みレス一覧

【統計分析】機械学習・データマイニング4
78 :デフォルトの名無しさん[]:2014/08/27(水) 01:42:13.93 ID:SAfS5G3A
最近色々調べてる。
Rを使ってて(Pythonも簡単なプログラムは組める。)
randomForestとh2oとcaretを試してるところ。

色々調べるとチューニングする方法が良くわからない。
ramdomForestパッケージにはtuneRFと数調節でチューニングする方法をネット上でみつけて
その方法を試してみる予定。

caretの方もネット上でチューニングする方法が記載されてるサイトがあって
そこの真似したらちょっと予想精度があがった。
しかし本当にその方法が良いのか良くわからない。
パラメーターの検索範囲をグリッドであたえてるんだけど
その与え方がトライアンドエラーで、グラフで可視化して
このあたりが良さげってところを選んでやってみた。

ようはチューニングする方法が良くわからない。

良いサイトあったら教えてください。
あるいは良い本があれば教えて欲しい。

caret 等パラメーターの決め方
http://tjo.hatenablog.com/entry/2013/09/02/190449

caret本家のパラメータチューニング関係の文書
http://topepo.github.io/caret/training.html
【統計分析】機械学習・データマイニング4
80 :デフォルトの名無しさん[]:2014/08/27(水) 01:47:27.93 ID:SAfS5G3A
いろいろ調べたら
RandomForestが性能良いっていうサイトがいくつかみつかった。
Deep Learningがコンテストでブッチギリっていうサイトがいくつかみつかった。

向き不向きがあるんだろうけど、どっちが性能良いことになってるの?

gbmが良いっていうサイトもあったし。例としてはsvmを使ったものが多い。

irisデータでやってる範囲ではあまり差がないんだけど
性能一番良いのはDeep Learningで良いのかな?

ようなどの手法が今一番性能良いことになってる?
向き不向きについても知りたい。知ってる人いたら教えてください。
【統計分析】機械学習・データマイニング4
81 :デフォルトの名無しさん[]:2014/08/27(水) 01:52:55.52 ID:SAfS5G3A
計算結果がでてくるってことでブラックボックスとして
あつかってしまってる。

原理を詳しく知ってた方が、特徴(向き、不向きとか)とかも理解しやすいだろうし
調節方法についても理解しやすいとか、上手く調節できそうな気がしてます。

原理がわかりやすく解説されてるサイトとか
文献とか教えてください。

特に知りたいのは、RandomForest, Deep Learning, SVM, GBM (ネットでみてて性能良いっていう種類については知りたい)
よろしくお願いします。
【統計分析】機械学習・データマイニング4
82 :デフォルトの名無しさん[]:2014/08/27(水) 01:54:29.39 ID:SAfS5G3A
>>79
フリーソフトの性能があがってるからじゃないの?
Rの方が良いように思うけどな。
RでもRcmdrとかRStudioとか使えばGUIっぽくなるよ。

速度もRcppつかえば爆速になるし。

Juliaが爆速らしいじゃん。LLVMつかっててJITで動くらしい。
【統計分析】機械学習・データマイニング4
83 :デフォルトの名無しさん[]:2014/08/27(水) 02:00:54.08 ID:SAfS5G3A
>>67
両方使えた方が良いと思う。
利用先がまったく違うと思う。

Maximaと平行してPython+Sympyも勉強した方が良いと思う。
使い方はほぼ同じ。 Sympyの方がC言語のコード生成の機能が優れてると思う。
(数式を関数にする機能。Fortranにもできたはず。Python関数にもできたかな?)

RもOctave とかScilab, 速度が爆速って噂のあるJuliaとか似たソフトあるので
平行してこれらの使い方を調べると理解しやすいように思う。

機械学習関係で使うなら R と Python+パッケージ かな。
Maximaではやりにくいと思う。遅いし機械学習用のパッケージあまり見たことない。
(探せばあるのかもしれんが)


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。