必死チェッカーもどきプログラム > 2014年08月27日 > SAfS5G3A

トップページ > プログラム > 2014年08月27日 > SAfS5G3A

書き込み順位＆時間帯一覧

13 位/199 ID中	時間	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	Total
13 位/199 ID中	書き込み数	0	4	1	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	5

使用した名前一覧	書き込んだスレッド一覧
デフォルトの名無しさん	【統計分析】機械学習・データマイニング4

書き込みレス一覧

【統計分析】機械学習・データマイニング4
78 ：デフォルトの名無しさん[]：2014/08/27(水) 01:42:13.93 ID:SAfS5G3A: 最近色々調べてる。
Rを使ってて(Pythonも簡単なプログラムは組める。)
randomForestとh2oとcaretを試してるところ。

色々調べるとチューニングする方法が良くわからない。
ramdomForestパッケージにはtuneRFと数調節でチューニングする方法をネット上でみつけて
その方法を試してみる予定。

caretの方もネット上でチューニングする方法が記載されてるサイトがあって
そこの真似したらちょっと予想精度があがった。
しかし本当にその方法が良いのか良くわからない。
パラメーターの検索範囲をグリッドであたえてるんだけど
その与え方がトライアンドエラーで、グラフで可視化して
このあたりが良さげってところを選んでやってみた。

ようはチューニングする方法が良くわからない。

良いサイトあったら教えてください。
あるいは良い本があれば教えて欲しい。

caret 等パラメーターの決め方
http://tjo.hatenablog.com/entry/2013/09/02/190449

caret本家のパラメータチューニング関係の文書
http://topepo.github.io/caret/training.html

【統計分析】機械学習・データマイニング4
80 ：デフォルトの名無しさん[]：2014/08/27(水) 01:47:27.93 ID:SAfS5G3A: いろいろ調べたら
RandomForestが性能良いっていうサイトがいくつかみつかった。
Deep Learningがコンテストでブッチギリっていうサイトがいくつかみつかった。

向き不向きがあるんだろうけど、どっちが性能良いことになってるの？

gbmが良いっていうサイトもあったし。例としてはsvmを使ったものが多い。

irisデータでやってる範囲ではあまり差がないんだけど
性能一番良いのはDeep Learningで良いのかな？

ようなどの手法が今一番性能良いことになってる？
向き不向きについても知りたい。知ってる人いたら教えてください。

【統計分析】機械学習・データマイニング4
81 ：デフォルトの名無しさん[]：2014/08/27(水) 01:52:55.52 ID:SAfS5G3A: 計算結果がでてくるってことでブラックボックスとして
あつかってしまってる。

原理を詳しく知ってた方が、特徴(向き、不向きとか)とかも理解しやすいだろうし
調節方法についても理解しやすいとか、上手く調節できそうな気がしてます。

原理がわかりやすく解説されてるサイトとか
文献とか教えてください。

特に知りたいのは、RandomForest, Deep Learning, SVM, GBM (ネットでみてて性能良いっていう種類については知りたい)
よろしくお願いします。

【統計分析】機械学習・データマイニング4
82 ：デフォルトの名無しさん[]：2014/08/27(水) 01:54:29.39 ID:SAfS5G3A: >>79
フリーソフトの性能があがってるからじゃないの？
Rの方が良いように思うけどな。
RでもRcmdrとかRStudioとか使えばGUIっぽくなるよ。

速度もRcppつかえば爆速になるし。

Juliaが爆速らしいじゃん。LLVMつかっててJITで動くらしい。

【統計分析】機械学習・データマイニング4
83 ：デフォルトの名無しさん[]：2014/08/27(水) 02:00:54.08 ID:SAfS5G3A: >>67
両方使えた方が良いと思う。
利用先がまったく違うと思う。

Maximaと平行してPython+Sympyも勉強した方が良いと思う。
使い方はほぼ同じ。 Sympyの方がC言語のコード生成の機能が優れてると思う。
(数式を関数にする機能。Fortranにもできたはず。Python関数にもできたかな？)

RもOctave とかScilab, 速度が爆速って噂のあるJuliaとか似たソフトあるので
平行してこれらの使い方を調べると理解しやすいように思う。

機械学習関係で使うなら R と Python+パッケージかな。
Maximaではやりにくいと思う。遅いし機械学習用のパッケージあまり見たことない。
(探せばあるのかもしれんが)

※このページは、『２ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の２ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。