- 【統計分析】機械学習・データマイニング4
203 :デフォルトの名無しさん[sage]:2014/08/31(日) 18:21:11.84 ID:3UDV1h2K - >>200
2chで多少の煽りで理性を失うなんて耐性のなさじゃ会社はおろか学校だって通用せんよ。 薄々気づいているだろうけど、データマイニングのパフォーマンスチューニングなんて 実装全体からみればごく一部にしかすぎない。 もちろん単体でのチューンはするだろうけど、全体の性能に与える効果は一部なので 大体の所で落ち着けばよく、多くの時間を費やすのは無駄。 経験的に一番パフォーマンスに効くのは処理対象に対するアルゴリズムの選択。 次に解析対象のデータの素性を理解することと、その前処理、特徴抽出をどうするか、 性能の評価指標を何に取るか、質がいいデータを継続的に得る仕組み作り。 進め方でもステップ毎の出力を確認して妥当性を検証しないと誤りに気づかないままになる。 そのためには中で何をしてるかの理解は必要。 いいデータを手に入れるためにはユーザと協力は欠かせいのは当然だが、業務を自動化 してユーザのパフォーマンスがどう良くなるかや、そのための仕組み、性能の評価のしかたを キチンと説明して協力を得ないと上手く行かない。 現場に出向いて話をしたり、改善効果の定量化と報告・レビューなんかは自分でやらなきゃ ならない。 つまり『何を最適化』するかだが、お前はツールしか見てない気がするよ。
|