- 【統計分析】機械学習・データマイニング4
333 :デフォルトの名無しさん[]:2014/11/08(土) 10:03:10.51 ID:KFvTfo0I - >>332
原著に "The K-means method algorithm is one of the most popular iterative descent clustering methods. It is intended for situations in which all variables are of the quantitative type and squared Euclidean distance is chosen as the dissimilarity measure" と明確にユークリッド距離を使うと書いてありますので、この説明を読んだら上に書いたような 疑問を持つのは自然かなと思いますが。もちろん相関係数を使っても問題ないだろうとは思ってます。 勝手に拡大解釈して相関係数でもOKと理解したけど、やっぱり間違えていた、というのを避けたいので、 質問させていただいたわけです。
|
- 【統計分析】機械学習・データマイニング4
335 :デフォルトの名無しさん[]:2014/11/08(土) 10:54:41.37 ID:KFvTfo0I - >>334
いや、すでに色々実験して問題ないことは確認済みなんです。ただ、間違った用語を使って論文 を書くと、後々まで残るので、正確性を期したかったわけです。それにあんなに偉い著者たちが わざわざそう書くのに、何か理由でもあるのかなぁ?と。
|
- 【統計分析】機械学習・データマイニング4
338 :デフォルトの名無しさん[]:2014/11/08(土) 11:39:21.71 ID:KFvTfo0I - 教えない、じゃなくて、理由がないから教えられないんじゃないの??
それを教えないって逃げてるのかな?きちんと理由を書かないとそう読まれるよ? ちなみにデータを基準化したら相関係数はユークリッド距離に比例するっていう理由は無しね! 基準化しない場合もあるんだから。
|