- スレ立てるまでもない質問はここで 142匹目 [無断転載禁止]©2ch.net
541 :デフォルトの名無しさん[sage]:2016/04/14(木) 15:32:35.20 ID:aXOmd2ve - >>540
> >>536 > だけではやりたいことがさっぱり見えない majide? 異なる二つの文章を比較して、類似文章かどうかを判定したい。 ・それにはどのような方法をとればよいのか? ・何かライブラリはあるか? たとえば、 > 1192年鎌倉幕府が誕生し、源頼朝が最初の征夷大将軍になった。 > 源頼朝が征夷大将軍となり、鎌倉に幕府が誕生したのが1192年のことであった。 は、「類似である」と判定したい。
| - スレ立てるまでもない質問はここで 142匹目 [無断転載禁止]©2ch.net
542 :デフォルトの名無しさん[sage]:2016/04/14(木) 15:38:21.76 ID:aXOmd2ve - 形態素解析は、mecabとかどうかな。
http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html?sess=3f6a4f9896295ef2480fa2482de521f6#parse > % mecab > すもももももももものうち > すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ > も 助詞,係助詞,*,*,*,*,も,モ,モ > もも 名詞,一般,*,*,*,*,もも,モモ,モモ > も 助詞,係助詞,*,*,*,*,も,モ,モ > もも 名詞,一般,*,*,*,*,もも,モモ,モモ > の 助詞,連体化,*,*,*,*,の,ノ,ノ > うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ みたいに解析してくれる。 ここから自力でなんとかするか(例えば助詞を取り除いて比較するとか)、 あるいは、俺は知らないけど、類似度を計算してくれるライブラリそのものがあるかもしれない。
|
|