- スレ立てるまでもない質問はここで 142匹目 [無断転載禁止]©2ch.net
543 :デフォルトの名無しさん[sage]:2016/04/14(木) 16:14:51.58 ID:8zCUzUHZ - >>536
類似度を調べるのに 文字の一致を判定するものと 意味の一致を判定するアプローチがある 前者の方が雑な判定だが実装が簡単なので まずNグラムを調べてみるといい
|
- スレ立てるまでもない質問はここで 142匹目 [無断転載禁止]©2ch.net
544 :デフォルトの名無しさん[sage]:2016/04/14(木) 16:17:27.32 ID:8zCUzUHZ - >>541
類似の概念を深く掘り下げないと 「1192年鎌倉幕府が誕生しなかった」や 「2911年鎌倉幕府が誕生し、〜」は類似で 「せんひゃくきゅうじゅうにねんかまくらばくふがたんじょうし、〜」が 類似ではないと判定されるような 実装に十中八九なるだろう まあ意味論を入れると 実装コストが割りに合わないから こんなもんでいいと思うけどね
|
- スレ立てるまでもない質問はここで 142匹目 [無断転載禁止]©2ch.net
547 :デフォルトの名無しさん[sage]:2016/04/14(木) 18:39:26.67 ID:8zCUzUHZ - 別に翻訳しなくても日本語の意味でいいけど
「1192年平安時代が終わり、次の時代が始まった」は 意味的にほぼ同じなのが人間にはすぐ分かるが こういった一般常識を機械に理解させるのは大変
|
- スレ立てるまでもない質問はここで 142匹目 [無断転載禁止]©2ch.net
549 :デフォルトの名無しさん[sage]:2016/04/14(木) 20:14:06.67 ID:8zCUzUHZ - ディープラーニングでできるのは
文字の一致を複雑で精緻にすることで 依然として意味は分からないまま
|