- 【PHP】下らねぇ質問はここに書き込みやがれ 6 [無断転載禁止]©2ch.net
931 :デフォルトの名無しさん[sage]:2016/07/24(日) 06:03:10.22 ID:oOM1gog7 - 全文検索を、mysql+n-gramで実装しようと思います
http://www.tatamilab.jp/rnd/archives/000390.html このような、テキストをn文字で切ってフルテキストインデックスを張る方法です このサイトもそうですが、ネット上でこの方法を説明しているものの多くは against( '+お仕 +仕事' in boolean mode ) みたいにboolean modeでAND検索をするというように書いているのですが これだと「お仕hoge仕事」というテキストもヒットするはずです 「お仕」と「仕事」の連続性は保証されないからです。 against( '"お仕 仕事"') のような形にすると、 「お仕事」はヒットし、「お仕hoge仕事」はヒットしません explainを見ても、ちゃんとfulltextインデックスが使われているようです 正しいのはこのやり方ではないでしょうか? それともこれだと何か問題が出るのでしょうか?
| - 【PHP】下らねぇ質問はここに書き込みやがれ 6 [無断転載禁止]©2ch.net
932 :デフォルトの名無しさん[sage]:2016/07/24(日) 21:49:35.26 ID:oOM1gog7 - いろいろ手間取りましたが、約4500のpdfファイルのテキストがdbに入りまして
>>931の方法で検索してみたところ、一瞬で表示されて感動です 手間取った点は、 発行時のクエリの大きさに関係するmax_allowed_packet 書き込み時のタイムアウトを規定しているらしいnet_write_timeout がデフォルトでは小さすぎたというところです
|
|