トップページ > プログラム > 2016年07月24日 > oOM1gog7

書き込み順位&時間帯一覧

10 位/108 ID中時間01234567891011121314151617181920212223Total
書き込み数0000001000000000000001002



使用した名前一覧書き込んだスレッド一覧
デフォルトの名無しさん
【PHP】下らねぇ質問はここに書き込みやがれ 6 [無断転載禁止]©2ch.net

書き込みレス一覧

【PHP】下らねぇ質問はここに書き込みやがれ 6 [無断転載禁止]©2ch.net
931 :デフォルトの名無しさん[sage]:2016/07/24(日) 06:03:10.22 ID:oOM1gog7
全文検索を、mysql+n-gramで実装しようと思います
http://www.tatamilab.jp/rnd/archives/000390.html
このような、テキストをn文字で切ってフルテキストインデックスを張る方法です
このサイトもそうですが、ネット上でこの方法を説明しているものの多くは
against( '+お仕 +仕事' in boolean mode )
みたいにboolean modeでAND検索をするというように書いているのですが
これだと「お仕hoge仕事」というテキストもヒットするはずです
「お仕」と「仕事」の連続性は保証されないからです。
against( '"お仕 仕事"')
のような形にすると、
「お仕事」はヒットし、「お仕hoge仕事」はヒットしません
explainを見ても、ちゃんとfulltextインデックスが使われているようです
正しいのはこのやり方ではないでしょうか?
それともこれだと何か問題が出るのでしょうか?
【PHP】下らねぇ質問はここに書き込みやがれ 6 [無断転載禁止]©2ch.net
932 :デフォルトの名無しさん[sage]:2016/07/24(日) 21:49:35.26 ID:oOM1gog7
いろいろ手間取りましたが、約4500のpdfファイルのテキストがdbに入りまして
>>931の方法で検索してみたところ、一瞬で表示されて感動です
手間取った点は、
発行時のクエリの大きさに関係するmax_allowed_packet
書き込み時のタイムアウトを規定しているらしいnet_write_timeout
がデフォルトでは小さすぎたというところです


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。