トップページ > プログラム > 2016年09月13日 > aXWSAFy4

書き込み順位&時間帯一覧

6 位/175 ID中時間01234567891011121314151617181920212223Total
書き込み数0000000000000000310000004



使用した名前一覧書き込んだスレッド一覧
デフォルトの名無しさん
Ruby 初心者スレッド Part 58 [無断転載禁止]©2ch.net

書き込みレス一覧

Ruby 初心者スレッド Part 58 [無断転載禁止]©2ch.net
831 :デフォルトの名無しさん[sage]:2016/09/13(火) 16:29:06.06 ID:aXWSAFy4
あるサイトページをnokogiriで拾うと、正規のURLと文字化けしたURL(%などが含まれる)の2種類のURLで同一の情報を拾ってしまいます。
正規のURLだけの情報えお拾いたいのですがどのような方法がありますでしょうか?
Ruby 初心者スレッド Part 58 [無断転載禁止]©2ch.net
832 :デフォルトの名無しさん[sage]:2016/09/13(火) 16:35:24.92 ID:aXWSAFy4
ちなみに、

anemone.skip_links_like /除外対象のURLパターン/

で文字化け部分を指定しても改善にはいたりませんでした。
Ruby 初心者スレッド Part 58 [無断転載禁止]©2ch.net
834 :デフォルトの名無しさん[sage]:2016/09/13(火) 16:45:49.24 ID:aXWSAFy4
>>833
URLエンコードです。
デコードすると正規のURLに変換できます。
Ruby 初心者スレッド Part 58 [無断転載禁止]©2ch.net
838 :デフォルトの名無しさん[sage]:2016/09/13(火) 17:19:43.00 ID:aXWSAFy4
>>836
参考リンクの情報ありがとうございます。
一通り試してみますm(_ _)m

>>837
ご返信ありがとうございます。
具体的に申しますと、

[ → %5B
] → %5D

のように、カッコ部分がエンコード/デコードで重複して出力されます。
link.to_s.matchで[●●]や%5B●●%5Dといった条件付けで巡回ページを指定しても、
両方のパラメータが出力されてしまうようです。


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。