- 【PHP】下らねぇ質問はここに書き込みやがれ 2©2ch.net
582 :デフォルトの名無しさん[]:2015/09/25(金) 21:39:08.32 ID:f2COha4U - file get contentsでとあるサイトをスクレイピングしてるんだけど、1~3回ほどページ更新すると内容が表示されなくなる
これってそのサイトがスクレイピング対策をしてるってこと?
|
- 【PHP】下らねぇ質問はここに書き込みやがれ 2©2ch.net
584 :デフォルトの名無しさん[]:2015/09/25(金) 22:09:07.55 ID:f2COha4U - >>583
いや、その前にphpの問題なのかなと思って。 それにブロックするなら最初からスクレイピングさせないもんなんじゃないの? 暫く時間たった後にまた更新すると今度はちゃんと取得できてるんだよね… なんなの?これ
|
- 【PHP】下らねぇ質問はここに書き込みやがれ 2©2ch.net
587 :デフォルトの名無しさん[]:2015/09/25(金) 22:26:49.35 ID:f2COha4U - >>585
それもわからんorz; ってかブロックできるもんなのかすらわからん… <ソース> $html = file_get_contents('http://'); $html = str_ireplace($kesu, "", $html); $doc = new DOMDocument(); $doc->loadHTML($html); $hoge = $doc->getElementById(‘hoge’); echo $doc->saveHTML($hoge); 一回目:普通に表示→更新ボタンおす 二回目:表示 三回目:非表示(スクレイピングしてるとこだけ) 〜3時間ほど経過〜 四回目:表示 ってなる。どうしてなんや
|
- 【PHP】下らねぇ質問はここに書き込みやがれ 2©2ch.net
590 :デフォルトの名無しさん[]:2015/09/25(金) 23:17:54.47 ID:f2COha4U - >>588
変わってないと思う… >>589 ブラウザからのアクセスだといつも通りちゃんと表示される。
|