トップページ > プログラム > 2014年03月22日 > 5oW3ItWU

書き込み順位&時間帯一覧

19 位/198 ID中時間01234567891011121314151617181920212223Total
書き込み数0000000000011100000000003



使用した名前一覧書き込んだスレッド一覧
デフォルトの名無しさん
くだすれPython(超初心者用) その22

書き込みレス一覧

くだすれPython(超初心者用) その22
230 :デフォルトの名無しさん[sage]:2014/03/22(土) 11:26:34.24 ID:5oW3ItWU
ヤフーのトップから以下の要素を取得したいんですが、htmlの要素に日本語がある場合どうやって取得できますか?
以下のソースだとNoneになります。。
<em><span title="動画" class="iconVideo">動画</span>Vimeo</em>

import urllib
from BeautifulSoup import BeautifulSoup
source = urllib.urlopen('http://yahoo.co.jp/').read()
soup = BeautifulSoup(source)
print soup.find("span",{"title":u"動画"})
くだすれPython(超初心者用) その22
234 :デフォルトの名無しさん[sage]:2014/03/22(土) 12:19:16.08 ID:5oW3ItWU
soup = soup.decode('utf-8', 'replace')
soup = BeautifulSoup(source, fromEncoding='utf-8')

色々試したんですけどうまくいかないので削ってました。

>>233
要素は間違いなくありました。
日本語要素でなければ取得できましたので、エンコードの関係だと思います。
くだすれPython(超初心者用) その22
238 :デフォルトの名無しさん[sage]:2014/03/22(土) 13:03:57.87 ID:5oW3ItWU
>>236
本当ですね。
保存したら古い感じのYAHOOが表示されました。
UA指定してないからとかじゃなくてjavascriptですか・・
>>237
Selenium調べてみます!ありがとうございます。


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。