トップページ > プログラム > 2015年05月17日 > tASFt5zk

書き込み順位&時間帯一覧

34 位/203 ID中時間01234567891011121314151617181920212223Total
書き込み数0000000000000001010000002



使用した名前一覧書き込んだスレッド一覧
デフォルトの名無しさん
くだすれPython(超初心者用) その26 [転載禁止]©2ch.net

書き込みレス一覧

くだすれPython(超初心者用) その26 [転載禁止]©2ch.net
5 :デフォルトの名無しさん[sage]:2015/05/17(日) 15:46:42.29 ID:tASFt5zk
python2.7です

webページをDLして解析したいんですがいきなり躓いてます

import urllib2
from xml.etree.ElementTree import *
(略)
req = urllib2.Request(url)
response = urllib2.urlopen(req)
html = response.read()

#解析するよ
root = fromstring(html)

fromstring で xml.etree.ElementTree.ParseError: not well-formed (invalid token) 言われます
レスポンスに手を加えずそのまま解析してるのですが…
くだすれPython(超初心者用) その26 [転載禁止]©2ch.net
8 :デフォルトの名無しさん[sage]:2015/05/17(日) 17:41:57.69 ID:tASFt5zk
報告です。

root = fromstring(html, HTMLParser())

としたら、
エラーは無くなりましたがタグを手繰ろうとすると NonType と言われて出来ませんでした。

HTMLParser を派生して

parser = MyHTMLParser()
parser.feed(html)
parser.close()

としたら、タグは読めました。
まだ先は長そうですが、ご教授ありがとうございました。


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。