- くだすれPython(超初心者用) その26 [転載禁止]©2ch.net
5 :デフォルトの名無しさん[sage]:2015/05/17(日) 15:46:42.29 ID:tASFt5zk - python2.7です
webページをDLして解析したいんですがいきなり躓いてます import urllib2 from xml.etree.ElementTree import * (略) req = urllib2.Request(url) response = urllib2.urlopen(req) html = response.read() #解析するよ root = fromstring(html) fromstring で xml.etree.ElementTree.ParseError: not well-formed (invalid token) 言われます レスポンスに手を加えずそのまま解析してるのですが…
| - くだすれPython(超初心者用) その26 [転載禁止]©2ch.net
8 :デフォルトの名無しさん[sage]:2015/05/17(日) 17:41:57.69 ID:tASFt5zk - 報告です。
root = fromstring(html, HTMLParser()) としたら、 エラーは無くなりましたがタグを手繰ろうとすると NonType と言われて出来ませんでした。 HTMLParser を派生して parser = MyHTMLParser() parser.feed(html) parser.close() としたら、タグは読めました。 まだ先は長そうですが、ご教授ありがとうございました。
|
|