必死チェッカーもどきプログラム > 2016年01月27日 > /6EU7qrh

トップページ > プログラム > 2016年01月27日 > /6EU7qrh

書き込み順位＆時間帯一覧

66 位/200 ID中	時間	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	Total
66 位/200 ID中	書き込み数	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1	1

使用した名前一覧	書き込んだスレッド一覧
デフォルトの名無しさん	くだすれPython(超初心者用) その28©2ch.net

書き込みレス一覧

くだすれPython(超初心者用) その28©2ch.net
767 ：デフォルトの名無しさん[sage]：2016/01/27(水) 23:25:53.18 ID:/6EU7qrh: >>761
そのサイトは、<diary_snap>および<diary_snap_cut>という、
本来のhtmlにはない独自タグをhtmlソースの中で使っている。
これが何か悪さをしているのではないか。というのも、
以下のようにこのタグを除去してからpandasに渡したら、
すべてのtableを取得することができた。

import re
#from urllib import urlopen #if Python2
from urllib.request import urlopen
import pandas as pd
html = urlopen('http://db.netkeiba.com/race/201544122901/').read().decode('euc-jp')
html = re.sub(r'</?diary_snap(_cut)?>', '', html)
tables = pd.io.html.read_html(html)

※このページは、『２ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の２ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。