必死チェッカーもどきプログラム > 2014年06月13日 > pu2H4m/c

トップページ > プログラム > 2014年06月13日 > pu2H4m/c

書き込み順位＆時間帯一覧

62 位/205 ID中	時間	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	Total
62 位/205 ID中	書き込み数	0	0	0	1	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1

使用した名前一覧	書き込んだスレッド一覧
デフォルトの名無しさん	Smalltalk総合 Squeak Pharo

書き込みレス一覧

Smalltalk総合 Squeak Pharo
132 ：デフォルトの名無しさん[sage]：2014/06/13(金) 03:19:29.47 ID:pu2H4m/c: どうにも詰まって進みようがなくなったので質問です

やりたいことはHTMLをparseしてタグ単位にnode化しtree状にばらして
rootから各nodeを辿れるようにしてelementを適当に参照したいわけです

XML.XMLParserに読ませるとまず通らないというか
HTML ≠ XML なので当然なのかも知れないですが
XMLMarshaler（これと連動しているXPath） , SIXX これらも見てみましたが
HTMLを読ませることはできないような気がします。

いい加減に書かれているHTMLをこれまた適当にparseしてくれるようなクラスはないんでしょうか。
自力で書くことも出来ないわけじゃないと思いますが、WebServiceのドキュメントを見る限りはHTMLを読めるようにも見えるので情報不足過ぎて困ってます。

これを使えとか何かヒントがあったらお願いします！

※このページは、『２ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の２ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。