トップページ > プログラム > 2014年06月13日 > pu2H4m/c

書き込み順位&時間帯一覧

62 位/205 ID中時間01234567891011121314151617181920212223Total
書き込み数0001000000000000000000001



使用した名前一覧書き込んだスレッド一覧
デフォルトの名無しさん
Smalltalk総合 Squeak Pharo

書き込みレス一覧

Smalltalk総合 Squeak Pharo
132 :デフォルトの名無しさん[sage]:2014/06/13(金) 03:19:29.47 ID:pu2H4m/c
どうにも詰まって進みようがなくなったので質問です

やりたいことはHTMLをparseしてタグ単位にnode化しtree状にばらして
rootから各nodeを辿れるようにしてelementを適当に参照したいわけです

XML.XMLParserに読ませるとまず通らないというか
HTML ≠ XML なので当然なのかも知れないですが
XMLMarshaler(これと連動しているXPath) , SIXX これらも見てみましたが
HTMLを読ませることはできないような気がします。

いい加減に書かれているHTMLをこれまた適当にparseしてくれるようなクラスはないんでしょうか。
自力で書くことも出来ないわけじゃないと思いますが、WebServiceのドキュメントを見る限りはHTMLを読めるようにも見えるので情報不足過ぎて困ってます。

これを使えとか何かヒントがあったらお願いします!


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。