- Regular Expression(正規表現) Part15
660 :デフォルトの名無しさん[sage]:2021/04/18(日) 13:04:59.48 ID:8BgTcnje - 構造があるものは、正規表現では難しい。
スクレイピングは、Ruby で、nokogiri なら、 require 'nokogiri' doc = Nokogiri::HTML(<<EOT) <tr> <td class="XXX">2021/04/02</td> 日付 <td class="YYY">8,510.0</td >始値 <td class="YYY">8,595.0</td> 高値 <td class="YYY">8,432.0</td> 安値 <td class="YYY">8,462.0</td> 終値 <td class="YYY">8,462.0</td> 調整後終値 <td class="YYY">4,337,300</td>出来高 </tr> EOT element = doc.at_css( 'tr > td.XXX' ) puts element.content #=> 2021/04/02 elements = doc.css( 'tr > td.YYY' ) puts elements.map( &:content ).join( " : " ) #=> 8,510.0 : 8,595.0 : 8,432.0 : 8,462.0 : 8,462.0 : 4,337,300
|