白亜45会HP管理人

白亜(白堊)45会は、岩手県立盛岡第一高等学校昭和45年卒業の同期会です。

perl; HTML::TagParser, Web::Scraper

2010年08月29日 09時43分55秒 | 電脳
昨日は「PerlでHTML構文解析」を調べた。やりたいことは
・ a タグでリンク先
・ img タグで画像ファイルの名前と在処
のリストを作りたいだけなので、HTML::TagParserというモジュールが最適のようだ。

ActivePerl には ppm というモジュール管理ソフトがついていて、モジュールのインストールもとても簡単。GUIなのだが、見た目だけだと使い方が良く分からなかった。分かってしまえばインストールはとても簡単。TagParserのテストプログラムも一応は動作した。日本語の文字コードの問題が残っているが、先に述べた目的には日本語文字は不要なのでしばらくは忘れよう。

もっと一般的にHTML構文解析をするにはWeb::Scraper なるモジュールの方が便利そうだが、使い方がよく分からないので当分はお休み。


最新の画像もっと見る

コメントを投稿