<紙>さんLOG

「パソコンヲタクの雑記帳」
 PC/Linux系/物理・化学で遊んでいます。
思いついたことを綴っています。

Perl で Web アクセス5

2010年01月16日 | PCクリニック
ご訪問ありがとうございます。


これまでで、「Perl で Web アクセス」する方法を少し勉強しました。

最初 は、「socket」を使ってHTTPクライアントを作る方法でした。
2回目では「LWP::Simple」を知り、数行でプログラミングできるようになりました。
そして、3回目には、ログイン処理を含んだような高度な(?)
処理もできる「LWP::UserAgent」を勉強しました。
さらに4回目、画像(バイナリファイル)のダウンロードまで。


今度は、サイトの存在チェックをしたくなりました。

ブログを見に来て頂いている方々の住所録(?)があります。
(と云っても「gooあしあと」か「あし@の足跡」を残して頂いている方々ですが)
巡回してみると、中には(古い人でも新しい人でも)止められてしていて、
「404 Not Found」となる場合があります。
その都度、住所録(?)から削除しているのだが、
サイトの存在チェックをバッチ処理できないものかと考えました。


「LWP::Simple」で、「head」関数を使うと出来そうですね。

テストで、サンプルコーディングをしてみました。
1行コードと云えるくらいに、簡単に出来ました。

「Yahoo! Japan」の URLの「yahoo」の部分を「yafoo」に変えてみます。
「http://www.yahoo.co.jp/」はありますが、
「http://www.yafoo.co.jp/」はありませんネ。

     (ソースコードと実行結果)



「head」関数の戻り値は文字列ですね、
その文字列の長さが 30(必ず? 少なくとも 0 ではない)か、
0 か、で判別出来ると云うことですね。

また1つ勉強しました。         



見ていただきありがとうございました。
お帰りに投票して頂けると嬉しいです。 ⇒ 日記@BlogRanking

人気BlogRanking ⇒ 

P-NETBANKING ⇒ 

最新の画像もっと見る

2 コメント

コメント日が  古い順  |   新しい順
Unknown (cyah)
2010-01-16 11:51:29
私も以前ブログアカウント削除されているのにもかかわらず、毎日のように足跡つけていく「痛い」方を見ましたが(自動巡回ツール使っているんでしょうね。)そんなに垢Ban!状態で巡回している人がいるのでしょうか?
返信する
cyah さんへ (<紙>)
2010-01-16 12:39:45
いらっしゃいませ。
そうですね、「404 Not Found」となる場合が多い訳ではありませんが、
チェックするにはどうしたらいいかな?と、
Perl の勉強を兼ねて、一本作ってみたところです。

今後とも、よろしくお願いいたします。
返信する

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。