299792458m/s

最近忙しくなってきた中の人が
光速では更新できないが
ドクにもクスリにもならないことをぼやく

gooblogのアクセス解析ログを自動収集

2010-02-11 21:42:59 | sheevaplug
せっかく使えるsheevaで、24時間稼動しているlinuxサーバの割りにこれまでsambaとcupsしか使っていなかったが、cronを回してgooblogのアクセス解析のログを自動で取得するようにした。

とりあえずテストということで、ログが保存されている11月1日分から昨日分までとってくる。
1ファイル1日分というのが微妙に使いにくい。毎日一回クリックする気がおきないから、1週間分くらいにまとめてファイルを出して欲しいところ。まぁ、面倒だからこそcronで回すんだけど。

結局ログのファイルを落として適当に整形したりまとめて、一ヶ月単位くらいでファイルにまとめるのが使いやすいか。

以下が作業メモ

まずは
$ w3m http://blog.goo.ne.jp/admin
で、ログイン状態を保持する、にチェックを入れてログイン。
次に、w3mを起動中に o をおして設定画面
随分下のほうの、「文書の標準の文字コード」をJapanese (Shift_JIS, CP932)に変更
ログの取得は
$ w3m "http://blog.goo.ne.jp/admin/showanalyze/8b?type=csv&mode=pv&date=20100210" -dump >hogehoge
など
これを組み合わせたシェルスクリプトを組んでcronで回そうというのが今回のお話でした。
スクリプトとかコマンドとかを綺麗に書くのはどうするんだったかなぁ、、、。
ジャンル:
ウェブログ
キーワード
アクセス解析 シェルスクリプト 文字コード
コメント (0) |  トラックバック (0) |  この記事についてブログを書く
Messenger この記事をはてなブックマークに追加 mixiチェック シェア
« 近況(201002月 | トップ | windowsxpとリンク »

コメント

コメントはありません。

コメントを投稿


コメント利用規約に同意の上コメント投稿を行ってください。
※文字化け等の原因になりますので、顔文字の利用はお控えください。
下記数字4桁を入力し、投稿ボタンを押してください。この数字を読み取っていただくことで自動化されたプログラムによる投稿でないことを確認させていただいております。
数字4桁

トラックバック

この記事のトラックバック  Ping-URL

あわせて読む