あれとかこれとか (Lefty)

のんびりだらだらあれとかこれとか…

RE:アクセス解析の謎

2006-08-17 | goo/Webツール関連
BLOG STATION:アクセス解析の謎
(略)
gooブログ アドバンスのアクセス解析、「ページごとアクセス数」のところに、上のような http://blog.goo.ne.jp/btblog.php?bid=kanimaster を含む URL が並んでいます。
(略)
どうやったら、こういう URL になるのか、さっぱりわかりません。

  私もアドバンスをつかってて、数日前から、同じように
http://blog.goo.ne.jp/btblog.php?bid=(goo ID)&m=e&eid=(記事 ID)
の形式のURLが「ページごとアクセス数」に入ってきていて、不思議に思ってます。
  結論から言うと、なぜこの形式がアクセス解析にあがってきたかはよく分かりません。ただ、なぜこのURLでアクセスできるかという疑問(*1)に対する私の推測はあるので、ついでに書いてしまいます。(*2


  恐らく以前から(最初から)この形式のURLでもブログのページは表示できてたんじゃないかと思います。

  通常、gooブログの記事のURLは
I :http://blog.goo.ne.jp/(goo ID)/e/(記事 ID)
の形式なんですが、実際ページを表示する場合はWebサーバーのプログラム内で
II:http://blog.goo.ne.jp/btblog.php?bid=(goo ID)&m=e&eid=(記事 ID)
の形式に変換して表示していると思うんです。

mod_rewriteモジュールを使ってURLを書き換えたい - Sakura scope によると
mod_rewriteというのは、Apacheのモジュールで、正規表現を使ってURLを書き換えるものです。
これを活用すると、CGIで動的に生成されたページを、あたかも静的なページであるかのように見せることもできます。

例えば、
http://www.example.com/bbs.cgi?page=3&mode=view&style=flat
…みたいな、どっから見ても動的に生成してるとしか思えないURLを
http://www.example.com/bbs/3/view/flat/
…みたいな、一見静的なページのURLなように見せることができたりします。

ということらしいんで…。

  書き換えてる理由は、ただでさえ長いURLを少しでも短くするというのと、それ以上に、SEO対策(大雑把に言うと?以降が長いとエンジンに拾われない可能性があるらしいです)なんだと思います。

  で、Webサーバーで変換されたURLをブログのプログラムは解釈して該当するページをその都度作成している(動的生成)んじゃないかと。
  逆に変換後のURLでアクセスしてもそれはそのままブログのプログラムに渡されるので、それはそれで問題なく表示されるわけです。

  ただ、その「変換後のURL(上記 II )」は、基本的に表に出てくることはないので、私自身今回の件がなければ気付くことはなかったと思います。
  なので、どうしてそのURLでのアクセスがあがってきたかという根本的な疑問にはまったく答えられないんですよね…。

  個人的な予想としては
1.何らかのロボットがこの形式で機械的にページにアクセスしている。
2.アクセス解析かWebサーバー側の不具合で、変換前・変換後のアクセスが2重にカウントされている。

あたりを考えてます。
実際はどうかは分かりませんが…。


(注)
*1 Kenさんが本当にそれを疑問に思ってるかは上の記事では分からないので、どちらかというと私の疑問なんですが…。
*2 Web関係の技術。特にUNIX系はあまり詳しくないので自信はないんですが…。