Vanteyのアース線(もしくは枯れた資料帳)

怠け者のウィキメディアン・Vanteyの、脳内が帯電してきた時のはけ口。非百科事典的。過度な期待はしないでください。

WCJ2009報告(5) ウィキメディアの各種統計を見てみる

2009-12-05 21:30:44 | 統計・ランキング
さていよいよ、 Wikimedia Conference Japan 2009 におけるウィキメディア財団ジェイ・ウォルシュ氏の基調講演1のうち、参加者の関心が最も高かった部分の紹介です。
ウィキの現状と現下の到達点について、豊富なデータとともに解説したセクションです。

なお、以下のグラフのフルサイズ版を、元の PowerPoint ファイルからページごとに切り出して各々1枚画にしてコモンズに上げてあります。ページ番号のところから各ファイルページへリンクしています。必要に応じてご利用ください。


(p.10)
世界中で5番目に人気のあるウェブサイト
月間3億2500万ユニークビジター


(p.11)
日本で7番目に人気のあるウェブサイト
月間3050万ユニークビジター

いずれも2009年9月のデータ。サイトのオーナー毎にまとめた集計で、「ウィキメディア財団のサイト」として諸プロジェクト合計の数値で他者と比較されています。

上位にいる Microsoft (世界2位・日本5位)、 Yahoo! (世界3位・日本1位)、 AOL (世界6位)、楽天(日本3位)、NTTグループ(日本6位)、ライブドア(日本8位)などは、ポータル・検索・コミュニティサイト・メール・ブログ・ウェブスペースなどの多彩なコンテンツメニューを合計してのこの順位です。
その点、 Facebook (世界4位)やウィキメディア(ほとんどはウィキペディアであろう)のような "コンテンツメニューの少ない巨人" の特異性が際立っていると感じます。個人的には、 Facebook が AOL や eBay をぶっちぎっているのに驚きました。
Google (世界1位・日本2位)はやはり別格ですね。検索での世界シェア圧倒に加えて動画サイトでも世界を圧倒、メール等の個人向けサービスでも強みを発揮していますし。


(p.12)
世界的に見たウィキペディアのトラフィック
 代表的な情報サイトの月間ユニークビジター

2006年5月から2009年3月までの変遷です。
ニュースサイト大手のニューヨーク・タイムズ、 CNN 、 BBC などを3年前の時点で既にダブルスコアで圧倒しつつ、それら情報サイト群のユニークビジター数がいずれも横這い・微増であるのに対し、ウィキペディアは凄まじい勢いで増え続けています。

ユニークビジター数でこれだとリピーターの数も相当増えているでしょうから、鯖代や回線代の膨張は物凄いだろうなと思います。


(p.13)
ウィキメディア・プロジェクトは合衆国外で大きな成長を遂げ、グローバルな現象となった。―しかし今のところ、英語、ヨーロッパ言語、日本語が優位
 (左)ウィキメディアサイトの月間ユニークビジター数
 (右)記事数(公式な計数)

記事数については先日も触れましたが、日本語版は健闘していますね。


(p.14)
アクティブな貢献者の数はウィキペディアの成長につれて横ばいになったようだ:
これは将来の健全性と成長にとって脅威だろうか?
 月に5回以上編集を行った編集者数


(p.42)
月ごとの新規編集者数(2008年9月を 100 とした指数)

   *  *  *  *

そして次にご紹介するのが会場でも諸氏の聴講録でも一番の波紋を呼んだ、ある意味衝撃のグラフです。


(p.15)
いくつかのウィキペディアでは百科事典的な基本からよりトピック的・現在の出来事に関する内容へと移行しているようだ
 上位100ページのページヒット内訳


ja は他言語版に比べてサブカル分野の勢いが滅法強いとは従来からいろいろな場で言われ続けてきましたが、なんとこのグラフ、 ja はポップカルチャーが8割超です!!
ポップカルチャーに限らず、こんなにも記事分野の傾向が偏った言語版は他にはありませんので、これはかなり特異というか異常な現象であるといえます(他言語版が "正常" だという意味ではありません)。
日本の大衆文化史を世界のそれと比較しつつ振り返れば、それこそ封建時代の昔から世界の遥か先を行くポップカルチャー大国でしたので、これが日本人の底力の一端だとすればこれはこれでありだと私は思います。


なお注意しておいてもらいたいのは、このデータは(記事の)ページヒットの上位100位のみに集計対象を限定したうえで作成されたデータである、ということです。

「ページヒット」ということは一般閲覧者(+編集者)に人気の記事という意味であり、編集者において人気の記事(編集が集中している記事)という意味ではありません。
ページヒットのランキングからは、一般閲覧者に人気のページ、即ち一般のネットユーザーがウィキペディアに求めているものの傾向がわかるものであって、それらページの編集状況などはわかりません。基本的に編集行為には関わってこないデータです。例え対象記事が全保護されていても、閲覧者が多ければ上位にランクインが可能なものです。

また、集計対象が「上位100位」である点にも注意しておくべきです。
過去には上位20位とかの著しく限られたデータをもとに語られたこともありました。それに比べれば上位100位というのは統計のサンプル数をある程度増やした点で評価できます。
ただ数十万の記事がある中でのたったの100ですから、やはり物足りなさは残ります。少なくとも200とか300とかのサンプル数は欲しいところではあります。
ただそうやってサンプル数を増やすと、どうしても多様な分野の記事がバランスよく入ってきて、結果がどれも平準化する可能性があります。
各言語版の「特に人気の記事」における分野傾向を探るという、集計結果にある程度のいびつさを(話のネタとして潜在的に)求める向きには、あるいはこの程度の(集計対象数を絞るという)乱暴さも許容されるのかもしれない、と思ったりもします。


表題の「百科事典的な基本からよりトピック的・現在の出来事に関する内容へと移行しているようだ」ということについて言えば、これはその言語圏におけるネットユーザーがウィキペディアに求めるものが変化してきた、ということを示すものではないかと私は考えます。
調べ物の起点として利用されるのですから、しばしば抽象的であったりする上位概念の言葉なんかよりは具体的な事物・人物・事象の言葉のほうが現実のシーンにおける需要が多いであろうことは想像できます。
このことは上位概念そっちのけで些事の記述ばかりが肥大化してゆく懸念とも隣り合わせなのですが、ともかく個別の事象等についての情報もある程度ウィキペディアに頼れるようになってきたからこそのことだろうとは薄々思います。

この主題については奥が深そうですし、私も考えがよくまとまっていません。人によっていろいろな解釈や考え方があるかと思います。

----
Wikimedia Conference Japan 2009
http://www.wcj2009.info/
プログラム:KEY-1 - Wikimedia Conference Japan 2009
http://www.wcj2009.info/プログラム:KEY-1
Wmf Present Wikiconference Japan Nov 2009
http://www.slideshare.net/jayawalsh/wmf-present-wikiconference-japan-nov-2009

----
Summary of images:
Description = 基調講演1 発表資料
Source = http://www.slideshare.net/jayawalsh/wmf-present-wikiconference-japan-nov-2009
Date = 2009-11
Author = Jay Walsh
Permission = CC-BY-SA-2.5
Creative Commons License


コメントを投稿