goo

タグの種類の変化について - 「超神ネイガー」の生死は如何に

先程、タグマップを今週のバージョンに更新しました。

今週も大幅に地殻変動が起こってしまいました。今週は特にパラメータは変更していないのですが。。。



ところで、このように広域図がこれほど変わっても、ちょっと眺めただけでは、今週になって初めて現れた新しい山などを見つけることは簡単ではないようです。そこでタグマップ上のタグの種類の変化を調べてみました。その結果、今週は263タグが新しく出現して、273タグが消えたことがわかりました。全体で約5,000ですので、約5%のタグに変動があるようです。

このような新しく出現したタグは結構マイナーなものばかりです。たとえば、秋田県ローカルなスーパヒーロー「超神ネイガー」など。このキーワードで記事を検索すると、タグマップ上にもいくつかの記事が検索されます。

ところが、新しく出現した肝心の「超神ネイガーのタグ」のところには、現在、一件の記事もありません。これは、新しく出現したばかりの記事なので、まだ、このタグの条件に合う記事としてタグ付されていないことが理由です。数日後には記事が検索されるようになるかもしれませんし、あるいは来週以降のタグマップでは、再びタグそのものが消えているかもしれません。

このタグが気になる方は、是非、後日、再度上記のタグをクリックしてみてください。皆さんの予想はいかがでしょうか?ちなみに、新しく出現するタグのほとんどは、一時的なものですぐ消えていくケースが多いようです。

----------------------------------------
このエントリを投稿してから、一週間経ち、3月25日に新しいタグマップに更改しましたが、「超神ネイガーのタグ」は生き残っていました。私が想像していたより、強いみたいです。流石です。
しかも、現時点で11件の記事がついていました。

2008.3.25日追記
----------------------------------------

Ko the "超神" blueranger
コメント ( 0 ) | Trackback ( 0 )

今週のタグマップ ― クリオネとサル山

今週のタグマップ更新しました。抽出する類似度の閾値のパラメータを変えたら、随分変わってしまいました。

広域図は、クリオネみたいに



そして、「技術」タグ近辺には、サル山が出現しました(?)



なんか、サルにみえませんか?「楽器」が耳のあたりにあるのが笑えます。

Ko the monkey finder
コメント ( 0 ) | Trackback ( 0 )

ブログ世界の中心で、何が叫ばれる のか?

昨日、百式さんやdankogaiさんをはじめとして、多くのブログでTGパーツを取り上げていただきました。感謝感激です。

あなたのブログがブログ世界のどこに位置するのか、地図で教えてくれる『BLOGRANGER TG』(IDEA * IDEA)

News - ブログ世界の中心で、何を叫ぶ? - BLOGRANGER TG (dankogai)

今日は、dankogaiさんのブログの主要成分?である「書評」タグがなぜ、ブログ界(タグマップ)の中心になったのかについて考察してみたいと思います。実は、アルゴリズムによる必然ではないかということです。

タグマップの生成アルゴリズムは、大まかには次のようなステップで生成しています。

1.ブログ記事を最新一ヶ月分を収集
2.タグ付きブログ記事を分析し、各タグが付与されている文書に特徴的に出現するタグ特徴ベクトルを生成
3.タグ特徴ベクトルの類似度を算出し、タグの類似度グラフを生成
4.類似度の高いタグ同士がお互いに近くになるように(x,y)座標を算出
5.類似度グラフの各ノード(タグ)の中心性スコアによりz座標を算出
6.タグの3次元座標(x,y,z)集合から地形をレンダリング

つまり、タグ間類似度グラフによって地形図を生成しています。その地形図の元となるタグ間類似度グラフはこのような様子です。



これが次のような地形図にレンダリングされるわけです。



さて、このようなアルゴリズムでは、ネットワークの中心には何がくるでしょうか?
それは多くのタグと類似性が高いタグということなります。多くのタグと類似性が高いタグとは、タグの特徴的な単語を多く含むことです。すなわち、語彙が広いタグが中心に来るわけです。

ならばブログ界全体で、多くの語彙を含むタグは何でしょうか?その代表例は「書評」タグなのかもしれません。「書評」では様々な分野の本が紹介されますので、必然的に多くの語彙が使われます。このように考えると、書評が中心付近にくるのがうなずけるのではないでしょうか?

一方、例えば、ゲーム分野は、すでにこちらのエントリでも書きましたように、ブログ界の最も大きななトピックですが、全体からみると周辺部に配置されています。これは、ゲーム分野のタグが付与されている記事で使用される語彙が限定されることが理由ではないかと考えられます。

また、タグの中心性の関係は、ブログ全体ではなく特定のジャンルのローカルマップでも同様ですから、「料理」>「お菓子」>「チョコレート」のように、語彙の多く含むタグがローカルマップでも中心に表示されるようになるわけです。

以上のように、トピックが立っている話題は中心ではなく周囲に顕著に表れますので、なんとかヲタの方は周囲部のタグに要注目です^^。


ところで、上記のフローの各ステップでは結構面白い技術が使われております。これらについても、別途ご紹介したいと思います。
# TGスタッフのShigeru, Tatsushi, Takeshiさん、よろしく!

Ko the blogosphere observer -- this style of signature is not found
コメント ( 0 ) | Trackback ( 0 )

BLOGRANGER TGの新機能

本日、BLOGRANGER TGの2つの新機能、BLOGRANGER TGパーツと、タグ単位での記事配信RSSの提供をリリースしました。

BLOGRANGER TGパーツは、ブログのURLを入力すると、そのブログの過去約一か月の記事を分析して主なタグ(ジャンルを示すキーワード)3種類とその割合を提示します。例えば、本ブログ(BLOGRANGER TGスタッフブログ)のURLをTGパーツの生成画面にあるフォームに入力し、「プレビュー」ボタンを押すと、次のようなパーツが表示されます。

尚、入力するURLはブログ記事のURLではなくブログのURLです。ブログ記事のURLを入力しても解析されませんので、ご注意ください。



そして、パーツに提示されたタグの一つをクリックすると、BLOGRANGER TGが別ウインドウに表示され、このブログの記事がブログ界全体の中で、どのあたりの記事を多く含むかを知ることができます。



上部のタグクラウドには、そのブログの記事に自動的に付与されたタグの一覧が表示され、また、それらのタグの位置が広域図上に表示されます。また、拡大図上にもアイコンが表示されます。このアイコンがあるタグをクリックすると、そのタグに絞った、そのブログの記事を表示することができます。この機能は一か月に多くの記事を投稿するブログの場合特に有効です。なぜなら、大量の記事をタグ毎に分類して関心のある記事のみを読むことができるからです。

入力するブログURLは、ご自分のURLだけでなく、どなたのブログのものでも構いません。有名ブログのURLを入力して、そのブログの記事を読むツールとしてご利用いただくこともできます。

パーツの貼り付け方

パーツを自分のブログに張り付けるには、同じページにある「パーツを生成」のボタンを押します。そうすると、次のようにパーツを貼りつけるためのHTMLソースが生成されます。



そのHTMLソースを、そのまま選択して、ブログ記事やサイドバー等に張り付けることでOKです。ただし、ブログプロバイダーによっては、HTMLタグとしてiframeを許していない場合もございます(gooブログもそうですが)。この場合、パーツを貼りつけることはできませんが、リンクURLが生成されますので、これをブックマークする等により参照してご利用いただければ幸いです。



そして、今回リリースしましたもう一つの機能は、BLOGRANGER TGの検索結果をRSSで配信するものです。TGの右側には、タグをクリックしたときの検索結果が表示されておりますが、その上部に、 があるのがご確認できると思います。これをクリックしてみてください。BLOGRANGER TGの検索結果をRSSリーダを使って購読することが可能になります。この機能の詳細は、また詳しくレポートします。

Ko





コメント ( 0 ) | Trackback ( 0 )

BLOGRANGER TGパーツ対応 ブログプロバイダー一覧

※TGパーツの使い方はこちらのエントリをご覧ください。

BLOGRANGER TGパーツが生成できるブログは、過去1か月間にgooブログ検索の検索対象となっている記事があり、かつ、以下のURLを有するブログです。

gooブログ検索の検索対象となるためには、goo pingサーバ(http://blog.goo.ne.jp/XMLRPC)に更新通知を送っていただく必要がございます。

http://blog.goo.ne.jp/*
http://blog.livedoor.jp/*/
http://*.livedoor.biz/
http://d.hatena.ne.jp/*/
http://blogs.yahoo.co.jp/*
http://*.*-nifty.com/*/
http://*.seesaa.net/
http://*.exblog.jp/
http://blog.excite.co.jp/
http://*.at.webry.info/
http://ameblo.jp/*/
http://*.blogspot.com/
http://*.typepad.jp/*/
http://*.weblogs.jp/*/
http://*.*.fc2.com/
http://blog.so-net.ne.jp/*/
http://*.blog.so-net.ne.jp/
http://*.justblog.jp/*/
http://*.blog.ocn.ne.jp/*/
http://pub.ne.jp/*/
http://www.doblog.com/weblog/myblog/*
http://blogs.itmedia.co.jp/*/
http://*.*.dtiblog.com/
http://blog.kansai.com/*
http://blogs.dion.ne.jp/*/

※ URLの入力にあたっては、ブログ「記事」ではなくブログ「サイト」のURLを正しく入力してください。特に、上記で記入した赤い部分もお忘れずに記入してください。

※ このリスト以外にも個別に記事を収集している場合がございます。少しだけですが。

また、BLOGRANGER TGで記事が収集されておりTGパーツが生成できても、貼り付け先のブログプロバイダーがiframeタグを許していない等の理由により、貼れないケースがございます。

上記のリストの内、貼れることが確認できたプロバイダーは以下の通りです。

[リスト記述予定]

また、収集対象に含めてほしいといったご要望は、本エントリのコメントとして投稿していただければ幸いです。ただし、gooブログ検索の検索対象となっていない場合には対応が困難です。また、このケース以外にも様々な事情により、必ずしもご希望に応えられないケースがございます。

Ko
コメント ( 6 ) | Trackback ( 0 )

バレンタイン効果

タグマップは過去約一か月のブログを使って生成しています。したがって、今日更新したタグマップは、2月全体を網羅したデータから作っています。2月といえばバレンタインデーがありますので、バレンタイン周辺のタグを見てみました。



確かに、チョコレートやホワイトデー等関連のタグが沢山できていることが分かります。このようなタグは、4月になれば消えていくのでしょうね。

簡単ですが、今週は以上です。

# 他TGスタッフメンバの皆さんもレポートお願いします。

Ko's monologue
コメント ( 0 ) | Trackback ( 0 )