Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

いいスパム,悪いスパム

2007年10月26日 | 社会問題
この間研究ミーティングでスパム,とくにsplogが話題になりました.Splogというのはブログ版のspamのことです.ブログを研究対象にしている以上,避けて通れないものです.すでに2005年の時点でアメリカのブログの75%がSplogだという分析があったぐらいです(U. of Marylandのebiquityの調査).
明らかなSplogは機械的にもはじけるのですが,最近中間的なSplogがでてきてこまったものです.特に問題なのが,人のコンテンツを使ったタイプのSplogです.
たとえば「...のウワサ」という記事を大量に掲載するサイトです.これ基本的に検索あるいはフィードから該当文字列を含むものをとってきて,それをあたかも自分の記事(あるいはサマリー)のように見せるものです.こんなもの作ってなんかの役に立つのかというと,リンクがアフィリエイトのページに飛ぶようになって,そこで小銭を稼ぐのでしょう.あるいはこれで被リンクを増やすSEO対策ですね.
さらにそういうブログを自動生成するツールもあるんですね.
#人のコンテンツを吸って儲けるまさに言葉の「吸血鬼」:-)

こういうページにたどり着くとたいていの場合,腹が立ちますよね.ぜんぜん有意義な情報がないので.でも必ずないといえないからややこしい.

文句をいいたいわけですが,著作権法違反といった法律を持ち出すのも,マナーに反しているとか倫理を持ち出すのは,実はまずいと思っています.

なぜかというと我々はすでにそういった世の法律や倫理とは違う環境であるWeb世界で十分に楽しんでいるでいるわけで,だからそれをいったら本末転倒になってしまうと考えるからです.

いいものはみんなで共有し,使い合う,それがWebのスタイルです.情報は使って減らないのだからみんなで使えばいい.実にシンプルなことです.Webは始まりから情報共有の世界を目指していたし,Appleが"Rip-Mix-Burn"といいだしてから自分たちの行動スタイルももそうなっている.近年のMush-upスタイルもその自然な延長線上にあるわけです.

実際,我々のグループでも情報をアグリゲーションして再提示するシステムも作ってきました.形式的にみたら,我々のシステムとSplog生成システムには差異がないわけです.

じゃあ,どこに違いがあるのか.

意味ある情報を世界に追加できるかどうかで判断すべきでしょう.
世界に何かしらプラスをもたらす情報はいいというわけです.
情報の集約という問題を考えたときも,集約してできた情報が新しい意味,価値があれば,それは「善なる集約」であり,集約情報がなにも意味をもっていない(たとえばランダムに情報を集めて集約)のは「悪なる集約」というわけです.

といったところで,この判断は難しいですね.情報の意味,価値は立場や状況によって違うわけですから,一概に○×をつけるようにいきません.

設計論的にいえば,その情報の作成意図が利用者のとって価値があるものならとりあえずその情報はいいといえるのでしょう.ただし,情報は作成意図どおりに解釈されるとは限らないので問題はそう簡単ではありません.
先のキーワード生成型Splogも場合によっては役に立つことがあるわけです.

ともあれ,情報のコンテンツそのものの良し悪しが分かるSpam第一世代からアグリゲーションやキーワード生成型Spamのようなmushup Spamという第二世代?になって,我々は情報の価値をもっと真剣に考えなければいけないということになったと思います.


最新の画像もっと見る

3 コメント

コメント日が  古い順  |   新しい順
Unknown (tak)
2007-11-03 23:21:06
NIIでTakedaといったら、
一人しかいないと思うのですが...






キーワード生成型Splogは、99.99%以上役に立たないですよ、
何よりも、情報量が全然ないことが問題ですよ。


 ぜんぜん有意義な情報がないので.でも必ずないといえないからややこしい.


いえ、100%ありません。
絶対にありません。
それは、オリジナルの情報ではないからです。


 我々のシステムとSplog生成システムには差異がないわけです.


大いに差はあります。
「投稿型」のblogに自動的に投稿連射してる、というところが大迷惑なんですよ。
返信する
tak (NII)
2007-11-03 23:21:56
NIIでTakedaといったら、
一人しかいないと思うのですが...






キーワード生成型Splogは、99.99%以上役に立たないですよ、
何よりも、情報量が全然ないことが問題ですよ。


 ぜんぜん有意義な情報がないので.でも必ずないといえないからややこしい.


いえ、100%ありません。
絶対にありません。
それは、オリジナルの情報ではないからです。


 我々のシステムとSplog生成システムには差異がないわけです.


大いに差はあります。
「投稿型」のblogに自動的に投稿連射してる、というところが大迷惑なんですよ。
返信する
Unknown (takeda)
2007-11-10 10:44:03
情報アクセスの視点でみると,どんなサイト経由でも最終的に目的の情報にたどり着けば,それは役に立つ情報です(もちろんサイドエフェクトで悪さをされては困りますが).
無意味な文章の羅列は情報アクセスの点でもまったく価値がありませんが,リンクを含むコピペ型は上の意味で価値がもちうるわけです.
返信する