2007年10月3日のブログ記事一覧-大判、小判がザクザクザクザク！

「迷惑メールフィルター」は、どうなってるのかな？

2007-10-03 07:08:19 | Weblog

「迷惑メールフィルター」は、どうなってるのかな？

インターネット上を飛び交う電子メールの量は、いまや１日あたり約1000億通に達するといわれる。

そして、そのうち400億通以上を占めるのが「スパム」などと呼ばれる迷惑メール群だ（米IDC調べ）。筆者のメールアドレスにも、昼夜を問わず“逆援助交際の謝礼お支払い”やら“全裸盆踊り大会のお知らせ”やら、ありえない件名のメールが毎日20通ほど届く。うっとうしいことこの上ないぜ。

　こうしたスパムメールに対応すべく、多くのプロバイダーが採用しているのが、「迷惑メールフィルター」だ。これは、サーバーに届いた受信メールのなかから、スパムらしきメールを自動的に判別して隔離してくれるというもの。

主にWebメールサービス（「Gmail」や「Yahoo!メール」が代表的）でよく使われており、その効果はかなり高いが、まれにフィルターの誤判定によって、普通のメールがスパムとして隔離されてしまうことがある。

そこで気になるのが、一体、フィルターはどんな仕組みでスパムを判別しているのか？　という点。

具体的な方法はプロバイダーによって様々だが、主として次のような判定技術の組み合わせといわれている。

・RBLの参照による判定

　スパム送信元として知られている差出人のIPアドレス（インターネットに接続されたコンピュータ１台１台に割り当てられる識別信号）は、「RBL（Realtime Black List）」と呼ばれる外部データベースに記録されている。

プロバイダーはRBLを常時参照して、該当するアドレスからの受信メールをスパムと判定する。

・ブラックワードによる判定

メールの件名や本文に「スパム的なキーワード＝ブラックワード」が含まれているかどうかを判定する。

どんな言葉がブラックワードとみなされるかは、各プロバイダーの基準によって異なる。

・ベイジアンフィルターによる判定

　Web メールサービスの受信トレイには「迷惑メールを報告」ボタンがあり、ユーザーはこれを使ってスパムの受信をサーバー側に報告できる。

メール受信者が「スパムである」と判断した情報を収集し、その判断基準を分析することで、統計学的にスパムを判定する基準を学習していく。学習を続けることで、フィルターの精度は高まっていく。

などなど。

友人宛に送ったメールがなぜかスパム扱いされて届かなかった！　というケースも意外と多いが、ごく普通のメールであっても、こうした判定基準のいずれかにひっかかると、機械的にスパムとして判定されてしまうことがある。この場合は、該当するメールが「スパムではない」ことをサーバー側に通知すれば、フィルターの判定基準を変更させることができる。

「Gmail」や「Yahoo!メール」では、スパムと判定されたメールは“迷惑メールフォルダ”に移されて30日間保存後、自動的に削除される。大事なメールが誤判定で隔離されていないかどうか、定期的なチェックは必須といえそうだ。

	【gooブロガー・先着】dアカウント連携でdポイント2,000pt
	ブログを読むだけ。毎月の訪問日数に応じてポイント進呈
	【コメント募集中】goo blogスタッフの気になったニュース
	gooブロガーの今日のひとこと
	訪問者数に応じてdポイント最大1,000pt当たる！

日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31