「迷惑メールフィルター」は、どうなってるのかな?
インターネット上を飛び交う電子メールの量は、いまや1日あたり約1000億通に達するといわれる。
そして、そのうち400億通以上を占めるのが「スパ ム」などと呼ばれる迷惑メール群だ(米IDC調べ)。筆者のメールアドレスにも、昼夜を問わず“逆援助交際の謝礼お支払い”やら“全裸盆踊り大会のお知ら せ”やら、ありえない件名のメールが毎日20通ほど届く。うっとうしいことこの上ないぜ。
こうしたスパムメールに対応すべく、多くのプロバイダーが採用しているのが、「迷惑メールフィルター」だ。これは、サーバーに届いた受信メールのなかから、 スパムらしきメールを自動的に判別して隔離してくれるというもの。
主にWebメールサービス(「Gmail」や「Yahoo!メール」が代表的)でよく使 われており、その効果はかなり高いが、まれにフィルターの誤判定によって、普通のメールがスパムとして隔離されてしまうことがある。
そこで気になるのが、 一体、フィルターはどんな仕組みでスパムを判別しているのか? という点。
具体的な方法はプロバイダーによって様々だが、主として次のような判定技術の組 み合わせといわれている。
・RBLの参照による判定
スパム送信元として知られている差出人のIPアドレス(インターネッ トに接続されたコンピュータ1台1台に割り当てられる識別信号)は、「RBL(Realtime Black List)」と呼ばれる外部データベースに記録されている。
プロバイダーはRBLを常時参照して、該当するアドレスからの受信メールをスパムと判定する。
・ブラックワードによる判定
メールの件名や本文に「スパム的なキーワード=ブラックワード」が含まれているかどうかを判定する。
どんな言葉がブラックワードとみなされるかは、各プロバイダーの基準によって異なる。
・ベイジアンフィルターによる判定
Web メールサービスの受信トレイには「迷惑メールを報告」ボタンがあり、ユーザーはこれを使ってスパムの受信をサーバー側に報告できる。
メール受信者が「スパ ムである」と判断した情報を収集し、その判断基準を分析することで、統計学的にスパムを判定する基準を学習していく。学習を続けることで、フィルターの精 度は高まっていく。
などなど。
友人宛に送ったメールがなぜかスパム扱いされて届かなかった! というケースも意外と多いが、ごく普通のメールであっても、こうした判定基準のい ずれかにひっかかると、機械的にスパムとして判定されてしまうことがある。この場合は、該当するメールが「スパムではない」ことをサーバー側に通知すれ ば、フィルターの判定基準を変更させることができる。
「Gmail」や「Yahoo!メール」では、スパムと判定されたメールは“迷惑メールフォルダ”に移されて30日間保存後、自動的に削除される。大事なメールが誤判定で隔離されていないかどうか、定期的なチェックは必須といえそうだ。
インターネット上を飛び交う電子メールの量は、いまや1日あたり約1000億通に達するといわれる。
そして、そのうち400億通以上を占めるのが「スパ ム」などと呼ばれる迷惑メール群だ(米IDC調べ)。筆者のメールアドレスにも、昼夜を問わず“逆援助交際の謝礼お支払い”やら“全裸盆踊り大会のお知ら せ”やら、ありえない件名のメールが毎日20通ほど届く。うっとうしいことこの上ないぜ。
こうしたスパムメールに対応すべく、多くのプロバイダーが採用しているのが、「迷惑メールフィルター」だ。これは、サーバーに届いた受信メールのなかから、 スパムらしきメールを自動的に判別して隔離してくれるというもの。
主にWebメールサービス(「Gmail」や「Yahoo!メール」が代表的)でよく使 われており、その効果はかなり高いが、まれにフィルターの誤判定によって、普通のメールがスパムとして隔離されてしまうことがある。
そこで気になるのが、 一体、フィルターはどんな仕組みでスパムを判別しているのか? という点。
具体的な方法はプロバイダーによって様々だが、主として次のような判定技術の組 み合わせといわれている。
・RBLの参照による判定
スパム送信元として知られている差出人のIPアドレス(インターネッ トに接続されたコンピュータ1台1台に割り当てられる識別信号)は、「RBL(Realtime Black List)」と呼ばれる外部データベースに記録されている。
プロバイダーはRBLを常時参照して、該当するアドレスからの受信メールをスパムと判定する。
・ブラックワードによる判定
メールの件名や本文に「スパム的なキーワード=ブラックワード」が含まれているかどうかを判定する。
どんな言葉がブラックワードとみなされるかは、各プロバイダーの基準によって異なる。
・ベイジアンフィルターによる判定
Web メールサービスの受信トレイには「迷惑メールを報告」ボタンがあり、ユーザーはこれを使ってスパムの受信をサーバー側に報告できる。
メール受信者が「スパ ムである」と判断した情報を収集し、その判断基準を分析することで、統計学的にスパムを判定する基準を学習していく。学習を続けることで、フィルターの精 度は高まっていく。
などなど。
友人宛に送ったメールがなぜかスパム扱いされて届かなかった! というケースも意外と多いが、ごく普通のメールであっても、こうした判定基準のい ずれかにひっかかると、機械的にスパムとして判定されてしまうことがある。この場合は、該当するメールが「スパムではない」ことをサーバー側に通知すれ ば、フィルターの判定基準を変更させることができる。
「Gmail」や「Yahoo!メール」では、スパムと判定されたメールは“迷惑メールフォルダ”に移されて30日間保存後、自動的に削除される。大事なメールが誤判定で隔離されていないかどうか、定期的なチェックは必須といえそうだ。