Cafe de Kerm ~毒味ブログ~

物言いにも、珈琲にも、もれなく毒が混入している可能性が無いこともないです。

疑似個人情報、タダであげます

2008-11-28 18:00:22 | Weblog

昔はザルな管理のもとに扱われていた個人情報ですが、今はずいぶんと状況が変わってきました。といいますのも、「紙とペン」では流通の速度と量、拡散に限界がありましたが、今ではUSBメモリ一本、メール一通で数千件、数万件のデータベースが持ち運べますからね。実際に、たびたび数十万件という規模で流出が起きていますし、流出させた場合のリスクも大変大きくなっています。個人情報の保護というのはずいぶんとデリケートな問題になってしまいました。

そんな状況ですから、ニュースサイトで見かけたときは大変驚いたものです。なんでも、「本物そっくりのニセ個人情報」を、「無償提供」してくれるというのですから。
瞬時に頭に浮かんだのは「偽造・・・」、とか「なりすまし・・・」とかいう仄暗いキーワード。ただ、そういう使い方は一般人にはちとヘビーですので、アンケートに答えるときとか、捨てメールをとるときとか、ウェブサービスで必要以上に自分の個人情報を拡散させないために使うのかな?とか思ったのですが・・・ダウンロードできる数がちょっと多くないですか?

本物そっくり「疑似個人情報」を無償提供 ITmedia

People to People Communications(川崎市)は11月25日、統計データを元に作成した「疑似個人情報」の無償提供を始めた。非営利目的に限り、1人3000件まで無料でダウンロードできる。

架空の名前や住所、生年月日などで構成した個人情報リストを提供する。自治体などが公開している統計データの分布を正確に反映させており、実在の情報ではないものの「本物と区別することができないほど」そっくりだとしている。

疑似個人情報なんて言葉から連想しがちなアンダーグラウンド用途ではなく、実際には顧客データベースなどといった、不特定多数の人物を扱う上でのダミーデータとしての用途を想定されたもののようです。本物そっくりというのは、男女比や年齢比、出身地といった統計上のばらつきを差しているみたいですね。

・・・考えてみれば、架空の個人情報を作るのは別に難しいことではないですが、「統計的に正しい集合
」を得るとなるととたんにハードルがあがります。これまでは、以前の登録データを流用するなど「ある意味で本物」を使ったテストを行ってきたと推測されますが、このご時世、クライアントはそんなデータを開発業者に渡してくれませんよね。そういう観点で見ると、今回のサービスの価値がわかるというもの。こういうところに商売の種って転がっているんですねえ・・・

People to People Communications

今回提供されるデータはcsvで3000件。非営利目的に限っていますので、利用するときは注意が必要です・・・けれど、こういうデータって個人ではほとんど使い道なんて無いですよねぇ。せいぜいデータベースの学習目的に使うくらいでしょうか。企業さんにとっては、サンプルとして自社内での評価に使う形になるかなと。

今回は個人情報でしたけれど、統計的に正しいダミーデータって、考えてみたら結構需要があるかもしれないですね。ただ、求められる対象が狭すぎて、なかなか商売に結びつかないというだけで。たとえば、年間の天候とか、PC内ファイルの分布
状況とか。ぱっと思いつかないですけれど、面白いかもしれませんね。


最新の画像もっと見る