ちょっと思いついたことなので、忘れないうちにメモ。
(というわけで、これで出来るかどうかはわからないよ(^^;)
無責任な妄想ということで・・)
いま、年金で振り込まれていて
・振り込み記録はある
・だけど、照合キーである基礎年金番号や名前等が不明だったり、間違っているときに
・確からしいものを出してきて、その確からしさをファジー演算などをして、表示しなさい
という命題があったとする。この場合のやりかた案
■作戦!!
照合キーが使えないので、
・Aさんが払ってない部分とBさんが払った部分が照合した場合
・Aさんは、本当はBさんじゃないの?っていう確からしさを求めるものとする。
■処理内容
細かくやり始めてしまうと、たまたま当てはまるという偶然も多くなりそう。
そこで・・・
(1)1年以上あいている人をリストアップし、
・開いている部分が多い人を、補充組み
・あいている部分より、収めている部分が多い人を、足りない組とする
(2)補充組みは、納めた期間をDB化する
DB項目:ID(適当),開始期間、終了期間、基礎年金番号、名前、会社ID
何箇所か、飛び飛びになっている場合は、全部の箇所について登録する
例:昭和40年から45年、60年から63年、平成8年から10年だったら、
昭和40年から45年
60年から63年
平成8年から10年
の3つを登録する。
(3)足りない組の1データに対して、
補充組みから、足りない組のあいているところが、ピッタシ当てはまる
データを検索し、そのデータと、足りない組データの基礎年金番号、名前
の適合具合を調べ、高い順に並べる
もし、やりたいなら、いくつかの補充データをあわせれば、足りないところが
ぴったり合うかどうかも調べる
■適合具合
で、その補充組みデータと足りない組データの基礎年金番号、名前の一致度だけど、
基礎年金番号空白の場合は、何パーセント、そのほか、1番違いなら何パーセントときめる。
同様に名前の氏が違う何パーセント、名が違う何パーセントときめる。
たとえば、合計100%で、番号部分50%、名前部分50%として、
空白は、30%
1番違うごとに5%マイナス、10桁違えば0で、それ以上違っても0
氏がおなじなら20%、名前が同じなら30%
として、合計値を求める。
もちろん、このウエイト(%づけ)は、ここが間違えやすいという状況を考慮して、
変えていくものとする。
いやこれ、年金以外のことに使えるんじゃないかと思って(ジグゾーパズルや
割れたものの修復とか)いるんだけど・・
