年金記録問題をデータ品質問題として考える
前回も書きましたが、今回の年金記録問題をデータ品質の問題として考えると、
- 入力時点での不正データ排除の手だてをしていない(入力後の不正データ排除は非常にコストがかかるので、入力時点でできるだけ排除しておくことが大前提)
- 担当者(バイト)任せで経営者(責任者)は他人事
- データ品質の定量的管理をしてない
- 源書類を廃棄
ということで、データ品質のワースト・プラクティスの総合商社という感があります。
怒る気も失せてしまいますが、今後、同じような問題の発生を防ぐためには、米国風の社会保障番号の導入が考えられます。実際、検討もされているようです(検討は以前から行なわれていましたが、今回の件によりさらに注目度が高まっているようです)(参照記事)。データの入力漏れはどうしようもないですが、今回の年金問題の多くは名寄せが出来てないことに問題があるように思えるので、一意のIDがあれば話はだいぶ楽になるかもしれません。実際、米国では社会保障番号が個人の与信情報管理等にも使われており、顧客データベースの名寄せは日本と比べてかなり楽なようです。純粋に情報システムの視点から見ると、個人に一意のIDは是非振って欲しい気もします。
とは言え、
- 基礎年金番号という一意のIDが一応はあるにもかかわらず問題が発生している
- 社会保障番号付きのリストがWinnyで流出なんて問題が起こりかねない
- 住基ネットもまともに運用されているとは思えない
という現状を考えると、相当に厳格な仕組み作りと当事者の意識改革がない限り、社会保障番号の導入をせよとはなかなか言い難い状況でもあります。
ところで話はちょっと変わりますが、今回の件もあってデータ品質についてちょっとまとめて調べてみようということで、amazon.co.jpで「データ品質」をキーワードで探すと全然出てきません。一方、amazon.comで"data quality"をキーワードで探すと専門の教科書が数十冊出てきます。この差はどうなんでしょうか?
そういえば、私が前の会社にいた時には数々の講演をしましたが、実は、一番評価が高かったのが「データ品質」関連のお話しでした。地味で泥臭いテーマなので受けなさそうと思っていたので大変意外だったことを覚えています。明らかに、日本ではデータ品質関連の基本情報が圧倒的に不足しているということではないでしょうか?