知財、ユビキタス、企業コンピューティング関連ニュースに言いたい放題

年金記録問題をデータ品質問題として考える

»

前回も書きましたが、今回の年金記録問題をデータ品質の問題として考えると、

  • 入力時点での不正データ排除の手だてをしていない(入力後の不正データ排除は非常にコストがかかるので、入力時点でできるだけ排除しておくことが大前提)
  • 担当者(バイト)任せで経営者(責任者)は他人事
  • データ品質の定量的管理をしてない
  • 源書類を廃棄

ということで、データ品質のワースト・プラクティスの総合商社という感があります。

怒る気も失せてしまいますが、今後、同じような問題の発生を防ぐためには、米国風の社会保障番号の導入が考えられます。実際、検討もされているようです(検討は以前から行なわれていましたが、今回の件によりさらに注目度が高まっているようです)(参照記事)。データの入力漏れはどうしようもないですが、今回の年金問題の多くは名寄せが出来てないことに問題があるように思えるので、一意のIDがあれば話はだいぶ楽になるかもしれません。実際、米国では社会保障番号が個人の与信情報管理等にも使われており、顧客データベースの名寄せは日本と比べてかなり楽なようです。純粋に情報システムの視点から見ると、個人に一意のIDは是非振って欲しい気もします。

とは言え、

  • 基礎年金番号という一意のIDが一応はあるにもかかわらず問題が発生している
  • 社会保障番号付きのリストがWinnyで流出なんて問題が起こりかねない
  • 住基ネットもまともに運用されているとは思えない

という現状を考えると、相当に厳格な仕組み作りと当事者の意識改革がない限り、社会保障番号の導入をせよとはなかなか言い難い状況でもあります。

ところで話はちょっと変わりますが、今回の件もあってデータ品質についてちょっとまとめて調べてみようということで、amazon.co.jpで「データ品質」をキーワードで探すと全然出てきません。一方、amazon.comで"data quality"をキーワードで探すと専門の教科書が数十冊出てきます。この差はどうなんでしょうか?

そういえば、私が前の会社にいた時には数々の講演をしましたが、実は、一番評価が高かったのが「データ品質」関連のお話しでした。地味で泥臭いテーマなので受けなさそうと思っていたので大変意外だったことを覚えています。明らかに、日本ではデータ品質関連の基本情報が圧倒的に不足しているということではないでしょうか?

Comment(6)

コメント

今回の問題は
・これまで一意のIDが無くて名寄せができてなかった
・名寄せするために一意のIDである基礎年金番号を導入した(平成9年)
・名寄せの処理がいいかげんだったので、名寄せできてない情報が沢山残ったままになっている
という事で、

>個人に一意のIDは是非振って欲しい気もします。
は既にあります(基礎年金番号)し
>基礎年金番号という一意のIDが一応はあるにもかかわらず問題が発生している
という話でもありません。

とおりすがり

>名寄せするために一意のIDである基礎年金番号を導入した(平成9年)

これが遅すぎたのでは?
米国より数十年おくれていませんか?データに不整合が生じた「後」に、導入しても手遅れ。入れるのは不整合が生じる「前」でないとね。IDにできるのはデータの不整合を未然に防いだり不整合を検出するまでで、矛盾だらけのデータを自動修復したりはできません。
魔法じゃないのだから、すでに破棄されたデータがある日突然元通りに修復されたりはしないのですよ。

にゃーす

年金制度には既に基礎年金番号という一意のIDがあり、社会保障番号の導入は屋上屋を重ねるものだと思います。
基礎年金番号の導入は平成9年ですが、今回の5000万件の不明な年金は、それ以前に発生したとされており基礎年金番号という一意のIDが一応はあるにもかかわらず問題が発生しているという認識は誤りではないでしょうか。

社会保障番号を導入にするのであれば年金だけでなく健康保険、介護保険、雇用保険、生活保護、児童手当といった各種社会保障制度全般で使えるものでなければ役に立たないと思います。
しかし、当然便利になればなるほどその番号を悪用される危険性も高まります。導入には反対する人も増えるでしょうね。住基コードはそれが原因で利用におそろしいほどの制限をつけられ結果的に役に立たないものになってしまいました。社会保障番号も同様ではないでしょうか。

誤入力の主犯は「かな変換ソフト」か?
http://www.itmedia.co.jp/news/articles/0706/18/news060.html
という記事もありましたが、昭和54年ってITなんて言葉もなくて電算とか言ってたような時代ですよね。そんな太古の時代のデータなんてあてにならなくて当然という気もしてきてしまいます。

ぴっころ

単純に身分証明書じゃダメなんでしょうか...
運転免許書や保険証、あるいはパスポートとか。
ダメなんでしょうね...

栗原潔

基礎年金番号が付与されるようになってからも、二重登録等の事故があったようです。要は採番管理がちゃんとできてないと、一意のIDを付けてもあまり意味がないということです。
社会保障番号として基礎年金番号を流用して、それを他の社会サービスや与信管理にも利用するというやり方も考えられますが、いずれにせよ現状の仕組みと意識のままでやるのは無謀でしょう。

僕は単純に意識だと思います。
データ品質に関しては民間で取組んでいるところは同時期にいくつもあった訳で、それを知らないというのならば余程データベース、情報管理に無知だったとしか言えません。
郵便貯金の口座情報が、紛失したとか、入れ替わってるとか、基本的にありえませんよね。
そこに居た人間と、組織体質の問題以外何も無いと思います。そういった資格が無い事だけが明らかなのだと思います。

コメントを投稿する