ICT、クラウドコンピューティングをビジネスそして日本の力に!

オープンデータ社会(14)パブリックデータとは?

»

公共データの活用を考える場合において、オープンデータやビッグデータなどのキーワードが使われる場合が多くありますが、公共データをもう少し広義で整理するため「パブリックデータ」というキーワードでまとめてみたいと思います。

パブリックデータ」を以下の4つのデータカテゴリに分類しました。

1.オープンデータ
2.公共クローズドデータ(政府や自治体などの公共機関が保有する非公開の行政情報)
3.公共ソーシャルデータ(政府や自治体などの公共機関が提供するソーシャルデータ)
4.公共ビッグデータ(社会基盤となる公共性の高いビッグデータ)

4つのデータの位置づけについて整理をしていきたいと思います。

1.オープンデータ

オープンデータとは、政府、自治体、公共機関などが保有する大量の情報(PSI:Public Sector Information)を公開し、インターネットを通じて誰もが無料でアクセスしてダウンロードして利用でき、自由に再利用・再配布することができるデータを指している。オープンデータは、オープンガバメントにおける一つの枠組みという位置づけとなります。

公開されるデータはマシンリーダブルで変更可能な様々なフォーマットに対応する使いやすい方法で提供され、他のデータとの組み合わせも許可される形となります。

これまで、政府が公開するデータはPDFで提供されていました。PDFは文字が読みやすいなどのメリットはありますがデータの加工などの二次利用することは容易ではありません。二次利用可能なフォーマットでは、xlsやdoc、オープンに利用可能なcsvでの提供があります。

さらに、Web上にあるメタデータ(リソース)を記述するためのW3Cにて策定された標準フレームワークであるRDF(Resource Description Framework) や、XMLでの提供により他とのリンクも可能となり、より多方面での利用が可能となります。

米国政府などでは、相互運用性の確保に向けて、Linked Open Data (LOD)とよばれる機械可読かつリンク形式の共通データフォーマットにもとづきデータを公開しています。LODとは、Web技術を利用して、オープンなデータ(Open Data)を公開し、LInkさせる仕組みで、Web空間を巨大なデータベースとして、問い合わせや利用が可能となります。

データは原作者のクレジットを表示、もしくは、同じ条件で配布することを守れば、原則、改変や非営利目的や教育目的での利用に限ることなく、営利目的の二次利用も許可される形態となります。

代表的なのはクリエイティブ・コモンズです。CC BYの場合は、原作者のクレジット(氏名、作品タイトルとURL)の表示を守れば、改変はもちろん、営利目的での二次利用も許可される最も自由度の高いCCライセンスとなります。

各国では、オープンデータの活用において、政府独自のライセンスで提供しています。たとえば、英国政府では公開データの著作権や独自ライセンスとなる「Open Goverment License」で提供し、英政府の著作権の帰属を明記すれば、商業目的を含め個人企業問わず使用可能となります。

(1-1)政府や自治体などの公共機関がオープンに提供可能な行政情報

オープンデータは、主に政府や自治体などの公共機関の行政情報をマシンリーダブルな形で二次利用可能なフォーマットで提供するデータがを指します。

行政区等の「地理情報」、海洋情報等の「気象・環境情報」、経済統計等の「経済・ビジネス情報」、人口や意識調査や労働等の「社会情報」、渋滞情報等の「交通情報」、観光統計等の「観光・レジャー情報」、農地利用や漁獲等の「農林・水産・林業情報」、地球物理等の「資源情報」、犯罪や特許や商用等の「法務情報」、大学研究等の「科学・研究情報」、学術論文等の「教育情報」、政府官報や白書等の「政治情報」、美術や図書館等の「文化情報」などが挙げられます。

これらのデータの二次利用し、マシンリーダブルな変更可能なフォーマットで、収集・分析やデータのマッシュアップを行うためのアプリケーションを開発し、ユーザにとって使いやすいビジュアル化をすることで、市民生活や企業活動に有益な付加価値の高い情報として提供していくことが、経済の活性化や公共サービスの向上にもつながることが期待されています。

特に、データの利活用がしやすいのが地理データや気象データです。ハーバード・ロースクールのローレンス・レッシング教授は、気象データの公開は「8億ドルを超える経済価値を生む」と述べられているように、パブリックデータのオープン化による、経済波及効果は高いといえるでしょう。

(1-2)政府や自治体などの公共機関以外が提供する二次利用可能なデータ

オープンデータには、公共機関だけでなく民間企業により提供されるケースもあります。たとえば、2011年9月12日に開催された「東日本大震災ビッグデータワークショップ - Project 311 -」では、震災発生から1週間の間に実際に発生したデータをワークショップの参加者に提供し、参加者がそのデータを分析することで、今後発生する災害において、どのような対応できるか議論しサービス開発を行う取り組みが行われました。グーグルやNHKやホンダ技研工業やゼンリンデータコムなど8社から震災後の1周間のデータが公開されました。

2.公共クローズドデータ(政府や自治体などの公共機関が保有する非公開の行政情報)

(2-1)政府や自治体などの公共機関が保有し国民がアクセス可能な情報

オープンデータに対して、政府や自治体などの公共機関が保有するデータの多くは非公開のデータ、つまり、クローズドデータとなります。たとえば、自治体の場合では、住民記録、印鑑証明、外国人登録、国民健康保健、国民年金などの「住民記録データ」や個人住民税、固定資産税、軽自動車税などの「税に関するデータ」、介護保健、後期高齢者医療、障害者福祉、子育て支援医療、母子医療、老人医療、障害者医療、児童手当などの「医療・福祉データ」などがあります。  

東日本大震災において、自治体の住民データなどの多くの住民生活に関わる多くの基本データデータが津波で流された。そのため、情報の保全やデータのバックアップの必要性が高まっています。

政府や自治体、そして企業などの社会を構成する事業主体は縦割りとなるケースが多く、横軸の情報連携がうまく進んでいない状況にあります。それぞれの主体が生み出した膨大な情報を共有できていないために、非効率を生み出し、社会コストの増加にもつながっています。

特に、各自治体においては、ほぼ同様の情報を扱っており、自治体クラウドなどによるシステム共通化による効率化に向けた取り組みの検討が進められています。

また、これらの情報に対して、国民一人ひとりが、アクセスする権利のある情報もあり、国民IDにより、税や社会保障、介護、医療などの個人情報に安全にアクセスするための制度やシステムの検討が進められています。

(2-2)民間事業者が保有する医療分野などの公共性の高いクローズドな情報

健康・医療や教育などの公共分野のデータは、政府や自治体などの公共機関だけでなく、民間事業者がその利活用や分析の検討も進められています。

みずほ情報総研は2013年1月17日、健康・医療分野のビッグデータ分析手法開発に向け研究会を発足し、社員の健康増進・医療費適正化に向け、生活習慣と15万人の健診・医療データを分析などの取り組みを行なっています。

社員の健康に対する関心が高まりを見せている一方で、医療保険財政が急速に逼迫しており、健診・医療の大量のデータを集計し、組織全体の健康増進・医療費適正化に向けたPDCAサイクルを回すなどの、医療費の適正化に向けた取り組みが重要となっていくでしょう。

3.公共ソーシャルデータ(政府や自治体などの公共機関が提供するソーシャルデータ)

政府や自治体などは、ここ数年、ツイッターやフェイスブック、そしてLINEなどのソーシャルメディアを通じて行政情報などを発信しています。特に東日本大震災では、政府や自治体などの公共機関が発信するソーシャルデータが効果を発揮し、その評価が高まっています。

公共機関が発信する情報は信頼性も高く、国民にとってはリアルタイムに情報を受取ることができます。また、国民や住民からも意見を書き込むことができるため、双方向性の高いやりとりを行うことができ、行政の取り組みに意見を反映させていくといった事例も増えています。

4.公共ビッグデータ(社会基盤となる公共性の高いビッグデータ)

時代の流れは、家電や自動車、建築設備など世界中のあらゆるモノに無線タグやセンサーを組み込み、デジタル化することで、インターネットやセンサネットワークを通じてつながり広く流通するモノのインターネットの世界であるIOT(Internet of Things)の方向へと進んでいます。

家庭内の通信機能を持ったスマートメータ(次世代電力計)が、ネットワークで電力会社のセンターと接続することによって使用電力の見える化などを提供するスマートグリッドも注目されています。各家庭にスマートメーターが設置され、スマートグリッドが街全体に普及することになれば、人による検針作業は不要となり、電力制御による給電の最適化も行えます。さらにはスマートメータなどスマートグリッドに接続された個々のデバイスから発生する電力利用データを活用することで、電力需給をオンデマンドでコントロールするデマンドレスポンスを行うことができ、様々なサービス創出も期待されます。

自動車がネットワークからクラウドにつながれば、自動車から発信されるワイパーやブレーキから発信されるプローブ情報から、運行情報を把握して渋滞を緩和させるといったように、社会経済の効率性を高めることも可能となります。

モノのすべてがインターネットにつながり、機器と機器とをクラウドでつなぎ高度な制御を実現する「M2M(マシン・ツー・マシン)クラウド」の世界が実現すれば、データの効率的な収集が可能となり飛躍的に効率性や利便性の高い社会が享受できるようになるでしょう。

社会基盤となる公共性の高いデータには、温度・湿度センサ、CO2・花粉センサといったセンサデータで動的でリアルタイム性の高いストリームデータがあげられます。

センサーデータには、その他には、加速度・振動センサ、湿度・温度センサ、水分・流量センサ、熱量センサ、濃度・粘度センサ、圧力センサ、ひずみセンサ、光(赤外線)センサ、磁気センサなどがあります。

これらのデータを収集し利活用することで、農業や都市計画、環境対策、防災、資源管理、危機保全、気象・大気観測、医療、国土保全といった分野においての生産性の向上や新サービスの創出などが期待されています。

特に、全国の橋や道路、水道といった社会インフラが一斉に寿命を迎えることになり、国土基盤ストックの維持管理や更新費用は、今後増加を続け、2020年には約12兆円になると予測しており、センサデータを用いて効率的に維持管理を行うことが期待されています。

これからのデータは、公共分野での利用となりますが、動的にリアルタイムにデータが蓄積されるため膨大なデータ容量の場合が多く、かつリアルタイム性の高いデータとなり、国土安全に関わることから、オープンデータではなく多くは利用者を限定したクローズドデータとなるでしょう。

気象データのオープンデータと、スマートメーターから収集された電力利用データなどを組み合わせることで、より効率的なデマンドレスポンスを提供するといったように、社会基盤としてのデータ活用は様々な可能性を持っているといえるでしょう。

まとめ

パブリックデータの枠組には、その他にも様々なデータが考えれ、いろんな整理方法が考えられます。パブリックデータにおいて、オープンデータやセンサデータなど様々なサービスを組み合わせることで、公共分野における業務の効率化や生産性の向上、新サービスの創出などが期待されます。

「パブリックデータ」を整理する上で、この4つの枠組みを中心に、その可能性について着目してきたいと考えています。 

 

オープンデータ社会(1)オープンデータとは? 2013/01/21

オープンデータ社会(2)米政府におけるオープンガバメントの取り組み 2013/01/22

オープンデータ社会(3)世界の政府におけるオープンデータ戦略の取り組み 2013/01/23

オープンデータ社会(4)民間事業者の参入 2013/01/25

オープンデータ社会(5)米国政府におけるビッグデータ関連政策 2013/01/28

オープンデータ社会(6)日本におけるオープンガバメントの取り組み 2013/01/29

オープンデータ社会(7)公共データへの産業界からの期待 2013/01/31

オープンデータ社会(8)電子行政オープンデータ戦略 2013/02/1

オープンデータ社会(9)総務省などの取り組み(情報流通連携基盤事業、オープンデータ流通推進コンソーシアム) 2013/02/4

オープンデータ社会(10)総務省などの取り組み(クラウドテストベッドコンソーシアム) 2013/02/5

オープンデータ社会(11)経済産業省などの取り組み(DATA METI構想など) 2013/02/13

オープンデータ社会(12)オープンデータアイディアボックス 2013/02/14

オープンデータ社会(13)自治体のオープンデータの取り組み 2013/02/15

オープンデータ社会(14)パブリックデータとは? 2013/02/18

Comment(0)

コメント

コメントを投稿する