オープンデータガイド第1版(4)オープンデータの作成・公開手順
オープンデータガイド第1版におけるオープンデータの作成・公開手順について整理をしたいと思います。
本ガイドでは、オープンデータの作成・公開手順を、1.オープンデータ推進組織の設立から2.現状把握、3.計画立案、4.公開作業、改善点の洗い出し、そして5.公開・運用の以下の6つのステップに分けて解説しています。
1.オープンデータ推進組織の設立
オープンデータの作成・公開作業は、各部署を横断する取組になる。オープンデータを作成・公開するに当たり、データを保有している各部署との連携・調整が必要になる。このために、オープンデータの作成・公開を進めるに当たって、オープンデータを推進するための、各部署から独立した組織を設立することが望ましい。
2.現状把握
現状把握として、各部署が管理しているデータを、以下の観点でまとめることが重要である。(データの棚卸しのような形で実施することが望ましい。)
l データの管理担当部署
l データの種類(予算・各種報告・統計・広報等)
l データの分量
l ニーズ分析現状把握に当たり、注目すべき箇所を以下に挙げる。
① データの形式
それぞれのデータの形式を確認する。
l 紙(同一情報の電子データがあるか要確認)Ø 電子データがない資料を公開するにはスキャンする必要がある。
l 電子データ(ファイル形式の確認)② データの管理者
データを管理する各部署の情報管理体制を確認する。
l 管理者が設定されているか。
l 管理者が統一されているか。③ データの更新頻度
データがどのくらいの頻度で更新されるか、確認する。
l 年に1回更新/月に1回更新/適宜更新等④ データの権利関係
それぞれのデータについて、例えば下記を確認する。詳細は第II部を参照されたい。
l 第三者が著作権等の権利を有するデータ
l 法令上の制約 等⑤ ニーズ分析
情報利用者から多く問い合わせられるデータや、他の同様の組織で公開されているデータは、ニーズが高いと考えられる。ニーズの高いデータからオープンデータとしての公開に取り組むことも有用である。
3.計画立案
計画立案のステップでは、現状把握又はフィードバックに基づき、オープンデータの対象とするデータやその作成・公開手法を明確にする。その際、マイルストーンを作成し、それに基づきスケジュールを立てることが望ましい。また、大きな組織であるほど、計画立案が重要である。
計画立案のステップで留意すべき項目を以下に挙げる。
① データ形式・システムの準備計画
l 8.2節及び8.4節を参考に、どのレベルの「データ」と「データカタログ」を準備するか、方針を策定する。
l また、9.1節を参照し、必要なメタデータや識別子体系を検討する。② 運用ルールの策定
l データを管理している組織からのデータの入手手順・頻度を明確にする。
l 適宜更新される場合は、更新手法をルール化しておく必要がある。
l 8.5節を参照し、データの登録ポリシを決定する。③ 利用ルールの設定
l オープンデータの利用ルールを設定する。
l その設定に当たって、第三者権利問題や法令上の制約がある場合は、それを踏まえ、利用ルールの内容や適用範囲を整理する。④ スモール・スタートの原則
l 作業は段階的に行い、完了したものから順次公開できるように、マイルストーンを設定する。
l 年度ごとに目標・計画を立てることが望ましい。
l 「電子行政オープンデータ戦略」においても、「取組可能な公共データから速やかに公開等の具体的な取組に着手し、成果を確実に蓄積していく」と記載されており、スモール・スタートの原則が採用されている。
4.公開作業
立案した計画に基づき、調達をかける等して必要なツールを揃え、オープンデータを作成・整形し、公開の準備作業を行う。また、計画に基づき、データカタログを準備する、又は対象のデータをデータカタログシステムに登録する。
データを公開する際に留意すべき点を、以下に挙げる。
l 公開時に明確にすべき情報
l 公開による影響
l データを公開するサーバに関する留意事項
l データの信頼性
l プライバシー・匿名化以下、それぞれについて解説する。
4.1 公開時に明確にすべき情報
公開する個々のデータに関して、以下の3点を明らかにすべきである。
① メタデータ: どんなデータか?
② アクセス方法: そのデータはどのようにして取得できるか?
③ 利用ルール: そのデータはどのような条件で取得・利用できるか?
以下、それぞれについて解説する。
4.1.1 メタデータ
例えば、政府データカタログサイト試行版「DATA.GO.JP」では、以下のようなメタデータが掲載されている。
l タイトル
l 組織名
l 公表者(部局)
l 作成者
l 更新頻度
l タグ
l リリース日
l URL
l ファイルサイズ
l 最終更新日
l 使用言語
l 補足4.1.2 アクセス方法
アクセス方法とは、そのデータを取得するための手法である。例えば、Web上のアドレス(URL)やデータを取得するためのAPIを明記する。
用途によって最適なデータ形式が異なる場合は、複数の形式でデータを取得できることが望ましい。例えば、8.1.3節に述べる場合がこれに当たる。
4.1.3 利用ルール
例えば、利用ルールとして、以下のような事項がある。詳細は、第II部を参照されたい。
l 二次利用できるか。
l 商用利用できるか。
l 法令上の利用制約があるか。
l 二次利用に当たって、出典記載等の条件があるか。4.2 公開による影響
オープンデータとして公開したデータは、全世界に対して公開されることに留意すべきである。そのため、データの公開により、海外からの問い合わせがあることも想定される。
4.3 データを公開するサーバに関する留意事項
データを公開する際には、公開したデータにどれくらいのアクセスが予想されるか、検討する必要がある。予想外のアクセスが集中し、サーバの処理が追いつかなくなった場合、公開したデータに対するアクセス障害が発生する。また、リアルタイムデータを扱う場合は、サーバの記憶容量を動的に消費するため、サーバの記憶容量が枯渇することによりアクセス障害が発生する可能性がある。
本事項についての詳細は割愛する。データを公開する際に、公開サービスを運用する業者や部署と、事前に協議しておくことが望ましい。
4.4 データの信頼性
オープンデータではデータの二次利用を行うことが前提であり、推奨される。しかし、データの流通の過程において、情報利用者によって改ざんされることも有り得る。また、情報提供者のクレジットを記載したまま、意図しない編集や変更がされる可能性もある。例えば、地図上の地名や統計情報の地域名等の意図的な変更がこれに当たる。
このような場合に、情報提供者がその正当性を主張するための方法が2つある。
1つは、オープンデータの原則に基づき、一度公開したデータを公開し続けることである。オープンデータとして公開したデータの原典を明示しておくことにより、情報提供者は、改ざんされたデータが自身の提供するものでないことを示すことができる。(改ざんされたデータと情報提供者が公開しているデータが異なっていることを示すことができる。)
もう1つは、改ざんを技術的に検知する方法である。これについては、本章の最後に、補足として記す。
4.5 プライバシー・匿名化
データを公開するに当たり、そのデータに個人を特定する情報が含まれていないか、確認する必要がある。必要に応じて、匿名化の手法を利用して、プライバシーを考慮すべきである。
本事項についての詳細は割愛する。データを公開する際に、専門家や担当部署と、事前に協議しておくことが望ましい。
5.公開・運用
マイルストーンに基づき、ある程度のデータが登録された段階で公開し、オープンデータの提供を開始する。運用中は、情報利用者からのフィードバックが得られるように、アンケートページや問合せ窓口を用意することが望ましい。
6.改善点の洗い出し
一定の期間ごとに、情報利用者から得られたフィードバックや、運用上の問題を整理し、改善点を洗い出す。新規のデータを公開するタイミングで、改善点を洗い出すことが望ましい。その後、得られた改善点を解決するための計画を立案する。また、改善点を洗い出す際に、8.4節に示すオープンデータの技術レベルの向上、又は利用ルールの見直しを併せて行うことを推奨する。
オープンデータの公開運用にあたっては、推進のための組織を設置し、現状分析、計画立案、そして公開作業など、それぞれのプロセスが重要となります。これらを実施するための組織設計や推進者によるリーダーシップ等はが推進のための重要なポイントの一つとなるでしょう。
- オープンデータガイド第1版(1)全体構成とデータ形式 2014.8.5
- オープンデータガイド第1版(2)オープンデータの動向 2014.8.6
- オープンデータガイド第1版(3)オープンデータの意義と定義 2014.8.7