身近な知識の共有、再利用のためのセマンティックな仕組み
前回、「ソーシャルの仕掛けに頼らない便利な次世代Web」と書きました。
ソーシャルに頼らない、いや、頼れない場といえば、企業内の情報システムです。豊富なリンク、被リンクも無いし(PageRankが無力)。そして、一般のネットのように、広大な人口の中から必ずや的確に質問に答えてくれる人が現れてくる(中にはとんでもない回答もありますが)、なんてことは望めないからです。そこで、素材となる情報、知識が、もう少し使いやすい形、自動的に再利用しやすい形で、グローバル、ローカルに共有できるようになっていれば、と思うのです。
単純なキーワード検索でなく、たとえば「人口密度」と言ったら、「(都道府県などの)人口÷面積」という、スプレッドシートのセル間に埋め込まれた計算式のような形で、だれでも再利用できるようにネット上に備わっていたら如何でしょう? 特定のアプリに依存せずに、データ、知識にくっついた形で様々な計算式が瞬時に使えるように流通していたら、とても便利になりそうに思いませんか? Wolframさんが数式を計算してくれるセマンティック検索サービスWolfram|Alphaを始めているので、ご利益のイメージは湧きやすくなりました。でも、独自形式の内部の計算式に知識が閉じ込められているので、オンラインながら、Excelよりも閉鎖的といえる面があるのではないかと思います。
オープンな規格で計算式や一般知識を表現し、共有する。すると、ある程度検証済みの知識パッケージを流用、再利用して、早く、安く、賢いシステムが作れる。これは、かつて、似たり寄ったりの情報システムを毎回手組みでオーダーメードで構築していた無駄をやめて、パッケージベースのシステム(例:CMS活用システム)に移行したのと似ています。
「情報システムのパッケージベースへの移行」という進化の、知識・情報バージョン、といえるでしょう。全世界で何万人もの人々がお互いに独立に作業しているのを知らずに、「えーと、人口密度は面積÷人口、、じゃなかった人口÷面積だから」と考えて表計算シートにコーディングしている状況。これって、人類規模で、脳のパワーの無駄遣いだと思うのです。
基準となる概念が実装レベルで共有され、文化や目的の違いによって半自動でカスタマイズされて欲しい。例えば、同じ人口密度でも、米国だったら平方エーカーで州のの人口を割るけどフランスでは、中国では、、など、いちいち調べたりしなくて良くなれば、いま書いているレポートの本題の方、例えば、「人口密集地域における新型インフルエンザ流行速度の国際比較」を適切に仕上げるための考察に集中できるのではないでしょうか。
この例でいえば、表計算のシートから解放された汎用の "計算式" は、項目と項目(メタデータ)間の関係の定義であり、「オントロジー」と呼ばれます。そう、オントロジーって、そんなに特殊なものではなく、日常的にお世話になっている知識や概念を、もう少しコンピュータに理解させて共有し、再利用性を高めよう、というものなのです。あるいは、コンピュータが安く素早く情報を収集し、知識を形成できるようになったので、ある目的専用の「使い捨て」知識をどんどん作ってみよう、という動きもあります。
いかがでしょうか。Web 3.0の定義にもいろいろありますが、新たなWebアプリケーション、Web上の知識・情報流通プラットフォームのトレンドの本命の1つとして追いかけてみる価値が十分にあるのではないでしょうか。残念ながら、日本国内、日本語の世界では、欧米、中韓に比べておの方面の取り組みが少なく、なかなか活用されていない、という事情があります。
ここへきて、構造をもったデータを共有できる、緩い(→※)デファクト規格Linked Open Data(LOD)が脚光を浴びています。この規格に基づくデータを共有する仕組み、Linked Open Dataクラウド(LODクラウド)により、上記のような構想が遠い先の夢ではなくなりつつあるように思えます。
※→「緩い」というのは、規定が少なく、気軽に作ったり変換できる、というほどの意味です。そうですね、、メタデータの規格でいえば、ダブリンコアのような、シンプルさ、使われやすさをもっている、といえそうです。