エンタープライズ(企業)向けのオープンソースとか育児とかについて考えていきます。

デジタルアーカイブシステム DSpace と Alfresco

»

先日、OSSコンソーシアムの部会で (株)TIS さんから OSSのデジタルアーカイブシステム DSpace を紹介 していただきました。デジタルアーカイブというのは、いろんな文化資源をデジタル化して保存し、公開する仕組みで、国家プロジェクトとして多くの美術館や博物館、図書館などで取り組みがなされています。DSpaceはこの仕組みをOSSで実装したもので、すでにかなりの大学や博物館などで実績があるそうです。

もともと、ファイルの保管に関する仕組みと言うことで、弊社が扱っている文書管理システム Alfresco と似ている部分があるのでは、と思って参加したわけですが、システムにおいて重視している点がかなり違うことが分かりました。以下、セミナーを聞いて、ぼくの感じたDSpaceのイメージですので、実際のDSpaceの開発思想とは異なっているかもしれないことをご容赦ください。

DSpace 自体はデジタルデータを保存しておき、それを適切に取り出す仕組みを持っています(全文検索にLuceneを使うなど、バックボーンとなる技術もAlfrescoと似ています)が、ここは最低限の機能に限られている印象がありました。この保存の仕組みだけ見るとAlfrecoの方が高機能かもしれません。ポイントは、それを公開する部分です。これはDSpaceだけで完結しません。デジタルアーカイブシステムのネットワークでは、公開されたデータのうちメタデータをクロールしていくハーベスターと呼ばれる中央集権サーバが存在します。レジストリに登録することで、中央のサーバが各組織に置かれた配信サーバにメタデータを取得しにやってきます(これを刈り取り(ハーベスティング)呼ぶようです)ユーザはまず、中央にあるサーバからメタデータだけを検索し、そこから、各組織に実データを閲覧しに行く、という仕組みになっているようです。ここで、メタデータを配信する仕組み、メタデータのフォーマットおよびプロトコル(OAI-PMH)が標準規格になっており、DSpaceはこれを実装することで、デジタルアーカイブシステムとして機能する、というわけです。この部分はもちろんAlfrescoにはありません。Alfrescoというのは組織内で文書ライフサイクルを管理する仕組みはありますが、それらを組織外部に流通させる部分に関してはそれほど強くありません。

セミナーではAlfrescoとの違いについても検討したというお話しがありました。その結果、印刷業界で言うとAlfrescoがプリプレス、DSpaceがポストプレスにあたっており、目的が異なっているという結論を得たとのことでした。これは非常に納得できる切り分けです。AlfrescoのようなECMには組織内で変わっていく文書ライフサイクル全体を管理することに重点がありますが、DSpaceはすでに完成したデータをいかに長く保存するかに注力しています。採用されている規格もそういった長期保存を考えたモデルを採用しているとのことです。

メタデータを通信するOAI-PMHというプロトコルは公開されている標準規格ですし、メタデータそのものはDublinCoreでこれはAlfrescoもすでに対応できています。なので、AlfrescoがOAI-PMHによる通信を実装すれば、デジタルアーカイブシステムとしてデータを配信することは出来るようになるとは思います。が、両者の重視している点が違うことを考えると、もし、同じことをAlfrescoを使ってやる場合は、Alfrescoだけでやるよりも、DSpaceと連携を取るアーキテクチャの方が良いなと思いました。つまり作成段階で組織内でデータが作られている間は、Alfrescoで管理し、それをデジタルアーカイブとして公開する際に、Alfresco側からDSpaceに発行すれば良いわけです。これまでと同じように直接DSpaceに入れることもできますし、配信部分はDSpace側がシンプルな形でやったほうが良いのではないかと思いました。

簡単なイメージを作ってみました。
Dspacealfresco
(右側はDSpaceの収集方法としてぼくの理解したそのままを書いてあります。間違っていたらご指摘ください)

OSSというのは学術機関をはじめとする公的機関の公開原則とも相性が良いですから、ぜひともこういう製品が導入されるところが増えて行ければ良いなと思いますね。今年は震災があったことで、デジタルアーカイブが改めて評価されているという話もありました。さいきん家庭にも3D映像が浸透し始めてきたこともあり、立体物のデジタルアーカイブ3D化されて、どんどん増えていくんじゃないかと思います。データの作成過程が複雑になれば文書管理システムにも出番はありそうですし、今後、このジャンルも眺めていきたいと思っています。

Comment(0)

コメント

コメントを投稿する