超高速インメモリデータベースシステム製品「AktblitzII / DAYDA.LabooII シリーズ」で有名な株式会社ターボデータラボラトリーが、とんでもない新製品をリリースしました。

その名前は「1/3 C Reader・Publisher」(ワンサード シー リーダー・パブリッシャー)です。実に地味な名前です。名前だけでは全く凄そうに思えません。しかし、「2000億行、1024項目の瞬間検索ブラウザー」と聞くと、ちょっと気になる方がいるかと思います。

ターボデータラボラトリーの古庄晋二社長は「1/3」という理論を元に、独特の製品を開発しています。新製品の「1/3 C Reader・Publisher」の「C」はComplementary(相補的)の頭文字です。

「1/3」技術がメモリの高速性を活用して対話型バッチ処理を実現するのに対し、「1/3 C」技術はディスクの大容量・不揮発性を活用して、最大2,000億行、1,024項目を「自由にブラウズ」できるようにします。

最大2,000億行です。凄いですね。

企業や公官庁には、長年蓄積された膨大なデータを持っているところがあります。例えば、気象庁のアメダスは以下のような規模のシステムです。

アメダスは1974年11月1日から運用を開始し、現在、降水量を観測する観測所は全国に約1,300ヶ所あります。このうち、約850か所(約21km間隔)では降水量に加えて、風向・風速、気温、日照時間を観測しているほか、雪の多い地方の約290か所では積雪の深さも観測しています。

これだけの数の観測所が日々記録しているデータは、膨大な量になるはずです。しかも年数が経過すればするほど増えていきます。

民間企業の例を挙げると、ヤマト運輸の宅急便の取り扱い個数は、年間約12億個です。その集配データはどのくらいの件数になるのでしょうか。

データ件数が数百万件なら、一般的なリレーショナルデータベースでなんとか処理できるかもしれませんが、数億の桁となると厳しいのではと思います。

「1/3 C Reader・Publisher」は2,000億行までのデータを、パソコンで自由に表示・検索できる画期的なソフトウェアです。リレーショナルデータベースが「現時点のデータを矛盾無く保持する」ことに力点を置いているのに対し、「1/3 C Reader・Publisher」は「確定済の過去のデータをすべてため込む」ためのソフトウェアです。

製品は、ReaderとPublisherに分かれます。

あらかじめ、膨大な量のデータをPublisherで処理して、D5A形式のファイルに変換しておきます。D5Aファイルは単一の巨大なファイルです。データ件数によっては、TB(テラバイト)クラスになることがあります。Windows Vista以降でGPT(GUIDパーテーションテーブル)がサポートされたことにより、2テラバイトを超えるディスクパーティションを扱えるようになりました。

Publisherの仕事はここまです。

Publisherで作成されたD5Aファイルを読む時に使うのが、Readerです。Readerは一般的なスペックのWindowsパソコンで使えます。巨大なD5Aファイルをスクロールしながら眺めることや、条件に合った行を瞬時に絞り込むことが簡単にできます。

D5Aファイルからデータを切り出して自分で加工したい場合は、Readerで選択したデータを

1)CSV形式で保存する

2)Excel形式で保存する

3)同社のAktblitzIIで扱えるD5T形式で保存する

ことができます。

実際にデモを見せてもらいました。

6項目・40億件のデータをPublisherで処理して作成したD5Aファイルのサイズは、822GBになります。このデータ規模になると、メモリにすべて載せることは無理ですし、リレーショナルデータベースで扱うとしても厳しいと思います。

Readerのデモで使ったのは、Windows7の普通のノートパソコンです。Readerの動作は想像以上に高速でした。データの件数を全く意識させない軽々とした動作を実感しました。

標準で用意されているReaderは、エクセルのような表形式の機能を持ったWindowsアプリケーションです。ターボデータラボラトリーはそのエンジンを無償で配布し、GUIは無償かつオープンソースとして公開する予定です。つまり、ユーザが自分の使い方に合わせた専用のReaderを開発することができます。特定業務に組み込んで使うことが可能になります。大きすぎてこれまでハンドリングできなかった様々なデータがD5Aファイルとして入手できるようになれば、すごいアプリケーションがつくれるかもしれません。久々にワクワクする気分です。

ライセンス体系は、Publisherのサーバ1台について月額課金です。1ヶ月にPublishするD5Aファイルの数は無制限です。ReaderやD5Aファイルは無償で、どのように使うかの制限はありません。詳細は、ターボデータラボラトリーのWebサイトに資料(PDF)があります。

億単位の大量データの管理にお困りのお客様で、ご興味がありましたら、弊社お問い合せフォームよりお気軽にお問い合せください。

関連リンク:

テクネコ

Special

- PR -
コメント
廣江慈郎 2010/10/17 00:48

加藤さん、近々教えてください。(業務依頼っぽく)

テクネコ 2010/10/17 09:19

廣江さん、ターボデータラボラトリーさんはぶっ飛んだソフトウェアを開発するおもしろい会社です。


コメントを投稿する
メールアドレス(必須):
URL:
コメント:
トラックバック

http://app.blogs.itmedia.co.jp/t/trackback/77444/25238237

トラックバック・ポリシー


» このブログのTOP

» オルタナティブ・ブログTOP



プロフィール

加藤和幸

加藤和幸

株式会社テクネコ 代表取締役。
ITを売る側と買う側の両方の経験を活かして、CRMとCMSのコンサルティングを中心に、お客様の”困った”を解決します。

詳しいプロフィール

最近のコメント
カレンダー
2012年4月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          
カテゴリー
エンタープライズ・ピックアップ

news094.gif ストレス社会との付き合い方
政府がメンタルヘルス検査の義務化を検討しています。しかしうつになった後だけではなく、なる前の予防も大切なのではないでしょうか。(5/24)

news094.gif 「思いやり経営」のススメ
産学・NPO連携の民間団体が先頃、「思いやり経営」という観点で評価した指標や企業ランキングを発表した。企業のマネジメント力を知る手立てとして注目されそうだ。(5/24)

news094.gif テレワークが労働者のマインドを変える
テレワークが普及すると、労働者の評価は従来の「時間×生産性」から「成果」へと変化する。時間や場所を自分の裁量でコントロールできる変わりに、成果を最大化するために労働をマネジメントする能力とマインドが労働者には必要になる。(5/23)

news094.gif 求む、クックパッド男子
高身長も高学歴も高収入もいらない。私が男性に求めるのは「料理の腕」だけです。(5/18)

news094.gif 37歳の常識――我々は一生学び続ける
学び続けなければ衰退するのみだ。(5/18)

オルタナティブ・ブログは、専門スタッフにより、企画・構成されています。入力頂いた内容は、アイティメディアの他、オルタナティブ・ブログ、及び本記事執筆会社に提供されます。

Special

- PR -

サイトマップ | 利用規約 | プライバシーポリシー | 広告案内 | お問い合わせ