オルタナティブ・ブログ > Azureの鼓動 >

クラウド戦役をZガンダム視点でわかりやすく解説するブログ+時々書評。

レイ・オジーのアナリスト向け発言から読み取るAzure Storageの将来像

»

Google I/O開催中の折、BigTableやGoogle File System周辺の話に触れておきたい。
AzureのFAQのひとつに、ファイルシステムはないのですか?というものがある。
商用利用スタート時に提供が予定されているのは、RDBS互換のSQL Data Servicesと
分散Key Valueストア+バイナリ格納+Queueを3つあわせたAzure Storage Servicesの
2種類であり、これらを組み合わせればほぼすべてのストレージ要件をクラウド上に
実装することが可能である。

サービスとして提供されるアプリケーションの機能を利用するユーザーは、データの
物理的なストレージの仕組みを知る必要はないため気づかないかもしれないが、
既存のファイルシステムという仕組みに慣れ親しんだ開発者からすれば、
クラウド上にもファイルシステムに相当するような仕組みがあると
メッセージした方が安心感があるかもしれない。

ファイルシステムに関するFAQに対する優等生的回答は「ありません」「計画もお話
できる段階にありません」なのだが、先日レイ・オジーが投資家向けに語った
今後のクラウド戦略
を「おすみつき」に、その範囲で言及しておきたい。

「中の人」になって改めて痛感するのは、外で話してよいことと機密事項の境目だ。
静的に「社内秘 or not」といっていられるような内容ならよいのだが、
昨今めまぐるしく状況が動的に変わるような内容では、情報の鮮度を
意識するとその判断が難しい。勢い、キーパーソンのtwitterやブログ、
セッションでの発言に注意するという処世術に落ち着くのである。
例えばこのタイミングではKumo/Bing(Googleキーワード検索対抗でLive Searchの後継)は微妙だ。

さて、皆さんの中にはマイクロソフトの開発コードネームに詳しい方もいるかもしれないが、
COSMOSとSCOPEというコードネームを聞いたことがあるだろうか?
マイクロソフト・リサーチ(MSRと略されることが多いMSFTとは独立した法人の研究開発機関)
が発表している論文にもみられるクラウド的用途に適したファイルシステムと分散クエリ系の
仕組みについて、レイ・オジーが言及している。
(マイクロソフトのコードネームについては Mary Jo Foley氏の動画がわかりやすい)

COSMOSとSCOPEは連携して動作する想定となっており、VLDB Conference 2008で
発表したこちらの論文の記載が詳しい。Azure発表前の話である。
SCOPE: Easy and Efficient Parallel Processing of Massive Data Sets (PDF)

SCOPEはSQL拡張のスクリプト言語で、Map Reduce的に多段階集計処理を行う
ExtractorというモジュールをC#で記述することで、カスタマイズしながら
利用できる分散クエリ環境である。

Salesforceは旧来のRDBMSの枠組みの中で、Oracleのパーティショニングと
パラレルクエリを利用してスケーラビリティを確保している
(新野氏のブログ)ようだが、
SCOPEとCOSMOS、あるいはその発展版の関係はこれに近いものとなる。
どちらもクラウド世代の設計になっているので、スケーラビリティの点では
優位に立てるだろう。AzureおよびSQL Data Servicesの最初のリリースには
間に合わないと思われるが、早期に提供できることを願ってやまない。

レイ・オジーのプレゼンテーションは今後も傾聴することをお勧めする。
マイクロソフト社員が案内するのも変な話だが、Mary Jo Foley氏のブログ
All about Microsoftを購読していれば、レイ・オジーの動向を逃すことはないだろう。
英語が苦手という方は、AgileCat氏のブログもお勧めだ。しがらみがない分、早いかもしれない。
Azureの鼓動とあわせ、RSSリーダーなどでチェックするようにしていただきたい。

---

昔から思っていたことだが、なんとも紳士的な物腰や、時折見せる信念への熱い思いに、
あの風貌も相まって、どうも最近レイ・オジーがブレックス准将に見えて仕方ない。
さて、自称クワトロ大尉の私に護衛の任務がまわってくるのはいつだろうか。
みすみす暗殺させるつもりはないがダカール演説の準備をしておくべきか。

26日発売のガンダムエースでは、シャアがアクシズを離れて地球圏へ向かうシーンが
描かれている。シャアがなぜジオンを離れてエウーゴに加わることになったのか、
気になる人は要チェックだ。

Comment(2)

コメント

nsharp

> Salesforceは旧来のRDBMSの枠組みの中で、Oracleのパーティショニングと
> パラレルクエリを利用してスケーラビリティを確保している(新野氏のブログ)ようだが、
> SCOPEとCOSMOS、あるいはその発展版の関係はこれに近いものとなる。

設計変更後のSDSの方が、これに近くはないですか?

SDSのデータサイズ10GBの制約のおかげで、パーティション分割をはじめからきちんと考えないと、
すぐに規模の壁にぶつかると聞きましたが・・・。(どこでだw)

nsharpさん、コメントありがとうございます。
聞いている話では「設計変更後&V1より先で
計画されているSDSのロードマップにあるもの」が
近いと思います。Azureと同時に商用提供される
予定のV1では分散系の機能を省いているので、
Oracleのパーティショニング&パラレルクエリ
(もしかするとRACまで)と並ぶのはもう少し先かと。
RACは実績で最大60ノードくらいらしいので、
クラウド的にスケールできれば圧勝なんですけどね。
製品の進化としてはよい方向だと思うのでSDSには
期待してます。もしかするとVelocityがキャッシュとして
うまく立ち回ることですべて解決してくれるかもしれませんが…。

コメントを投稿する