« 2010年1月31日

2010年2月1日の投稿

2010年2月2日 »

当ブログの読者の方は、社内のデータを集計して報告書を作成するような機会が多いのではないでしょうか。

今さら言うまでもなく、MS Excelはちょっとした集計や分析に使えるソフトウェアです。関数を駆使すれば、他のシートにあるデータと結合するなどの複雑な処理まで可能です。たしかにExcelは手軽に使える便利なソフトウェアですが、だからと言って全てをExcelで処理することは無理があります。

例えば、数百万件単位のデータを、並べ替えたり集計したりしなければいけなくなったとします。データファイルが1つならまだしも、他のデータと結合しなければならないとしたら、Excelでは無理でしょう。さらに、一発で答えが見つからずに、条件を変えて何度も試行錯誤しなければならないとしたら、Excelでは徹夜必須です。

こんな時は、餅は餅屋、道具は適材適所です。横浜にある株式会社ターボデータラボラトリーが販売しているインメモリデータ処理ソフトウェア「Aktblitzシリーズ」がお奨めです。

例題として、自動車の販売データを考えます。販売履歴のデータが、以下のような並びのCSV形式のファイルになっているとします。

販売日

販売年

セールスマンID

商品ID

2000/9/1

2000

セールスマンID-0139

車ID-001

2000/9/1

2000

セールスマンID-0149

車ID-001

2000/9/1

2000

セールスマンID-0363

車ID-001

2000/9/1

2000

セールスマンID-0692

車ID-001

データの項目数はわずか4つです。Excelでも全く問題ありません。では、このデータが200万件あったらどうでしょうか。実際にやってみました。

今回の実験に使ったのは、CPUがPentium 4、メモリは2Gバイト、Windows XPのパソコンです。数年前の旧式なスペックです。

販売履歴.csvファイルのサイズは、83.9 MB (88,000,039 バイト)になります。

200万行のテキストファイルをWindows付属の「メモ帳」で開いたら、読み終わるまで1分弱かかりました。また、テキストエディタの定番「秀丸エディタ」では7秒かかりました。この行数になると、開くだけでそこそこ時間がかかります。

次に同じファイルをExcel 2007で開いてみました。

Excel 2007はExcelの弱点であった最大行数65,000行の制限がなくなりました。と言っても無制限になったわけではなく、1分くらいかけて、1,048,575行まで読み込んだところで止まってしまいました。この辺がExcel 2007の限界のようです。

1

200万件で試すことができないため、約半分になりますが、1,048,575行のデータで並べ替えを行いました。「商品ID」をキーにして全体を並べ替える操作です。これには25秒かかりました。

200万件のデータを扱えないのでは、Excelは使えません。仮に200万件のデータを読めたとしても、100万件のデータを読むのに1分、並べ替える度に25秒では、待ち時間が長くストレスが溜まります。

これをAktblitzでやったらどうなるでしょうか。

AktblitzのユーザインタフェースはExcelに似た表形式です。CSVファイルを指定すると、Excel同様に区切り文字や項目のデータ型を指定する画面から始まります。最後の読み込み実行をクリックしてから終了するまで、わずか7秒でした。200万件をしっかり最後まで読んでいます。秀丸エディタ並の速さです。

2

「商品ID」をキーにした全体の並べ替えは、なんと1秒以下です。画面の左下に表示される処理時間の値はわずか47ms、1000分の47秒しかかかっていません。

3

この超高速ぶりには、ちゃんと理由があります。Aktblitzではターボデータラボラトリーが開発したLFM(Linear Filtering Method) 技法が使われています。データをジョイン・データ変換・集計などの基本的なデータ処理に適した全く別の形式に変換した上で処理を行います。そのため、超高速な処理が可能になりました。

今回はCSVデータの読み込みと単純な並べ替えの説明でした。これはAktblitz優れた機能のほんの手始めにすぎません。不定期連載になりますが、Aktblitzでどんなことができるかを、これからご紹介していきたいと思っています。

関連エントリ

【広告】

「Aktblitz」のお問い合わせ・デモのご依頼は、株式会社テクネコで承ります。以下のリンクからお気軽にお問い合わせください。

テクネコ

« 2010年1月31日

2010年2月1日の投稿

2010年2月2日 »

» このブログのTOP

» オルタナティブ・ブログTOP



プロフィール

加藤和幸

加藤和幸

株式会社テクネコ 代表取締役。
ITを売る側と買う側の両方の経験を活かして、CRMとCMSのコンサルティングを中心に、お客様の”困った”を解決します。

詳しいプロフィール

Special

- PR -
カレンダー
2013年5月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  
techneco
Special オルタナトーク

仕事が嫌になった時、どう立ち直ったのですか?

カテゴリー
エンタープライズ・ピックアップ

news094.gif 顧客に“ワォ!”という体験を提供――ザッポスに学ぶ企業文化の確立
単に商品を届けるだけでなく、サービスを通じて“ワォ!”という驚きの体験を届けることを目指している。ザッポスのWebサイトには、顧客からの感謝と賞賛があふれており、きわめて高い顧客満足を実現している。(12/17)

news094.gif ちょっとした対話が成長を助ける――上司と部下が話すとき互いに学び合う
上司や先輩の背中を見て、仕事を学べ――。このように言う人がいるが、実際どのようにして学べばいいのだろうか。よく分からない人に、3つの事例を紹介しよう。(12/11)

news094.gif 悩んだときの、自己啓発書の触れ方
「自己啓発書は説教臭いから嫌い」という人もいるだろう。でも読めば元気になる本もあるので、一方的に否定するのはもったいない。今回は、悩んだときの自己啓発書の読み方を紹介しよう。(12/5)

news094.gif 考えるべきは得意なものは何かではなく、お客さまが高く評価するものは何か
自社製品と競合製品を比べた場合、自社製品が選ばれるのは価格や機能が主ではない。いかに顧客の価値を向上させることができるかが重要なポイントになる。(11/21)

news094.gif なんて素敵にフェイスブック
夏から秋にかけて行った「誠 ビジネスショートショート大賞」。吉岡編集長賞を受賞した作品が、山口陽平(応募時ペンネーム:修治)さんの「なんて素敵にフェイスブック」です。平安時代、塀に文章を書くことで交流していた貴族。「塀(へい)に嘯(うそぶ)く」ところから、それを「フェイスブック」と呼んだとか。(11/16)

news094.gif 部下を叱る2つのポイント
叱るのは難しい。上司だって人間だ、言いづらいことを言うのには勇気がいるもの。役割だと割り切り、叱ってはみたものの、部下がむっとしたら自分も嫌な気分になる。そんな時に気をつけたいポイントが2つある。(11/14)

news094.gif 第6回 幸せの創造こそ、ビジネスの使命
会社は何のために存在するのでしょうか。私の考えはシンプルです。人間のすべての営みは、幸せになるためのものです――。2012年11月発売予定の斉藤徹氏の新著「BE ソーシャル!」から、「はじめに」および、第1章「そして世界は透明になった」を6回に分けてお送りする。(11/8)

オルタナティブ・ブログは、専門スタッフにより、企画・構成されています。入力頂いた内容は、アイティメディアの他、オルタナティブ・ブログ、及び本記事執筆会社に提供されます。


サイトマップ | 利用規約 | プライバシーポリシー | 広告案内 | お問い合わせ