オルタナティブ・ブログ > 仮想化&ストレージの基礎と最前線 >

機械学習やディープラーニングに対するストレージ課題とは?

»

12月も半ばに差し掛かり、忘年会のシーズンを迎えましたが、皆さん体調管理に気をつけてください。そういう私は、昨日腹痛で大変でした。何事も行き過ぎには注意したいものです。

今日は、最近富に話題に上がってくるAIの元になる機械学習やディープラーニングを企業で導入する際に気をつけていただきたいことをお話します。

33510f35d0ded3a9603dc0bb8be990db_s.jpg

機械学習やディープラーニングに関して企業が抱える課題を解決しよう

昨今急激にAI化が進んでいます。IoTや企業データを蓄積してビックデータの公開やAIの開発が各地で行われることが多く、今後も成長していく分野になるでしょう。例えば、スマートフォンの普及によって、数多くの方がアプリケーションなどを利用してゲームや資料作成などを行っています。スマートフォンの普及率も年々増えており、今後もよりたくさんの方がスマートフォンを持つことが考えられます。企業においても、自社サーバーを設けてシステムの運用を行っているところも少なくないでしょう。そのため、サーバーの中に顧客データを管理している企業もあります。これによって、顧客資料を自社の特定のスペースに設けて管理しなくても良くなりました。しかし、サーバーのストレージ機能に不満や課題を抱いている方もいるのではないでしょうか。

ストレージとはデータを記録する部分の重要な機器になります。ただ単にデータを保存したり削除したりするだけでなく、保存したデータを蓄積して、それを分析することで意思決定の助けにしようという動きがあります。データ分析を行うことで、企業は勘や憶測などの不明瞭な判断ではなく、大量のデータをディープラーニングすることで具体的な知見を得られるようになり、意思決定も素早くかつ明瞭に行うことができるのです。

ただ、企業はデータを長年オンラインで保存するということをあまりしておらず、ある程度古いデータはテープなどにアーカイブして、決められた年数補完したのち廃棄するようなデータのライフサイクルを設定していることが多くありました。それが近年ビッグデータを活用する動きが出てきたことで、データのライフサイクルを見直すとともに、長期でオンライン保存ができるストレージの検討も必要になってきました。もし、いままで使っていたストレージをそのまま長期にわたるデータ保存に流用するとなると、常にリソース状況を把握していなければ、リソース不足に陥る可能性があります。リソースが不足すれば、当然データを保存することができません。リソースの使用状況を把握していなければデータを保管することができず、一時的に業務が止まってしまう可能性があります。また、長期保存に必要なストレージ要件として、容量単価ということが重要視されます。ある程度パフォーマンスは犠牲にしても、できるだけ安価に大量のデータを蓄積できるストレージが必要となるわけです。

ディープラーニングのサーバー課題は?

そして、蓄積したデータを機械学習やディープラーニングを行う際には、サーバーからパフォーマンスを得ることができるかが重要な課題になります。企業のサーバーは数多くの要求を処理するため、リソース状況に関して定期的に監視を行うことが求められます。データの分析を頻繁に行うようであれば専用のサーバーを用意することで、パフォーマンスを的確に与えることができますが、分析作業が要求に合わせた単発のジョブだとすれば、専用サーバーよりも、仮想化して物理サーバーのリソースをシェアするほうが理想的です。

機械学習やディープラーニングを仮想化インフラで実行する際に気をつけなければならないことは、ビッグデータの分析を行うワークロードによって、他のワークロードへのパフォーマンスに影響が出ないようにすることです。分析に負荷がかかりすぎると、他の業務で動いている仮想サーバーのパフォーマンスに影響が及ぶ可能性があり、データの取得やアプリケーションの立ち上げの速度が遅くなってしまうため、効率的に業務を遂行することができなくなってしまいます。例えば、パフォーマンスの低下に関しては重たい作業をする時や重たいアプリケーションを立ち上げることになります。企業のサーバーにおいては数多くのアプリケーションが混在するため、サーバー上で動いているプロセスの数に関しても多くなります。もしデータ分析に長けているストレージ機能が搭載されていなければ、パフォーマンスの低下に関して運営者は把握することが難しくなります。これによって一時的に業務がストップし、何故パフォーマンスが低下しているのかという原因追究が必要になります。もしデータ分析に適したスループットの高いストレージを用意すればある程度パフォーマンスの影響は防げるかもしれません。また、多数の仮想サーバーが混在するような環境であっても、個々のワークロードがどのように動いているのかを把握できるシステムやストレージを利用すれば、万が一パフォーマンスが低下しても原因を追究する手間なども削減することができるでしょう。もし現在お使いのストレージでは上記の懸念をクリアできないようであれば、データ分析に向いたストレージを個別に用意するか、日々のワークロードを細かく把握できるストレージに変更されてみてはいかがでしょうか。

データ分析に長けているストレージ機能を導入しよう

ストレージは、それぞれニーズにあったものを選ぶべきですが、あまりに種類が多すぎて、機械学習やディープラーニングをこなすためのストレージとして何を選べばよいか迷ってしまうかもしれません。導入を検討されている方の中には、どのような製品を選べばデータ分析に長けている機能を導入できるのか、また、安心して利用できるのかわからないという方も少なくないでしょう。複数のストレージを提案してくれるような販売店であれば、これまでの導入で活かされたノウハウを元に適したストレージを紹介してくれるでしょう。そして、選び方のコツとして、デモやテスト導入などを利用する案があります。

デモ依頼は、業者によってはWebからも受け付けてくれます。デモを見ることで、どれだけニーズを汲み取ってくれるかを確認できます。また、安心してストレージを利用したい場合は、そのストレージの導入実績を確認されてみてはいかがでしょうか。実績が多ければ利用した企業が多くいるため安心して利用することができるでしょう。

Comment(0)