AIは使ってもらうのが9割~第2回 機械学習に必ずしもビッグデータは要らないが・・・
ITに強いビジネスライター 森川ミユキです。
AIは使ってもらってなんぼというテーマで連載させていただいております。
前回は、DXのとっかかりとして手軽なテーマがいいという話をしました。そして具体的なテーマとして、書類の転記作業の自動化を取り上げたのでした。今回はその続きで、そのためにはどういう学習データが必要かについてお話しします。
機械学習だからビッグデータが必要とは限らない
ということで(前回参照)「金融機関が作成した書類をお役所向けに書き直す業務」(以下、「転記業務」と呼びます)を機械学習モデルで半自動化するというプロジェクトが発足しました。
「半」というのは、お役所に送る前に人間のチェックが必要だからです。機械学習で100%の精度というのはまずあり得ません。そんな業務ならルールベースでプログラム化できるはずです。また内容によってもちろん違いますが、たとえば精度を95%に上げるのと、そこから1%上げるのとで同じぐらいコストが掛かるなんてこともザラにあります。費用対効果を考えると90%ぐらいの精度が最適(※)だったりすることもあります。
さて機械学習というとビッグデータが必要と思う人もいるかもしれません。ビッグデータの定義も曖昧で、何件からがビッグデータなんて明確な基準はありませんが、今どきの感覚で言えば、「ギガバイト単位ではスマホのパケット量。そんなのビッグデータとは言いがたい。せめてテラバイトはほしい」という感じでしょうか。
しかし転記業務用のモデルを作成するのにビッグデータなんて要りません。実際に開発した人の話によれば1,000件もあれば、業務に使える程度の精度は達成できるんだそうです。
と聞くとけっこう簡単に機械学習ってできるんだなと思うかもしれませんが、そうとも限らないようです。
次回に続きます(掲載後、「次回」にリンクを貼ります)。
※:需要予測などはもっと低いと思います。思うというのは、ググったけど公表している数値が見当たらなかったからです(あったらご教示を!)。でも大切なことは需要予測の精度を上げることではなく、本来の目的である在庫の最適化やコスト削減が達成されることです。お金をかけて需要予測の精度を上げても、それが大して成果に結びつかないのであれば本末転倒です。逆に1%でも向上すれば、それに掛ける費用より効果があるのならやるべきです。こんなことはあたりまえの投資判断と思うでしょうが、ことDXの現場ではそういう本末転倒なことが繰り広げられやすいらしいです。
最新のIT動向やITのビジネスへの応用について、経営者などビジネスパーソンに分かりやすく伝えることができるライターです。経営レベルでのIT活用について書ける数少ないライターの一人とお客様から評価されています。
最近注力しているテーマは、下記の通りです。
- データ活用(データドリブン、DX等)
※JDLA Deep Learning for GENERAL 2019#2取得しました - マーケティング全般(ブランディング含む)
特にデジタルマーケティングに関しては、新旧のマーケティング理論はもちろん、周辺ビジネス理論(デザイン思考、ジョブ理論等)やIT導入・運用方法論(プロトタイピング、アジャイル開発、DevOps等)を含めた深いコミュニケーションが可能です。
クラウド、データ活用基盤などITインフラ関連も得意としています。
▼お仕事のお問い合わせはこちらへ