2030年までに企業のソフトウェアやアプリケーションの80%がマルチモーダルに
Gartnerは2025年7月2日、「2030年までに企業のソフトウェアやアプリケーションの80%がマルチモーダルになる」という予測を発表しました。
この数字は、2024年時点で10%未満とされていた現状から、大幅な転換を意味します。発表の中で、Gartnerのシニアディレクターアナリストであるロベルタ・コッツァ氏は、生成AIの進化がもたらす企業運営とイノベーションの根本的な変化について強調しました。マルチモーダル生成AIは、従来では不可能だった高度な機能をエンタープライズアプリケーションに付加し、特に医療、金融、製造などの産業に大きな影響を与えるとしています。
今回は、マルチモーダル生成AIの概要、その導入がもたらすインパクト、企業の対応戦略、そして今後の展望について取り上げたいと思います。
マルチモーダル生成AIの進化とその意味
マルチモーダル生成AIとは、テキスト、画像、動画、音声、数値データなど、複数の種類のデータを一つの生成モデルで処理・出力できる技術を指します。従来のAIは、単一のデータモダリティに特化していたのに対し、マルチモーダル生成AIはデータ間の関連性を横断的に理解し、より直感的で多様なアウトプットを可能にします。例えば、テキストから画像や動画を生成したり、音声入力からその文脈に応じたテキストや数値データのレポートを作成することが可能となります。
現在のマルチモーダル生成AIは、主に2〜3のモダリティを統合する事例が一般的ですが、今後数年でさらに多様なデータ形式を組み合わせ、より複雑かつ高度な生成が可能になるとGartnerは予測しています。この進化は、企業のソフトウェアやアプリケーションのユーザー体験を抜本的に変える力を持っています。
ビジネス分野におけるインパクトと機会
マルチモーダル生成AIの導入は、企業の業務効率化と新たな価値創出に直結します。医療分野では、患者の音声や画像データ、検査結果を統合的に解析し、診断精度の向上や治療提案の自動化を実現できます。金融分野では、音声認識を通じた顧客対応の自動化、画像解析による不正取引検知、テキストと数値データの同時処理によるレポート生成など、多面的な価値をもたらします。
製造業では、設備の映像監視データとセンサーの数値データ、作業員の報告内容を組み合わせた安全管理や品質管理の高度化が期待されています。マルチモーダル生成AIは、単なる業務支援を超え、業務の自律的最適化を可能にする基盤技術となるのです。
企業が求められる戦略的対応
Gartnerの発表では、生成AIの「Emerging Tech Impact Radar」で示されている通り、マルチモーダル生成AIは極めて高いインパクトを持つ技術の一つと位置付けられています。この技術の恩恵を最大化するためには、企業は早期に投資判断を行い、自社の業務プロセスやサービスにどのように統合するかの戦略を明確にする必要があります。
また、単なる技術導入にとどまらず、AIの透明性やガバナンス、データ品質の確保、社員のAIリテラシー向上といった基盤的な取り組みが不可欠です。多様なモダリティのデータを安全かつ効果的に取り扱う能力が、企業の競争力を左右する時代が到来していると言えるでしょう。
今後の展望
2030年に向け、マルチモーダル生成AIはさらに進化し、企業ソフトウェアのスタンダードとなる可能性があります。Gartnerが示した通り、2024年の10%未満から80%への移行は、単なる技術トレンドではなく、企業活動の根本的な変革を意味しています。これまで別々に管理・分析していたテキスト、画像、動画、音声、数値といったデータが統合され、AIがより精緻な判断や提案を行う時代が到来する可能性もあります。
また、今後はマルチモーダル生成AIが、持続可能性や社会課題の解決にも活用されることが期待されます。例えば、災害対応におけるマルチモーダルデータ解析、教育現場での多様なデータを活用した個別最適化学習、スマートシティにおける都市データ統合といった応用も進んでいく可能性があるでしょう。
出典:ガートナー 2025.7
■Emerging Tech Impact Radar: Generative AI 図表をもとに表を作成
技術名(日本語) | カテゴリ | 導入予測期間 | インパクトの大きさ | 技術解説 |
Large Action Models (大規模行動モデル) | Model Performance | 6~8年 | 高 | 複雑な行動の自動化モデル |
GraphRAG (グラフRAG) | 3~6年 | 高 | グラフ活用の生成AI検索 | |
Small Language Models (小規模言語モデル) | 3~6年 | 高 | 軽量で高速な言語モデル | |
GenAI Engineering Tools (生成AI開発ツール) |
3~6年 | 中 | 生成AI構築支援ツール | |
Sustainable AI (持続可能AI) |
6~8年 | 中 | 環境配慮型AI技術 | |
Data Center Microgrid (DCマイクログリッド) |
Data Frontier | 6~8年 | 中 | 小規模電力網によるDC運用 |
Synthetic Data (合成データ) | 3~6年 | 高 | 模擬データ生成技術 | |
AI Marketplaces (AIマーケットプレイス) | 1~3年 | 非常に高 | AIツールの取引市場 | |
GenAI-Enabled Apps (生成AI対応アプリ) | Applied GenAI | 1~3年 | 高 | 生成AI搭載のアプリケーション |
AI Code Assistants (AIコード支援ツール) | 1~3年 | 高 | コード生成支援AIツール | |
Intelligent Simulation (知能型シミュレーション) |
3~6年 | 高 | 仮想環境での予測と検証 | |
Agentic AI (エージェント型AI) | 3~6年 | 高 | 自律的なAIエージェント | |
GenAI API Extensions (生成AI API拡張) | 1~3年 | 高 | APIによる生成AI機能拡張 | |
GenAI Virtual Assistants (生成AI仮想助手) | 1~3年 | 非常に高 | 会話型AIアシスタント | |
GenAI Molecular Modeling (生成AI分子モデリング) |
1~3年 | 中 | 分子設計支援AI | |
Multimodal GenAI Models (マルチモーダル生成AIモデル) | Model-Centric Technologies | 1~3年 | 高 | 複数データ対応生成AI |
Open Language Models (オープン言語モデル) |
1~3年 | 中 | 公開型の言語AIモデル | |
Ultralong Context Window Models (超長文脈モデル) | 1~3年 | 高 | 長文対応の言語AIモデル | |
Domain-Specific Language Models (領域特化型言語モデル) | 1~3年 | 中 | 特定業種向け言語AIモデル | |
Diffusion AI Models |
1~3年 | 高 | 拡散技術応用AIモデル | |
Active Inference (アクティブ推論) | 6~8年 | 高 | 自律的推論による学習AI | |
Reasoning Models (推論型モデル) | 3~6年 | 高 | 推論能力強化AIモデル |