「基盤モデル(Foundation Model)」とは、機械学習によって作られるモデルのひとつです。「大量で多様なデータを用いて学習され、様々なタスクに適応できる大規模モデル」という特徴を持っています。
機械学習とは、大量のデータに内在する規則や法則、あるいは、特長の組合せを見つける計算です。この計算によって見つけられた「規則や法則/特長の組合せ」が、「モデル(学習済モデル)となります。
例えば、「癌の病変が写っている胸部レントゲン写真」の画像データを機械学習のプログラムに大量に入力します。その結果として、癌の病変が写っている胸部レントゲン写真の「規則や法則/特長の組合せ」を、計算によって求めます。これが、機械学習における「学習」プロセスです。そして、その結果作られるのが、「癌の病変が写っている胸部レントゲン写真」のモデルとなります。
ここに「癌の病変が写っているかどうか分からない胸部レントゲン写真」の画像データを用意します。そして、学習によって作られた「癌の病変がある場合の規則や法則/特長の組合せ」であるモデルと照合します。そして、入力した画像データとモデルの一致度を計算し、確率的に有意であれば、「癌の病変がある」とします。これが、「推論」プロセスです。
機械学習とは、この「学習」と「推論」の2つのプロセスによって構成されています。
さて、従来の機械学習では、上記の例のように「レントゲン写真に癌の病変が写っているかどうかを推論する」という個別のタスクのために、大量の画像データを用意し、膨大な計算を行うことで、モデルを個別に生成します。
これに対して、「基盤モデル」と呼ばれるモデルは、個別のタスクに特化したデータではなく、様々な種類のデータ、例えば、テキストや画像、音声、構造化データなどをまとめて学習して作られます。その結果、それらデータの相互の関連性についても「規則や法則/特長の組合せ」が、モデルに反映されます。
このモデルに対して、特定のタスクをこなすために必要な小規模なデータを与え、追加学習(転移学習)することで、新しいタスクに適応(Adaptation)できるようになります。
このように、様々なタスクに適応できる基盤となるモデルであることから、「基盤モデル」と呼ばれています。
例えて言えば、「普通自動車の運転ができるようになれば、わずかな追加練習で、バスやトラックが運転できるようになる」ことと似ているかもしれません。
但し、実効性のある「基盤モデル」を実現するには、膨大な量のデータを入力して学習させなくてはなりません。その計算量は膨大で、かつては、実現できませんでした。しかし、昨今この状況が大きく変わりました。例えば、次のようなことです。
- コンピュータハードウェアの改善、例えば、GPUのスループットとメモリは過去4年間で10倍になったこと
- ハードウェアの並列性を活用して以前よりはるかに表現力の高いモデルを学習するTransformer(文章に含まれる単語のように、 連続したデータの関係を追跡することによって、文脈ひいては意味を見つけることができる機械学習の方法)モデルが開発されたこと
- インターネットの普及やデジタル化の拡大により、学習データの大量入手が容易になったこと
GoogleのBART、PaLM、OpenAIのGTP-3などが、基盤モデルです。最近話題になっている、入力した文章から画像を生成するDALL-E2、Midjourney、Stability Diffusion、自然な文章で質問すると、流暢な文章で答えを返してくれるChat GTPなどのGenerative AI(生成AI)もまた、この基盤モデルを応用したものです。
AIの適用範囲は、急速に拡大しつつあります。ただ、「個別タスクごとの大量データ、大量計算」が、さらなる適応の足かせのひとつなっていました。基盤モデルの登場は、この足かせを取り除くことになるのかも知れません。
DX疲れにうんざりしている。Web3の胡散臭さが鼻につく。
このような方もいらっしゃるかもしれませんね。では、伺いたいのですが、次の3つの問いに、あなたならどのように答えますか。
- DXとはこれまでのIT化/コンピューター化/デジタル化と何が違うのでしょうか。
- デジタル化やDXに使われる「デジタル」とは、ビジネスにとって、どのような役割を果たし、いかなる価値を生みだすのでしょうか。
- Web3の金融サービス(DeFi)で取引される金額はおよそ10兆円、国家が通貨として発行していないデジタル通貨は500兆円にも達し、日本のGDPと同じくらいの規模にまで膨らんでいます。なぜ、このような急激な変化が起きているのでしょうか。
言葉の背景にある現実や本質、ビジネスとの関係を理解しないままに、言葉だけで議論しようとするから、うんざりしたり、胡散臭く感じたりするのかもしれせん。
ITに関わり、ビジネスに活かしていこうというのなら、このようなことでは、困ってしまいます。
ITソリューション塾は、ITの最新トレンドを体系的に分かりやすくお伝えすることに留まらず、その背景や本質、ビジネスとの関係をわかりやすく解説し、どのように実践につなげればいいのかを考えます。
- SI事業者/ITベンダー企業にお勤めの皆さん
- ユーザー企業でIT活用やデジタル戦略に関わる皆さん
- デジタルを武器に事業の改革や新規開発に取り組もうとされている皆さん
- IT業界以外から、SI事業者/ITベンダー企業に転職された皆さん
- デジタル人材/DX人材の育成に関わられる皆さん
そんな皆さんには、きっとお役に立つはずです。
- 期間:2023年2月16日(木)〜最終回4月26日(水) 全10回+特別補講
- 時間:毎週(原則水曜日) 18:30-20:30 の2時間
- 方法:オンライン(Zoom)
- 費用:90,000円(税込み 99,000円)
- 内容:
- デジタル・トランスフォーメーションの本質と「共創」戦略
- ソフトウェア化するインフラとクラウド・コンピューティング
- DXの基盤となるIoT(モノのインターネット)と5G
- データを価値に変えるAI(人工知能)とデータサイエンス
- おさえておきたい注目のテクノロジー
- 加速するビジネス・スピードに対処する開発と運用
- デジタル・サービス提供の実践
- クラウド/DevOps戦略の実践
- 経営のためのセキュリティの基礎と本質
- 総括・これからのITビジネス戦略
- 特別補講 *選任中*
詳しくは、こちらをご覧下さい。