【図解】コレ1枚でわかる基盤モデルとLLM・SLMの関係
生成AIに関連し、「基盤モデル」や「LLM」、そして最近では、「SLM」といった言葉を目にするようになりました。これらはすべて生成AIを支える重要な概念ですが、それぞれの関係性を整理しておくと、その全体像がぐっと掴みやすくなります。
まず、すべての土台となるのが「基盤モデル(Foundation Model)」です。従来のAIは、「猫の画像を判定する」「英語を日本語に翻訳する」といった特定の目的のために、専用のデータを与えてゼロから学習させていました。しかし基盤モデルは、インターネット上の膨大で多様なデータ(テキスト、画像、音声など)をあらかじめ大量に読み込ませておくことで、幅広い知識や法則性を獲得した「汎用的なAIの土台」です。この強力な土台に、後から少しの追加学習(ファインチューニング)を施すだけで、文章作成、要約、プログラミング、画像生成など、多種多様なタスクをこなせるようになります。家づくりに例えるなら、どんな家を建てるにも使える、極めて頑丈で広大な「基礎・土台」が基盤モデルです。
次に「LLM(Large Language Model:大規模言語モデル)」です。LLMは、基盤モデルの中でも特に「言語(テキスト)」の処理に特化し、その規模を極限まで大きくしたものを指します。何千億、何兆という「パラメータ(AIの脳の神経網の数)」を持ち、スーパーコンピュータを使って途方もない量のテキストデータを学習させています。ChatGPTなどを動かしているのはこのLLMであり、まるで人間のように自然な文章を生成したり、複雑な推論を行ったりできる「万能な天才」と言えます。
しかし、LLMはその巨大さゆえに弱点もあります。動かすために莫大な計算資源(クラウドサーバーなど)が必要で、維持コストや消費電力が跳ね上がり、応答に時間がかかることです。
そこで、LLMの課題を解決するために登場したのが「SLM(Small Language Model:小型言語モデル)」です。SLMは、LLMと同じ言語モデルでありながら、パラメータ数や学習データをあえて絞り込み、サイズを小さくしたものです。何でも知っている万能さはLLMに譲りますが、医療用語や社内規定、特定の業務プロセスなど、特定の分野に絞って追加学習させることで、その領域においてはLLMに匹敵する精度を発揮します。いわば、特定の業務に特化した「小回りの利く専門家」です。軽量であるため、スマートフォンやPCなどの端末(エッジ)上で直接動かす「エッジAI」として活用でき、低遅延、低コスト、高セキュリティを実現します。
まとめると、広大なAIの世界の基礎となるのが「基盤モデル」であり、その言語分野において、圧倒的なパワーで複雑な課題を解決する「LLM」と、特定の業務を軽快かつ安全に処理する「SLM」が存在する、という関係性になります。これからのビジネスでは、これらを「適材適所」で使い分けることが成功の鍵となるでしょう。
今、「AIをどう使うか」という段階は終わり、「AIと共にどう変わるか」が問われる時代へと、世の中は大きく変わりつつあります。変化はAIだけではありません。ITの潮流もまた、「レガシーIT」から「モダンIT」へと構造的な転換期を迎えています。
営業職であれエンジニア職であれ、新入社員や若手がこの「現実」を知らないまま現場に出ればどうなるでしょうか。お客様との会話は噛み合わず、信頼を得ることは難しいでしょう。その結果、せっかくの才能を持ちながら、仕事への自信を失ってしまうことになりかねません。
そのような不幸なミスマッチを少しでも減らしたい!この研修は、そんな想いから始まりました。
今年で10年目を迎えますが、これまでの経験を土台に、変化の速いIT常識の全体像を、基礎・基本やビジネスとの関連性とともに分かりやすく紐解きます。さらに、ITプロフェッショナルとしてどう役割を果たし、どう学び続けるべきか、AI時代に即した「すぐに使える実践ノウハウ」も解説します。
お客様の言葉が理解できる。社内の議論についていける。そして何より、仕事が楽しくなる。そんな「確かな自信」を、本研修を通じて手にしていただければと願っています。
>> 詳しくはこちら
新入社員のための1日研修 「最新のITトレンド」
新入社員のための1日研修 「IT営業のプロセスと実践スキル」
IT営業の役割や仕事の進め方を学び、磨くべきスキルを考えます。また、AIを武器に、先輩にも負けない営業力を磨く方法についても解説します。
