オルタナティブ・ブログ > 生涯ITエンジニアでいこう。 >

どんどん出てくるIT業界の新トレンドを乗りこなし末長くエンジニアをやっていきましょう。

次世代AIエージェントを読み解く「5つの必須用語」:単なるチャットボットから自律的な実行者へ

»

イントロダクション:AIは「会話」から「実行」のフェーズへ

現在のAIは、単なる「会話のパートナー」から、自律的にタスクを完結させる「エージェント」へと劇的な進化を遂げています。「AIは結局、高度なチャットボットに過ぎないのではないか?」という疑問を持つ方もいるかもしれませんが、その境界線は「指示レイヤー(Instruction Layer)」の存在にあります。

大規模言語モデル(LLM)がいわば「エンジン」であるとするならば、指示レイヤーはそのエンジンを制御し、目的地へと導く「ドライバー」です。このレイヤーがモデルを包み込むことで、AIは計画を立て、コードを書き、最小限の人間による介入で複雑なタスクを実行する能力、すなわち「エージェント機能」を獲得します。

この変革の裏側では、エージェントの振る舞い、外部との接続、そして協調を支える技術の標準化が急速に進んでいます。本記事では、次世代のAIエージェントを理解する上で避けて通れない5つの必須用語を解説します。

1. agents.md -- エージェントのための「取扱説明書」

人間が新しいプロジェクトに参加する際、まず「Readme」を読んでルールを把握するように、エージェントにもプロジェクト固有の指針を与える仕組みが必要です。それが「agents.md(AGENTS.md)」です。

これはプロジェクトのルートディレクトリに配置されるMarkdown形式のテキストファイルであり、エージェントがその環境で作業を開始する際に真っ先に参照する「指示書」として機能します。ここには、テストの実行コマンドやコーディング規約、あるいはプルリクエストの命名規則といった、そのプロジェクトならではの作法が記されています。

「エージェントが特定のプロジェクトで作業を開始するたびに読み込まれる、エージェント専用のReadmeファイルのようなものだ。」

この仕組みの特筆すべき点は、ディレクトリ構造に応じた「ネスト(階層化)」が可能なことです。サブディレクトリに別のファイルを置くことで、特定のサブプロジェクト専用のルールを上書き(オーバーライド)し、より詳細な指示を与えることができます。

当初はOpenAIによって提唱された概念で、すでにGitHub Copilot、Cursor、Devin、Gemini CLI、VS Codeなど6万件を超えるオープンソースプロジェクト・フレームワークで採用が進んでいます。2025年12月には、後述するMCPとともにLinux Foundation傘下の新団体「Agentic AI Foundation(AAIF)」に寄贈され、業界標準としての道を歩み始めました。なお、Anthropicの「CLAUDE.md」のように、ツールによって名称が異なる場合もありますが、AGENTS.mdへの収斂(対応ツールの多くがAGENTS.mdも併せてサポートする流れ)も進んでおり、今後は名称面でも統一が進む可能性があります。

2. エージェント・スキル(Agent Skills) -- コンテキストを節約する知恵

エージェントには、プロジェクト固有のルールの他に、特定のタスクを遂行するための汎用的な「技術」が必要です。しかし、あらゆる知識を常にエージェントに読み込ませることは、AIの「コンテキストウィンドウ(一度に処理できる情報量)」を無駄に消費し、処理精度の低下を招きます。

そこで活用されるのが「エージェント・スキル(Agent Skill)」です。これは、特定の作業に必要なスクリプトやリソース、そしてその使い道を記したskill.mdを一つのフォルダにまとめたものです。

この仕組みの最大のメリットは、いわば**「ジャストインタイム(JIT)な学習」**を実現できる点にあります。skill.md内のメタデータに「ユーザーがPowerPoint作成を求めた時に呼び出す」といった条件を記述しておくことで、エージェントは必要になった瞬間だけそのスキルをロードします。

不要な知識による「コンテキストの汚染」を防ぎ、情報の過密から生じるハルシネーション(誤情報)を抑えつつ、必要な時にだけ特定の能力を拡張する。この効率的なリソース管理こそが、エージェントの処理速度と正確性を支える知恵なのです。

3. MCP (Model Context Protocol) -- 接続の標準化

エージェントが真の価値を発揮するには、外部のAPIやデータベース、SaaSとの連携が欠かせません。しかし、接続先ごとにカスタムコネクタを開発していては、エコシステムは分断され、開発コストは膨大になります。

この課題に対し、2024年11月にAnthropicが提唱したオープン標準が「MCP(Model Context Protocol)」です。1年ほどで業界標準としての地位を確立し、2025年12月にはAnthropicの手によって、前述のagents.md、Blockの「goose」とともにAAIF(Linux Foundation)へ寄贈されました。つまりagents.mdとMCPは、同じAAIFという傘の下に集った"兄弟プロジェクト"であり、エージェントの「内部の振る舞い」と「外部との接続」という異なるレイヤーの標準化が、同じ団体のもとで足並みを揃えて進んでいることを象徴しています。

MCPの核となるのは「MCPサーバー」という存在です。このサーバーがいわば**「ユニバーサル・トランスレーター(万能翻訳機)」**として機能し、NotionやStripeといった外部ツールの複雑なAPIを標準的なインターフェースで包み込みます。MCPを解釈できるエージェントであれば、背後にあるツールの個別仕様を意識することなく、一つの共通言語でデータ取得や操作が可能になるのです。

4. A2A (Agent to Agent) -- エージェント同士の「名刺交換」と協調

複雑な業務においては、一つのエージェントですべてを完結させるのではなく、専門性の異なる複数のエージェントを連携させる必要があります。そこでGoogleが2025年4月に提唱し、同年6月にLinux Foundation傘下へ移管されたのが、エージェント間通信プロトコル「A2A(Agent to Agent)」です。

なお、A2AはagentsMDやMCPと同じ「AAIF」の一員ではなく、AWSやCisco、Microsoft、Salesforceなどが技術運営委員会に名を連ねる「Agent2Agentプロジェクト」として、Linux Foundation傘下の別枠で運営されています。呼び方は似ていますが、governance(管理団体)としては別組織である点に注意が必要です。

A2Aの鍵を握るのが「エージェント・カード(Agent Card)」という概念です。これは各エージェントの専門領域や通信方法を記した、デジタルな「名刺」のようなものです。

例えば、ベンダー交渉を担う「調達エージェント」が、支払いの承認を得るために「財務エージェント」へ依頼を出すケースを考えてみましょう。調達エージェントは財務エージェントの「エージェント・カード」を読み取ることで、相手の役割を正しく理解し、カスタム統合を介さずとも自律的に仕事を委譲できます。これにより、エージェント同士が即座にチームを組むことが可能になります。

5. サブエージェント(Subagents) -- 限界を超える並行処理

膨大なタスクを処理する際、一つのエージェントではコンテキストウィンドウが溢れるか、あるいは処理時間がかかりすぎるという壁に直面します。この限界を突破するための設計パターンが「サブエージェント(Subagents)」です。

メインの親エージェントは、必要に応じて特定の作業に特化した子エージェントを生成(スポーン)します。このアプローチには、技術的に大きな利点が二つあります。

  • 「Embarrassingly Parallel(驚異的な並行性)」の実現:例えば、20個の独立したチェック項目がある場合、20のサブエージェントを同時に生成して実行することで、処理スピードを劇的に向上させます。
  • 「Fresh Context Window(クリーンな環境)」の維持:数千のファイルを読み込むような重いタスクでも、サブエージェントが個別の新鮮なコンテキストウィンドウで作業を行い、その要約だけを親に返すことで、親エージェントの思考環境をクリーンに保つことができます。

他の4項目が業界団体による「標準規格」であるのに対し、サブエージェントは特定の団体に管理されているわけではなく、現代のシステムにおいて最も信頼されている「設計パターン」であるという点が特徴的です。

5つの用語 早見表

用語 提唱した組織 現在の管理団体 解決する課題 位置づけ
agents.md OpenAI AAIF(Linux Foundation) プロジェクト固有のルールをエージェントに伝える 内部的な振る舞い
エージェント・スキル Anthropic(Claude Skills 等) 特定の管理団体なし(設計パターン/機能) 必要な知識だけを必要な時にロードする 内部的な振る舞い
MCP Anthropic AAIF(Linux Foundation) 外部API・データソースとの接続を標準化する 外部との接続
A2A Google Agent2Agentプロジェクト(Linux Foundation、AAIFとは別枠) エージェント同士が役割を認識し協調する 他者との協力
サブエージェント 特定の提唱組織なし なし(設計パターン) コンテキストの限界を並行処理で突破する 大規模な並行処理

こうして並べると、agents.mdとMCPは同じAAIFという傘のもとで「内部の振る舞い」と「外部接続」を分担し、A2Aはあえて別組織のまま「エージェント間協調」という異なるレイヤーを担っていることが見えてきます。一方でエージェント・スキルとサブエージェントは、特定の団体による標準化の対象ではなく、実装レベルの工夫・設計パターンとして広まっている点も対照的です。

結論:エージェントが変える仕事の未来

今回紹介した5つの用語は、AIエージェントの「内部的な振る舞い(agents.md/Skills)」、「外部との接続(MCP)」、「他者との協力(A2A)」、そして「大規模な並行処理(Subagents)」という、エージェントの根幹をなす要素を整理したものです。

これまで人間が泥臭く行ってきた「ツールの操作」や「担当者間の調整」は、これらの標準化されたプロトコルを通じて、エージェントの手へと移りつつあります。

これらの標準化が進み、エージェントがインフラの一部となった先、あなたの業務のどの部分が最初のエージェント・ワークフローに置き換わるでしょうか?今こそ、AIを単なる話し相手ではなく、頼もしい自律的な実行者として再定義する時です。

Comment(0)