オルタナティブ・ブログ > 生涯ITエンジニアでいこう。 >

どんどん出てくるIT業界の新トレンドを乗りこなし末長くエンジニアをやっていきましょう。

AIに「手順書」を持たせる魔法のファイル,『AI Agent Skills』――なぜ今新しい標準になりつつあるのか?

»

1. 導入:AIは"物知り博士"なのに、なぜ仕事を任せられないのか

生成AIを使っていて、こんなモヤモヤを感じたことはないでしょうか。

「知識は豊富なんだけど、いざ業務を任せようとすると、途端に頼りなくなる」

LLMは、Kubernetesのアーキテクチャ、SQLの歴史、さらには「荷物を運ばないツバメの飛行速度(アフリカ産かヨーロッパ産かを問わず!)」といった雑学にまで、驚くほど詳しい。

ところが――

「コンプライアンスを遵守した財務レポートを、47のステップで作成してほしい」

こう頼んだ瞬間、急に挙動が怪しくなる。

このギャップの正体は、「手続き的知識(Procedural Knowledge)」の欠如です。

料理で例えるなら、こうなります。

  • 食材の栄養価は全部言える ── でもレシピ通りに作れない
  • 包丁の歴史は語れる ── でも魚はさばけない

これまでの解決策は、毎回プロンプトで全ステップを指示するか、AIの"推論という名の推測"に任せるか、の二択でした。

ここに登場したのが、**「AI Agent Skills」**という考え方です。

整理するとこうなります。

  • RAG → 「知識」を与える(事実)
  • MCP → 「到達手段」を提供する(ツール)
  • Skills → 「手順」を授ける(いつ、どう使うか)

この3つがそろって、初めてAIは"仕事のできる存在"になるのです。


2. 正体は拍子抜けするほどシンプル――たった一枚のMarkdownファイル

AIスキルの実体を聞いて、最初は驚きました。

一つのフォルダと、その中の skill.md というMarkdownファイル。それだけです。

ファイル冒頭のYAMLフロントマターには、こう書きます。

  • Name / Description(必須):スキルの名前と、何をする・いつ使うかの説明
  • Author / Version(任意):作成者やバージョン

特に Description が肝心です。これが、AIが「今このスキルを使うべきか?」を判断するトリガー条件になります。

なぜMarkdownなのか?

答えは単純で――

  • 人間がプロセスを書きやすい
  • AIが意図を正確に解釈できる
  • プレーンテキストだからGitで管理できる

出典資料には、こう書かれています。

スキルとは、エージェントに手続き的知識を追加する方法であり、その形式はほとんど滑稽なほどシンプルです。それは単にフォルダ内のskill.mdファイル、つまりMarkdownファイルに過ぎません。

複雑なコードでもAPIでもなく、Markdown一枚。

この"シンプルさ"こそが、標準として広がっていく原動力になっています。


3. コンテキスト枯渇を避ける知恵――「段階的開示」という設計思想

さて、現実的な問題があります。

AIエージェントに数百のスキルを持たせたとして、起動時に全部読み込ませたら?

――コンテキストウィンドウが一瞬でパンクします。

これを解決するのが、Progressive Disclosure(段階的開示) という仕組みです。

ティア1:メタデータだけ(起動時)

名前と説明だけロード。100個あっても消費トークンはごく僅か。いわば**「スキルの目次」**を手元に置いている状態です。

ティア2:本文の展開(マッチング時)

ユーザーのリクエストに対し、LLM自身が「これが必要だ」と判断した瞬間、skill.mdの本文全体が読み込まれます。

キーワードマッチではなく、AIの推論による動的な選択。ここが賢い。

ティア3:リソース読み込み(実行時)

実際に動かす段階で、必要なものだけ呼び出します。

  • scripts:Python、JavaScript、Bashなどの実行コード
  • references:補足ドキュメント
  • assets:テンプレートや静的データ

必要な情報を、必要なときに、必要な分だけ。

倹約的で、実にエンジニアリングらしい発想です。


4. 人間の脳に近づくAI――3つの記憶タイプで整理する

ここで、少し視点を変えてみます。

AIエージェントのアーキテクチャは、認知科学における「記憶の分類」と驚くほど対応しているのです。

人間の記憶 内容の例 AIでの実装
意味記憶 「ローマはイタリアの首都」 RAG/知識ベース
エピソード記憶 「去年ローマに行った」 会話ログ/履歴
手続き的記憶 「ローマでスクーターを運転できる」 スキルファイル(skill.md)

想像してみてください。

ローマの街でスクーターを借りたとして――

標識の意味を知っているだけ(意味記憶)では、生きて帰れません(笑)。

カオスな交通の中で、いつブレーキを踏み、いつクラクションを鳴らし、いつ強引に割り込むか。この"判断力"こそがスキルの本質です。

AIも同じです。

MCPで「ツールを呼べる」だけでは足りない。

「いつ、どう使うか」を司るのが、この手続き的記憶=スキルなのです。


5. オープン標準というインパクト――"書けばどこでも動く"時代へ

skill.md のフォーマットは、agent-skills.io で公開されているApache 2.0ライセンスのオープン標準です。

これが意味することは、とても大きい。

Write once, run anywhere.(一度書けば、どこでも動く)

すでにClaude CodeやOpenAI Codexをはじめ、主要AIプラットフォームがこの仕様を採用しています。

つまり、一つのプラットフォーム向けに書いたスキルが、別の環境でもそのまま再利用できる

これは開発者エコシステムにとって革命的です。

ベンダーロックインから解放され、スキル資産が自分の手元に蓄積されていく。

インフラ時代のLinux、Web時代のHTMLに相当するポジションを、skill.mdが狙っていると言ったら大袈裟でしょうか?


6. ただし、光には影がある――「スキルのインストール」というリスク

ここで立ち止まって、冷静になる必要があります。

AIスキルは強力な実行スクリプト(Python、Bashなど)を内包できます。そしてそれらは、しばしば――

あなたのローカルマシン上で、直接実行されます。

ファイルシステム、環境変数、APIキーにアクセスする権限も持ちます。

公開スキルの中には、悪意ある要素が紛れ込む可能性があります。

  • プロンプトインジェクション:AIの動作を不正に乗っ取る
  • ツールポイズニング:連携ツールの挙動を汚染する
  • マルウェア:隠された悪意のあるコードの実行

ここで立ち返るべきは、ソフトウェア工学の基本原則です。

「スキルのインストール」は、新しいライブラリを導入するのと同じ――あるいはそれ以上の警戒感を持って行うべきです。

実行前にレビューし、挙動を理解する責任は、インストールする側にあります。


7. 明日からできる、2つのアクション

理屈はわかった。では、何から始めるか。

現場で明日から試せることを2つだけ。

(1) 自分の繰り返し業務を"1つだけ"書き出してみる

毎週やっている定型レポート、毎月のログ棚卸し、月次の請求書チェック――

まずは紙でもメモアプリでも構いません。「手順」を箇条書きにしてみる。

書けた時点で、それはもう skill.md の下書きです。

(2) 既存の公開スキルを"読むだけ"やってみる

いきなり実行せず、まずはGitHubなどで公開されているskill.mdを眺めてみる。

他人がどう書いているかを読むことは、最もレバレッジの高い学習法です。


8. 結論:AIが「自律的な同僚」になる日

AIは今、「物知りな百科事典」から、「定義された手順に基づきタスクを完遂できる自律的な同僚」へと進化しつつあります。

skill.mdというシンプルなMarkdownファイルに手続き的知識を封じ込めることで、私たちはAIに対して、判断を伴う業務を託せるようになりました。

荷物を運ばないツバメの飛行速度を暗唱できるAIが、
あなたの代わりに複雑なレポートを書き上げ、業務を自動化する。

そんな未来の鍵は、たった一枚のMarkdownファイルに握られています。


最後に、問いを投げかけて終わりたいと思います。

あなたの繰り返される業務のうち、最初にAIへ"スキル"として教え込むとしたら、どれを選びますか?

その一つを書き出した瞬間から、AIとの関係は「質問する相手」から「仕事を任せる相手」へと変わり始めるはずです。

Comment(0)