オルタナティブ・ブログ > 生涯ITエンジニアでいこう。 >

どんどん出てくるIT業界の新トレンドを乗りこなし末長くエンジニアをやっていきましょう。

チャットボットを「自律型AI」に変える鍵、『4つの記憶とガードレール』――エージェントが"忘れない"ために必要な設計とは

»

1. 導入:AIはなぜ「3時間」も同じミスを繰り返すのか?

エンジニアなら、思わず血の気が引くような経験があるはずです。

Kubernetesクラスターのデバッグに3時間。

ログを睨み、設定を疑い、Slackで助けを求めて......。

最後にようやく気づくのです。「接続先のクラスター、最初から間違えてた」と。

もし隣に優秀なエージェントがいれば、こう言ってくれたかもしれません。

「先月も同じミスしてましたよ」

......。

しかし、記憶のないAIは、何度でも同じ「3時間」を繰り返します。

単なるチャットボットと、真に自律的な「AIエージェント」を分かつ決定的な要素は、記憶(Memory)のアーキテクチャにあります。

人間が複雑な判断を下せるのは、複数の記憶を使い分けているからです。今この瞬間の思考、一般的な知識、習得したスキル、そして過去の経験――。AIエージェントも同じです。

本記事では、プリンストン大学が提唱したCoALA(Cognitive Architectures for Language Agents)フレームワークをベースに、エージェントが備えるべき4つの記憶を整理します。

そして最後に、記憶だけでは足りない「もう一つの層」、ガードレールについても触れます。


2. ワーキングメモリ――今、机に広げている資料

ワーキングメモリは、エージェントの**「作業机」**です。

コンピュータでいえば、RAM。

現在進行中の会話、システム指示、読み込んだ直近のデータ。全部ここに乗っています。

近年のLLMは「100万トークン」といった巨大な机を持つようになりましたが、ここに落とし穴があります。

Lost in the Middle問題

机が大きくなっても、真ん中に置いた資料は見落とされやすい

Stanford大学の研究(2023年)で報告された有名な現象で、20個の文書をコンテキストに入れて答えを探させると、

  • 文書が先頭にある → 正答率が高い
  • 文書が末尾にある → 正答率がそこそこ高い
  • 文書が真ん中にある → 正答率がガクッと下がる

きれいなU字カーブを描きます。

人間の記憶の「初頭効果」「新近効果」にそっくりです。

明日からできる対処

  • 大事な指示は最後にもう一度書く
  • 長い資料を貼るときは、冒頭か末尾で要点を明示
  • 長い会話でルールが効かなくなったら、改めて伝え直す

ワーキングメモリは全てのチャットボットが持っています。

しかし、これだけでは「自律性」を語るには不十分です。セッションが終われば、すべて消えてしまうのですから。


3. セマンティックメモリ――変わらない知識の図書室

セマンティックメモリは、事実、規則、ドキュメントを保存する「知識ベース」です。

担うのは「何を知っているか(What)」。

アカデミックな議論ではベクトルデータベースや知識グラフが脚光を浴びますが、実際の開発現場では、ずっとシンプルな運用が主流になりつつあります。

Markdown形式(.mdファイル)です。

Claude Codeなら CLAUDE.md、Cursorなら .cursorrules

プロジェクトのルートに置いて、規約や方針を書く。

markdown
# プロジェクト規約
- TypeScriptを使用、any型は禁止
- テストはJestで書く
- APIエンドポイントは /api/v1/ 配下
- 認証はJWT、有効期限は1時間

なぜMarkdownなのか?

人間が直接編集でき、透明性が高く、Gitで履歴も追える――それだけです。

派手な技術より、地味で扱いやすい仕組みが勝つ。よくある話です。

セマンティックメモリの選択肢

用途によって、こんな選択肢があります。

  • Markdownファイル:小〜中規模、透明性重視
  • ベクトルデータベース(RAG):大量文書から関連箇所だけ検索
  • 知識グラフ:関係性のあるデータを構造化
  • 既存DB / 外部API:構造化済みデータをそのまま参照

重要なのは、セマンティックメモリの内容はセッション開始時に常にコンテキストにロードされる、ということです。

つまり、エージェントはプロジェクト固有のルールを「常に」把握した状態で行動します。

セマンティックメモリがなければ、エージェントは同じ間違いを何度も繰り返す運命にあります。参照すべき永続的な知識がないからです。


4. プロシージャルメモリ――「やり方」を記したマニュアル

プロシージャルメモリは、エージェントが「どうやるか(How)」を知るためのスキルの蓄積です。

最近広がっているのが、SKILL.md というオープンスタンダードな形式。

PowerPointの作成手順、構造化されたコードレビューの進め方......具体的なステップを記述します。

セマンティックとの違い――段階的開示

ファイル形式が似ているので混同しがちですが、役割は明確に違います。

観点 セマンティック(CLAUDE.md) プロシージャル(SKILL.md)
中身 事実、規約、制約 実行手順、スクリプト
読み込み 常時ロード 必要な時だけオンデマンド
「TypeScriptを使う」 「PowerPointを作る手順」
トリガー なし(背景知識) タスク要求が来た時

プロシージャルメモリの真骨頂は、**「段階的開示(Progressive Disclosure)」**にあります。

すべてのスキル詳細を常にロードしたら、ワーキングメモリ(机)はあっという間に資料で埋まってしまいます。

そこで普段は、スキル名と概要のインデックスだけを見せておきます。

「PowerPoint作成」「コードレビュー」「議事録要約」......といった目次です。

タスクが発生したときだけ、必要な手順をオンデマンドで呼び出す

整理しておきます。

  • 常に頭に入れておくべきこと → セマンティック
  • 必要になったら引き出すマニュアル → プロシージャル

この区別を間違えると、トークン枠を無駄に食うエージェントが出来上がります。


5. エピソードメモリ――経験からの学習

エピソードメモリは、過去のやり取りや決定、その結果の記録です。

ここが、4つの中で最も実装が難しい領域です。

なぜなら、他の3つは「静的」ですが、エピソードだけは動的に増え続けるから。

単なるログ保存ではダメ

「45分間の会話を全部保存しました」――これではエピソードメモリとは呼べません。

実用的なシステムでは、**蒸留(Distillation)**が不可欠です。

冒頭のKubernetesの例で言えば、

[蒸留前] 45分間のSlackログ、エラー出力、コマンド履歴......
[蒸留後] 「kubectl contextがstagingのままだった。
        作業開始時に必ずcurrent-contextを確認する」

教訓だけを抽出して保持する。これが鍵です。

保存場所のパターン

主にこんな選択肢があります。

  • ベクトルDB(Pinecone、Chroma等):似た状況を類似検索で引き出す
  • 構造化DB:日時・タスク・結果をテーブルで管理
  • Markdownファイル:軽量、人間も読める
  • 専用メモリレイヤー(Mem0、Zep、Letta等):エージェント記憶に特化したミドルウェア

現実的には、これらのハイブリッド構成になります。

設計の3大課題

ただし、保存場所そのものより、以下の3つの設計のほうがエージェントの賢さを決定します。

  1. 蒸留:何を保存するか
  2. 検索:いつ思い出すか
  3. 忘却:何を捨てるか

特に忘却は重要です。

プロジェクトが変われば古い技術スタックの教訓は不要。ユーザーの好みが変われば古い好みは消すべき。

人間にとっての「忘れっぽさ」は時に利点となります。AIにおいても、何を捨て、何を保持するかが知能の質を決めるのです。


6. メモリの組み合わせ――目的別の設計指針

すべてのAIエージェントが4つすべてを装備する必要はありません。

目的に応じた設計が、ROIを最大化します。

エージェントの種類 必要なメモリ 活用イメージ
反射型エージェント ワーキングのみ サーモスタット、単純ルーティング
カスタマーサポートBot ワーキング + プロシージャル + 軽いセマンティック パスワードリセット、FAQ応答
コーディングエージェント 4つすべて 規約・技術・履歴を統合
業務基幹システム連携 4つ + ガードレール 上記+事故防止

最後の行に、メモリではない「ガードレール」が出てきました。

ここから先が、本記事のもう一つの本題です。


7. メモリだけでは足りない――もう一つの層「ガードレール」

「絶対に守らせたいルール」を、メモリの中に書くだけでは不十分です。

なぜなら、LLMは確率的に動くから。

  • コンテキストが長くなれば、ルールを忘れる(Lost in the Middle)
  • 悪意あるプロンプトで、指示を上書きされる(プロンプトインジェクション)
  • 解釈ミスで、ルールを誤って適用する

LLMはお願いを「ほぼ」聞いてくれます。

しかし、「ほぼ」では済まない業界があります。医療、金融、政府、重要インフラ。

そこで登場するのが、**Policy as Code(ポリシー・アズ・コード)**という考え方です。

推奨アーキテクチャ:3層構造

[ユーザー入力]
[入力ガードレール] ← Policy as Code
[LLMエージェント] ← 4つのメモリを持つ
    ↓ (ツール呼び出し)
[ツール実行前ガードレール] ← Policy as Code
[最小権限のツール] ← そもそも危険な操作不可
[出力ガードレール] ← Policy as Code
[ユーザーへ返答]

ポイントは、ガードレール層はLLMの外側にある、ということです。

LLMが何を考えていようと、外側のレイヤーが物理的にブロックする。

「賢いAIに信じて任せる」のではなく、「AIを物理的に囲い込む」。

これがガードレールの本質です。

ルールを置く場所は、リスクで決める

メモリとガードレール、どちらにルールを書くか。

判断基準はシンプルです。そのルールが破られたら、どれくらいヤバいか

リスク 置き場所
守られなくても致命的でない セマンティックメモリ コードスタイル
守られないと業務が回らない プロシージャルメモリ デプロイ手順
守られないと事故になる ガードレール層 個人情報の外部送信禁止

「コードスタイルはPrettier準拠」は CLAUDE.md に書けば十分。

しかし「顧客の個人情報を外部に送信しない」は、LLMの判断に委ねてはいけません


8. 結論:「賢さ」と「振る舞い」を別レイヤーで設計する

これからのAIエージェント開発では、もはや「AIをどれだけ賢くするか」だけが勝負ではありません。

AIをどう囲い込み、どう振る舞わせるか」が同じくらい重要になります。

整理すると、設計の層は3つです。

役割 例え
メモリ層(4つの記憶) LLMの判断材料を整える 良い教育を与える
ガードレール層 LLMの危険な行動を防ぐ 監督者を置く
ツール権限層 そもそも危険なことをできなくする 危険な道具を渡さない

Webアプリで、ブラウザ側のバリデーションだけに頼らないのと同じです。

サーバー側でもう一度検証する。

LLMも同じ。信頼するが検証する――いや、AIエージェントの場合は**「信頼せず、できないようにする」**が原則です。

記憶のアーキテクチャは、AIを「一回限りの回答者」から「一貫性のある自律的なビジネスパートナー」へと進化させます。

そしてガードレールは、そのエージェントを「安全に業務で使える」レベルへと引き上げます。


最後に、問いを二つ残して終わります。

あなたのワークフローにおいて、AIに「最も覚えておいてほしい」ことは何ですか?

そして、AIに「絶対にやらせたくない」ことは何ですか?

この二つの答えが、次に構築すべきエージェントのメモリ設計ガードレール設計を定義するでしょう。

Comment(0)