オルタナティブ・ブログ > Mostly Harmless >

IT技術についてのトレンドや、ベンダーの戦略についての考察などを書いていきます。

AI倫理とビジネスの間で揺れるAnthropic Mythos

»

米国時間の4月7日、米Anthropicは最新のAIモデルであるMythosを発表しました。コーディングや推論、マルチモーダル対応、高難易度問題の解決、パソコンの利用能力など、様々なベンチマークにおいて既存のLLMより優れているとされます。しかし、それ以上に衝撃を与えたのは、その最新モデルを「一般公開しない」という決定でした。

アンソロピックの最新AI「Claude Mythos」とは何か、なぜ一般に公開しないのか

記事によると、

セキュリティの訓練をまったく受けていないAnthropicのあるエンジニアが、Claude Mythosに、一晩でリモートコード実行の脆弱性を見つけるよう頼んだ。翌朝目を覚ますと、完全に動く攻撃手段ができあがっていた。

社内テストの段階で「主要なすべてのOSと主要なすべてのウェブブラウザーでゼロデイ脆弱性を見つけた」ということで、その総数は数千に上るとされます。これは高度な専門知識を持たない個人でも、AIに指示を出すだけで世界中のインフラを麻痺させられる可能性を示すもので、Anthropicはモデルを一般公開することを断念し、まずはITベンダーや業界団体への限定アクセスを提供し、問題の解決に取り組んでいくということです。

ai_study_kikaigakusyu.pngこの決断は、2019年にOpenAIがGPT-2の公開を「悪用の危険性」を理由に段階的公開に踏み切った歴史を強く想起させます。しかし、今回のMythosが抱えるリスクは、当時とは比較にならないほど具体的で物理的なものです。

GPT-2との類似点と、現実となった「懸念」

かつてGPT-2は「説得力がありすぎる偽ニュースを生成する恐れがある」として警戒され、論文の公開が見送られるという事態が発生しました。これについては「過剰反応だ」との声もあり、最終的には公開されましたが、現在の状況を見ると、その懸念は正当なものだったと言えるでしょう。

2026年現在、ディープフェイクや生成AIによる世論操作は日常化し、情報の信頼性は崩壊しかけています。Mythosもまた、GPT-2と同様に「能力が高すぎるがゆえに危険」というジレンマに直面していますが、対象が「文字情報(嘘)」から「社会インフラ(破壊)」へとシフトしている点が決定的な違いです。

Anthropicならではの限界と課題

Anthropicは近年生成AIの一角を占める存在として急速に存在感を増しており、今年初頭にもClaude Coworkが大バズりしました。業績も絶好調と言われており、Mythosはその決定打となるかもしれなかったLLMです。Mythosの一般公開断念がAnthropicのビジネスに大きな影響を与えることは、間違いないでしょう。

Anthropicとしても早く問題を解決してMythosを公開したいところでしょうが、一筋縄ではいきそうにありませんし、Anthropicならではの枷もあります。彼らはもともと、「OpenAIの利益優先姿勢(あるいは安全性の軽視)」に疑問を抱いたメンバーがスピンアウトして設立されたという経緯があり、社是として「Constitutional AI(憲法AI)」を掲げるなど、安全性と整合性を何よりも重んじてきました。生成AIへの目が2019年当時とは比べ物にならないくらい厳しくなっている現状で、Anthropicがどのような決断を下すか、非常に難しい問題と言えます。

その一方で、競合他社も早晩同レベルのモデルを出してくることは必至です。Anthropicが創立の理念とビジネスをいかに両立させられるか、業界全体としてこの問題にどのように取り組んでいくのか、AnthropicやAI業界の難しいかじ取りは続きそうです。

AI.png

Comment(0)