GPT5を巡る混乱 ~結局は「中身」より「言い方」なの?
日本ではお盆前の8月8日(現地時間8月7日)、待望のGPT-5が発表されました。公開から10日ほど経ちましたが、その評価はというと、かなり混乱しているようです。
開発したOpenAIのアルトマンCEOが「博士号レベル」と持ち上げるなど、期待は高まっていました。
ところが、推論性能やハルシネーションとはまったく違う観点から「ダメだし」されてしまったというのです。
その観点とは
SNS上の反応を眺めると、GPT-4oの支持者は主にその「暖かさ」や「共感力」を評価している。新しいGPT-5は性能が高いものの、「冷たく機械的」「感情的な相談に不向き」との指摘が目立つ。
なんと、AI自身の性能や精度ではなく、受け答えの仕方の問題です。「言いたいことはわかるが、お前のその言い方が気に食わない。」という感じでしょうか。
この記事(他にも類似記事多数)を読んで感じたのは、ChatGPTを頼り、「癒し」を求めている人が多いのだなあ、ということです。ある意味、AI利用の裾野が大きく広がっていることを示しています。そしてもうひとつは、そういった人達にとって最新のAIとかハルシネーションとかは相対的に重要度が低いのだろう、ということです。
しかし、こんなもの(というと何ですが)は、UI部分の問題ですから、調整はいくらでも効きます。OpenAIも早速修正に乗り出しました。有償版ユーザーには前モデルの4oを再提供するという施策も打ち出しています。
そもそも、4oが過度に共感的なことから、文句を言う人も居たのですよね。この辺はさじ加減が難しいのだろうなと思います。
サム・アルトマン、ChatGPTのGPT-4oは「媚びへつらいすぎて不快」 性格を修正予定。将来的にはAI人格の選択肢も(更新:ロールバック対応)
話を戻すと、GPT-5の評価として受け答えだけに注目するのは本質から外れているように思います。この部分は技術の本質では無く、「味付け」に過ぎませんので、今後修正されていくか、キャラクターを選べるようになっていくでしょう。
GPT-5の評価としては、他の部分に注目すべきです。実際、GPT-5に対する玄人筋からの評価はなかなか高いようです。
SNSなどでAI研究者の方の投稿を見ても、技術的な取り組みとしての評価は高いようです。ただ、向き不向きはあるようで、使い方や使う分野によって評価は大きくぶれるというのも現実であり、この辺はこれまでのGPTも他のLLMも同様でしょう。
結局の所、今は「自分で使ってみて判断する」しか無いのでしょう。ネット記事や動画があまり参考にならない、やっかいな時代になったということなのかも知れません。