オペレーティング・エイジェントあるいはAIエージェントについて
昨日のブログで説明の通り、ChatGPTは、「オペレーティング・エイジェント」あるいは「AIエージェント」としての機能を充実させようとしていると申し上げました。この点について、もう少し掘り下げてみようと思います。
昨今、 UXが、注目されています。これは、操作のしやすさやわかりやすさなどのUIに留まらず、役に立つ実感とか、使っていることが心地よい、もっと使いたいという体験にも着目したものです。この体験価値を向上させることが、ビジネスの価値を左右する大きな要件であるとの理解が拡がりつつあります。
しかし、ここに立ちはだかるのが、ITの持つ根本的な制約です。それは、「決められたことであれば、完璧にこなす」、つまり、「プログラムされたことをその通り実行する」という制約です。
全ての利用シーンを想定することができれば、これを前提にプログラミングして、ユーザーの要求に完全に応えることができるかもしれません。しかし、それは不可能です。仮にできたとしても、それをプログラミングするには、膨大な手間とコストがかかり、採算が合いません。そのため、多用されると考えられる利用シーンを選択して、その手順を分かりやすい階層構造にして、UIの向上が図られています。
しかし、機能が単純であればいいのですが、複雑になると操作が難しく、使いこなすのは容易なことではありません。例えば、最新のエアコンには、空気清浄や湿度管理、内部清掃、WIFiやインターネットからの操作が可能な機種もあります。これを使いこなせれば、いろいろといいことがあるのは分かっていても、操作や設定が面倒だからと、スイッチをオン/オフ以外は行わないという人もいます。
使いこなすには、予め想定された手順やメニューの階層構造を理解し、それに従って操作しなくてはなりません。つまり、人間の側からITに寄り添い使いこなす努力が必要になるのです。
これは、分かりやすく見やすいグラフィカルなUI(GUI)であっても同じです。また、AppleのSiriやAmazonのAlexaといった音声操作であっても同様に、予め想定された手順やメニューの階層構造があり、これを理解しなければ、うまく使えません。手順と違った使い方をすると「よく分かりませんのでもう一度お願いします。」や「私には答えられません。勉強不足ですいません。」と拒絶されてしまうのは、多くの人が体験されているはずです。
また、Excelに搭載されている膨大な種類の関数を熟知して、これを使いこなしている人はめったにいません。Pythonでプログラムを書くにしても、その豊富なライブラリーやデザイン・パターンを熟知している人は、決して多くはないでしょう。これらを使えば、やりたいことが直ぐにできるのに、私たちは回りくどいやり方で、効率悪く使っているのが現実です。
私たちが、ITを使いこなすには、「プログラムされたことをその通り実行する」という制約を受け入れ、これを使いこなすための知恵やスキルを磨く努力が必要となります。ITの側も、ユーザーの使い勝手を向上させようとすれば、その開発の手間や負担も増大します。
製品やサービスは提供する側としては、機能を豊富に、かつ複雑にすることは、その価値を高めることにつながると考える傾向にあります。しかし、それは、UIやUXの低下をもたらすことと裏腹で、その価値をユーザーが受け取ることができなければ、製品やサービスの価値にはならないというジレンマを抱えているとも言えるのです。
「オペレーティング・エイジェント」は、この制約を解消してくれます。ITが持つ「プログラムされたことをその通り実行する」は変えられませんが、それを人間が直接操作するのではなく、人間と製品やサービスの間に入って、人間に成り代わって操作してくれるわけです。
「オペレーティング・エイジェント」は、人間に対しては、わかりやすいし自然な言語表現で応対してくれます。しかも、人間の指示や命令が、予め用意された表現や手順に従わなくても、対象とする製品やサービスに最適された指示や命令に置き換えて、操作してくれます。必要な情報が不足していれば、「ここはどうしますか?」や「いつものこのやり方でいいですか?」、さらには、「あなたのこれまでの使い方ならこれでいいと思いますがよろしいですか?」と流暢な言葉で対話的に確認してくれます。自分のことを理解し、何でも言うことを聞いてくれる、頭脳明晰なアシスタントのような存在です。
また、どの製品やサービスを使うのか、どう組み合わせるのかも、こちらの意図を介して操作してくれます。人間の側が、製品やサービスの特徴や機能を熟知してなくてもよく、人間は、何をしたいのか、何を解決したいのかを伝えるだけで、最適な組合せと操作を任せることができるようになります。つまり、ITの側が人間に寄り添い課題を解決してくれるようになるわけです。
ITの側もまた、ユーザーの操作性を気にせずに、プログラミング的な合理性を追求し、コンパクトで最適化されたコードを生成できるようになります。「オペレーティング・エイジェント」を両者の間に介在させることで、従来の人間とITの利益相反の関係を解消できるわけです。
もちろん、現時点でこのような「オペレーティング・エイジェント」あるいは「AIエージェント」が実現している訳ではありません。しかし、生成AIを組み込んだ、OpenAIのChatGPT、MicrosoftのCopilot、GoogleのBardやDuetなどの製品動向を見ていると、このような方向を向いていることは間違えないと思われます。
つまり、かつてコマンドラインで操作していたPCをWindowsという「オペレーティング・システム(OS)」で操作することで利便性が高まり、もはやそれ無しでは使えない状況になってしまったように、デジタル・サービスや機器を「オペレーティング・エイジェント(OA)」で操作することが当たり前になるとすれば、このスタンダードのポジョンを握れるかどうかが、ビジネスの覇権を握れるかどうかを決めることになるのです。MicrosoftがOpenAIに膨大な投資を行うのはそんな思惑があるからです。
MicrosoftがWindowsの時のような2匹目のドジョウを手に入れられるかどうかは、まだ分かりません。GoogleやMeta、Appleもまたこの領域に膨大な投資を行っているようです。ただ、この競争が、OAの進化を加速することは確かでしょう。
このように何が得ると、生成AIの登場は、人間とITの関係、ひいてはビジネスや社会のあり方にも、大きな変化をもたらすことになると思われます。
神社の杜のワーキング・プレイス 8MATO
書籍案内 【図解】コレ一枚でわかる最新ITトレンド 改装新訂4版
ITのいまの常識がこの1冊で手に入る,ロングセラーの最新版
「クラウドとかAIとかだって説明できないのに,メタバースだとかWeb3.0だとか,もう意味がわからない」
「ITの常識力が必要だ! と言われても,どうやって身につければいいの?」
「DXに取り組めと言われても,これまでだってデジタル化やIT化に取り組んできたのに,何が違うのかわからない」
こんな自分を憂い,何とかしなければと,焦っている方も多いはず。
そんなあなたの不安を解消するために,ITの「時流」と「本質」を1冊にまとめました! 「そもそもデジタル化,DXってどういう意味?」といった基礎の基礎からはじめ,「クラウド」「5G」などもはや知らないでは済まされないトピック,さらには「NFT」「Web3.0」といった最先端の話題までをしっかり解説。また改訂4版では,サイバー攻撃の猛威やリモートワークの拡大に伴い関心が高まる「セキュリティ」について,新たな章を設けわかりやすく解説しています。技術の背景や価値,そのつながりまで,コレ1冊で総づかみ!
【特典1】掲載の図版はすべてPowerPointデータでダウンロード,ロイヤリティフリーで利用できます。社内の企画書やお客様への提案書,研修教材などにご活用ください!
【特典2】本書で扱うには少々専門的な,ITインフラやシステム開発に関わるキーワードについての解説も,PDFでダウンロードできます!
2022年10月3日紙版発売
2022年9月30日電子版発売
斎藤昌義 著
A5判/384ページ
定価2,200円(本体2,000円+税10%)
ISBN 978-4-297-13054-1
目次
- 第1章 コロナ禍が加速した社会の変化とITトレンド
- 第2章 最新のITトレンドを理解するためのデジタルとITの基本
- 第3章 ビジネスに変革を迫るデジタル・トランスフォーメーション
- 第4章 DXを支えるITインフラストラクチャー
- 第5章 コンピューターの使い方の新しい常識となったクラウド・コンピューティング
- 第6章 デジタル前提の社会に適応するためのサイバー・セキュリティ
- 第7章 あらゆるものごとやできごとをデータでつなぐIoTと5G
- 第8章 複雑化する社会を理解し適応するためのAIとデータ・サイエンス
- 第9章 圧倒的なスピードが求められる開発と運用
- 第10章 いま注目しておきたいテクノロジー