Alexa と Cortana の提携で Microsoft が得るもの
AmazonとMicrosoftが音声アシスタント同士の提携を発表しました。
「会話」というのがちょっと違和感がありますが、要するにAIそのものを統合するわけではなく、Alexaが理解不能な場合や他者の意見が必要になったときにCortanaに(APIなどを通じて)問合せをする(あるいはその逆)、というような構図なのでしょうね。
記事中にもありますが、この2社は得意分野が異なっており、提携によって相互に不足を補いあえるということのようです。以前のエントリで紹介したように、ある調査によるとAlexaが質問を認識する精度は2割程度で、Googleの7割に遠く及びません。確か、Microsoftとの比較でもAlexaは負けていたはずです。ということは、Amazonにとっては、Microsoftとの提携によってAlexaの認識精度が上がることが期待できるわけです。では、Microsoftにとってのメリットは何なのでしょう?
Amazonの狙い、Microsoftのメリット
Amazonにしてみれば、他社と提携しようがAIを外部に頼ろうが、Alexaというプラットフォームが強化されれば、Alexa経由での売り上げが増え、そこからAmazonへの収益が生まれるわけです。現実に先ほどの記事では、AppleともGoogleとも提携する可能性を示唆しています。
今回の提携で、Microsoftにとっての直接的/即効性のあるメリットは無いように思えます。では、何故Microsoftは提携に踏み切ったのでしょうか?
私はその答えは、学習データの収集ではないかと思っています。AIはまだまだ発展途上で、精度を向上させるためには膨大な学習データを用意してAIを強化しなければなりません。学習データはネット上にも大量にありますが、他社との差別化のためには、独自のデータをどれだけ集められるかが勝負となります。
この点、Microsoftは同業他社に比べて若干弱い立場にあります。Googleには日々大量の検索キーワードが入力されていますし、YouTubeにも、人間では見切れないほどの動画が投稿されています。Appleにも、全世界のSiriから音声データやコンシューマの行動データが集まっています。Facebookにはエンドユーザーの書き込みや写真が大量に投稿されます。これらはすべて、AIの学習データとして有効で、なおかつ他社には共有されないデータ=差別化の源泉となるわけです。Cortanaを使えるWindows10 PCは世界に5億台あると言われていますが、PCに向かって話しかける人はまだまだ少ないでしょう。
しかし、モバイルデバイスで失敗し、検索エンジンのシェアも伸び悩んでいるMicrosoftは、なんとしてもコンシューマのデータに直に触れられる機会を増やさなければなりません。Amazonとの提携内容は具体的にはわかりませんが、Microsoftにとって、Alexaからのデータが流入してくることは、魅力的な筈です。こちらの記事によると、今年末までに音声アシスタントデバイスの出荷台数は3,300万台に達すると言うことです。おそらくその多くがAlexaベースになると思われますから、Microsoftにとってのメリットは大きいと思われます。
日本企業も参入、これから急激に伸びる。。のか?
いよいよ日本企業からもスマートスピーカーが発表され、市場が賑わってきました。
以前のエントリで、日本企業は日本の技術でスマートスピーカーを発売して欲しいと書きましたが、残念ながら頭脳はGoogleになってしまったようです。スピーカーとかマイクは得意でしょうから、本家よりも良い製品にはなるのでしょうが、WindowsPCやAndroidと同じ構図で、日本の担当はハードウェアでソフトウェア(頭脳)はアメリカ頼り、ということですね。
しかも、両者とも日本語対応は未定ということで(まあ、Googleが出さなければ出せないのであたりまえですが)、これも残念です。海外では10月に発売ということで、12月発売のAppleも含め、年内に一気に品揃えが増えそうです。しかし、日本での発売が未だに見えませんね。。
Jeff Bezos はこの分野に期待を寄せており、人工知能の開発に1,000人以上を投入しているということです。(その割に結果が。。ということですが、だからこそのMicrosoftとの提携なのでしょう)
一方で、先ほどの記事では、Alexaのスキルをインストールしたユーザーが2週間後もそれを使い続けている率は3%とも書いてあり、興味本位で買ったはいいが、持て余しているというのが実態なのかも知れません。面白そうなおもちゃの域を超えて、本当の成長軌道に乗るためには、もう一歩の進化が必要なのかも知れません。(あるいは、Alexaの認識精度が最大の問題なのかも知れませんが)