Report on Japan's infrastructure topic on weekend.

音声認識がやってきたよ。おっかさん!

»

自分の場合、どうしても携帯の親指入力で長いテキストを書く気になれず、メールもできるだけ短い言葉で済ませるようにしています。可能なら携帯からの入力が不要な世界で生きたいと考えています。
いくつかPDAを使っていた頃にも、興味があったのは入力の効率性で、手書きより速いか、手書きより便利か、ということだけでPDAを評価していました。もちろんgraffitiも覚えました。けれどもわかったのは、PDAは紙のメモ帳の代わりにはならないということ。どう逆立ちしても紙の方が上です。

ということで音声認識。

以前考えたビジネスに「親指入力が嫌なエグゼクティブ向けに、しゃべってもらった文章をこちらで入力してあげるサービス」があります。想定しているのは50代、60代の顧客です。孫からメールをもらった。返事を書きたい。けれども入力がおっくう。そういう時にこのサービスに電話をかけて電話口でしゃべれば、それが留守電に入って、遠隔地の入力オペレーターが入力してくれるというものです。親指入力が嫌な人に限定する必要はありませんね。キーボード入力が嫌、という方全員のためのビジネスです。
入力オペレーターへの仕事の割り振りがシステマティックにうまく行けば、あまりその人たちを遊ばせることなく、効率よくさばいていくことができるはずです。可能ならオフショアで入力という方向で…(「フラット化する世界」の読みすぎ)。

けれどもこのサービスは、実用的な音声認識技術が登場した段階で、競争力がなくなるなぁと考えていました。

今日必要があって、音声認識の動向をさっと調べてみたのですが、ものすごいのがありましたね。アドバンストテクノロジー社のAmiVoice。株式公開企業なので知っている人は知っているのだと思いますが(知らないのは私だけ?)、この企業、非常に大きなポテンシャルがあると思います。導入事例を見てください。完全に実用レベルです。レストランで使うなんていう事例もあります。 新日鉄も使っています

現在のコンピューティングを制約しているのは、入力形態が、キーボードないしそれに準じるインプットデバイスに限られるという事実です。(ここではマウスのようなデスクトップ上のポインティングデバイスは脇に置いて考えます。あくまでもテキストデータのインプットデバイスという意味)
キーボードという制約がはずれてしまえば、つまり、机に向かってキーを打ったり、携帯電話の狭いスペースのキーを親指ひきつらせながら打ったりする必要がなくなり、思ったこと感じたことを、瞬時に、別のやり方でもってコンピュータに送り込むことができれば、コンピューティングの姿は大きく変わります。
場所の制約やシーンの制約がはずれた場合のことは、それがリアルに目の前にないだけに、想像しにくいわけですが、それでも一生懸命想像してみるとたぶん非常におもしろいです。事業案が最低でも100ぐらい出てきます。

ここに㈱アドバンストメディア代表取締役・鈴木清幸氏のインタビュー記事があります。おそらくこの方には、そうしたコンピューティングの姿が変わってしまう状況がはっきりと見えているのではないかと思いました。個人的には、ドコモの榎さん級のインパクトです。

この音声認識技術が結節点となって、新しい、技術の側面の(一種の)社会ネットワークができあがっていくわけです。そこにまたヘッドもできればテールもできる。そういうことが繰り返されて、社会の光景はこれからも変わっていくのでしょうね。(携帯出現以前と以後とで社会の光景が変わったと思いませんか?)

Comment(2)

コメント

栗原潔

AmiVoice、私も興味あります。ただ、そんなにすごいものならもっと普及しているはずではとも思ったりします。
そもそも、音声認識は語彙が限定されるてるとすごく楽(たとえば、事例にある薬局のシステムなんかは薬の名前は限られてますから楽そうです)なんですが、大語彙だと一気に厳しくなります。
会社レベルでは事例が出てても、現場では誰も使ってないなんてことは音声認識に限らずよくある話なので、現場の生の声を聞きたい気がします。

栗原さん、コメントありがとうございます。
>ただ、そんなにすごいものならもっと普及しているはずではとも思ったりします。
おっしゃる通りです。私はユーザーがまだまだ利用形態を発見しきれていないのではないかと思っているのですが。。。
>現場の生の声を聞きたい気がします。
そうですね。あと、評価キットがあれば、ITmediaの記者のどなたかが使ってみるというのも手かも知れませんね。

コメントを投稿する