2010年と比べると音声入力は予想以上に進化していた。これなら使える
普段、メールマガジンやメディアや出版物の原稿など、文章を書くことが多い。
文章というのは、さらさら書けることもあれば、そうでないことも多々あり、なかなか悩ましいものである。頭の中で悶々としながらキーボードをたたいていると、自分が何を言いたいのかますますよくわからなくなってきて、迷宮入りしてしまうこともよくある。
だからといって締め切りは待ってくれない。締め切り前になると、頭をかきむしりながら原稿を書く......ということが少なくない。
また、キーボードで原稿書くのは結構時間がかかる。元々プログラマーだったこともありブラインドタッチはできる。とはいえ、3000字から5000字にもなる原稿を仕上げるためには、相応時間が必要である。
けれども先日、同僚から「最近の音声入力は優れている。ブログなどの記事は口語体で書くことも多いから自然に話したことを音声変換した方が効率が良いのではないか」という話を聞いた。
音声入力は何度か試したことがある。一番最初に試したのは2010年だ。
商品名は明かさないが、当時音声変換ソフトを購入し、言葉で喋った内容を文字に書き起こしてみた。だが、期待に反して、そも変換能力は正直なところあまり良くなく、とんちんかんに変換される日本語に、本来伝えるべきことに集中できなくなることにイライラして、結局、面倒くさくなってキーボードに戻るのであった。
ボイスレコーダーで録音した音声を文字起こししようとしたこともある。でも、多くの場合、期待は裏切られた。
この経験を何度か繰り返した。
でも、技術は進歩しているし、現在の音声入力はどんなものなのかと思い、試してみることにした。
私は基本、 Windows ユーザーである。また、普段使っているスマートフォンをアンドロイドである。最近、スマートフォンでの入力が面倒くさい時に、「Ok,Google.」 と、 Google の音声入力を使うことがが少しずつ増えてきた。そこで、音声入力エンジンは Googleの音声入力を使うことにした。
Google の音声入力は、Google ドキュメントを使う。
その使い心地は、いかほどのものか。
はっきり言おう。 Google の音声入力エンジンはかなり優秀である。「OK,Google. 自宅まで案内して」のように短い単語レベルではなく、話している言葉をかなり正確に再現してくれるのである。ここまで技術は変化していたのかと正直驚いた。2010年に試した音声入力ソフトウェアとは雲泥の差である 。「マイクを使う」「ゆっくり話す」など意識すれば、その精度は増す。
この変換精度は、 AI などの技術によるものが大きいと思うが、Googleに限らず、ほかのエンジンもかなり進化しているのではないか。
変換精度よりも、頭の中にあることを言葉にすることの方が難しいと感じるほどだ。かつてのようにとんちんかんな変換が少なくイライラすることがないから、伝えたいことを考えることに集中できる。
頭の中にあることを文字に起こす時、考え考え書くので、意外とキーボードで売っているあのわずかな時間が、頭の中の考えを整理してくれる効果は確かになる。でも、話したことがスラスラと文字に変換されるのならばそれに越したことはないし、入力スピードもかなり軽減されることだろう。
また、頭の中にあることを言葉で口にすることで、ぼんやりしていた考えが整理されることもあるし、自分の言葉を自分で聞くことで「あっ、そうだ!」と、新しいアイデアが浮かぶこともある。
もう少し慣れは必要だと思うが、音声入力を積極的に使ってみたい。このブログも、そのようにして書くことを試みている。ほかの原稿でも試しはじめている。
とりあえず話してみて文字に起こし、あとからキーボードで編集する。まるで、ライターと編集者がいるみたいだ。