ポッドキャストのレコーディング終了
木曜日の夜に、ポッドキャストのレコーディングの1回目をやりました。アップデートは来週木曜のようです。毎週木曜日の更新で計4回やることになります。
こういうナレーション録音の仕事は今までも数回やったことがありますが、久しぶりなのでちょっと緊張しました。やってみてわかるのは、スピーチの情報の帯域幅は結構小さいということです。5分の録音だと情報量としてはA4で2枚分くらいです。この点はわかっていたはずなのに、原稿4枚分くらい用意していったら案の定大幅時間オーバーで、その場で原稿を修正するはめになってしまいました。どうもすみませんでした <(_ _)>>関係者の方
スピーチの情報量ということでいうと、ICレコーダーでセミナーを録音したりすることがありますが、まず聞き返すことはありません。60分の講演を聞き返すには60分かかってしまい、時間がいくらあっても足りないからです。記事にするインタビューの時も、念のためにICレコーダー回してますが、やはり聞き返すことはまれで、結局、メモから原稿起こしてしまいます。ICレコーダー使うのは英語が聞き取れなかった部分を確認する時くらいです。音声は情報の記録手段としてはあまり適切とは言えないということです。
音声認識でテキストに落としてくれるテクノロジーが実用化されればよい(さらに、サマリーまでしてくれればもっと良い)のですが、現状の音声認識テクノロジーの認識率を見ると当面は無理そうです。
ところで、NHKのニュース等で視聴覚障碍者の方向けに字幕が出ることがありますが、あれはどうやって実現しているのかご存じでしょうか?超速タイパーの人が入力しているのかと思ったらそうではなくて、音声認識でやっているようです。ただし、アナウンサーが話している内容をそのまま字幕にするのは無理なので、アナウンサーの話を聞きながら機械にとってわかりやすいように時間差で言い直す人がいて、その人の音声を自動認識しているようです(リスピーク方式というそうです)。要するに、まだ機械がわかりやすいように人間側が歩み寄ってあげないといけないという状況なわけです。