PodZingerでV-logも検索できるじゃないか
ポッドキャストの内容をテキストで検索できる「PodZinger」という検索エンジンが、ITmediaのニュースで紹介されていた。音声をテキストデータに変換して、それを検索できるのだ。
この検索エンジンのすごいところは、検索結果として表示されたテキストがクリッカブルになっていて、クリックしたところからポッドキャストの再生が始まるというところ。検索対象の音声データに、きっちりとインデックスが張られているというわけだ。この機能を応用すれば、V-logのような動画であっても音声インデックスをすぐに張ることができるので、見て初めて内容を確認ではなく、あらかじめどんな映像かが予測できる。
外資系ベンダーに所属していた際に、英語の講演ビデオに字幕をつけるという作業をよくしていた。英文のテープ起こしから翻訳までの部分は外部の業者にお願いして、それを確認して修正するという作業をおこなっていた。この作業、じつはかなり大変でコストもそれなりにかかる。上記の機能があれば、英文テキストを読んでいってちょっと文章が怪しいなというところがあれば、そこをクリックして該当箇所の映像を確認できる。これまでは、ビデオ編集のエンジニアに頼んで、何分くらいのところを再生してもらい確認修正という作業を繰り返していたのでスタジオに篭る必要があったが、これなら大部分の作業を手許のノートPCで簡単に実現できそうだ。
5年以上前に、映像にインデックスをつける技術という話を聞いたことがある。上記のように音声があってテキスト化できるものであれば、インデックスをシステムで自動的に生成することは可能だ。当時伺った話は、たとえば「夕日のきれいな空に鳥が飛んでいるシーン」「変身ヒーローと怪人が戦っているシーン」などという、自然言語で表現されたワンカットのシーンを検索するための研究だった。これは難しい。いまだこれに対応するような自動インデックス化の技術が開発されたという話は聞かないので、研究半ばの技術なのではないだろうか。
放送局でディレクターをしている友人が、ハイビジョンの映像を作るとそれに対するメタ情報を入力するのが大変だという話をかつて聞いたことがある。ハイビジョンの映像を再利用したりするために、アーカイブ時にさまざまなメタ情報を付け加えなければならないというのだ。この作業、当時はすべて担当者が手作業で行っていたようだが、現状はどうなっているのだろう。次世代の放送とIT技術の融合といったあたりは、このあたりの技術動向にも強く影響を受けるのかもしれない。