Mac、iPhone、iPod、VOCALOID、DTM、楽器、各種ガジェット、自転車、メディアなどの情報・雑感などなど
VocaListenerの論文が公開されたのでちょっとだけ。
詳細については、いつものように初音ミクみくさんがレポートされているので、まずはお読みください。いつもありがとうございます。
・出た!VocaListener(ぼかりす)開発者のサイトに技術論文!
謝辞の中に、「本研究に対し有益な議論 をして頂き、VSTiホストの実装へご助言を頂いた藤原弘将氏(産総研) に感謝致します」とあります。
藤原弘将氏というのは、以前取り上げた、VocalFinderにおける、後藤真孝氏の共同研究者です。え、VSTiホストへの実装って、VocaListenerはそういう形での実装を予定してるんですね。スゴイ!
わたしがいちばん気になっていたのは、歌をうまく聴かせるための手法「歌唱力補正機能」です。論文(PDF)と、第75回音楽情報科学研究でのプレゼン資料(PDF)を読んで、その内容がある程度わかりました。
1つは、「音高変更機能」で、そのポイントは「音高遷移が半音単位となるように補正」すること。連続する有声区間毎に適切に補正するということだそうで。たしかにピッチを合わせるというのはそういうことですよね。
もう1つが、わたしにとってとてもおもしろかった。「音高・音量軌跡を変更することで、歌唱力を補正」することです。
VocaListenerでは歌唱のワンフレーズのピッチ変移を、プレパレーション、オーバーシュート、微細変動、ビブラートに分類。ビブラートを入れる、オーバーシュートが小さくする、という2つのポイントでアマとプロの違いをくっきり出そうとしています。つまり、出だしの音程を安定させるわけです。ただし、あまりやりすぎるとロボっぽくなってしまうので、「平滑化前と平滑化後を線形補間」することにより、より自然なプロっぽさというのを出そうとしているようです。
例えば、オーバーシュートは、歌唱技量の差によらず生起するが、プロによる歌唱の方が、アマチュアによる歌唱よりも変動が小さいという知見があり
これは、ピッチについてのことですが、音量の変移について、どのような実装をしているのかについても、もっと詳しい説明があるとより面白いことになるかと思います。論文を読むと、スムージングだけかもしれないですね。
Special
- PR -| Eji | 2008/06/02 21:54 |
|
論文によると、VocaListenerをつかったら、なんか人に「この歌はとううたうか」を教えるのようで、UIから見るとかなり面白い。 まず自分が一回歌います。 それは人間に歌を教えるの流れと極めて近いと思う。 そういう簡単の使い方でもっと多くの人にVocaloidを使わせたいのが「ぼかりす」たとおもいますが。 | |
| koya | 2008/06/02 22:03 |
|
UIにすごく気を遣っているようでうれしいです。はやく製品化されたものを使ってみたいですね。そうすると、VocaListenerよりも、VocaLessonerのほうがボーカルレッスンぽくっていいかも。 | |

富士通元社長の山本卓眞氏が残した次代へのメッセージ
Facebook就活はもう古い?
東北をコットンの生産地としてブランディングしたい──リー・ジャパン・細川取締役
東北から始まるイノベーション
貧困国の雇用を創出する印刷屋、丸吉日新堂印刷の挑戦