オルタナティブ・ブログ > CloseBox & OpenPod >

Mac、iPhone、iPod、歌声合成、DTM、楽器、各種ガジェット、メディアなどの情報・雑感などなど

しゃべるボカロ「VOCALOID-flex」でなにが変わるのか?

»

 きのう予告されていた、VOCALOIDの新しい発表、正式なリリースがきました。

ヤマハが歌声合成ソフトVOCALOID(ヴォーカロイド)の新バージョン 表現豊かにしゃべる機能を付加したVOCALOID-flexの提供を開始

今回開発したVOCALOID-flexは、歌声に比べ音の微細な変化が要求される「しゃべり」を実現する為に、従来のVOCALOIDでは実現できなかった、音韻(音素などの音の構成や長さ)や韻律(音の高さ、強さ)の細かな編集を可能にした歌声および発話の合成エンジンソフトウェアです。  具体的には、これまで出来なかった母音の無声化(母音を無声音として発音するケース(例:北[ki ta]の[i]))や脱落化(母音を発音しないケース(例:~です[de su]の[u])が表現可能となり、子音の長さならびに音の高さや強さも細かく編集することが出来るようになりました。その結果、より人間に近い発話が出来るようになり、話し声における細かいニュアンスや、表情豊かな方言等のアクセントやイントネーションもつけることが可能となりました。  なお、VOCALOID-flexで使用する音声ライブラリは新たに新しい音の素材を追加することなく、既存の歌声ライブラリの活用が可能となります。

 既存のVOCALOID歌声ライブラリがそのまま使える。ということは、初音ミク、鏡音リン、鏡音レン、巡音ルカ、がくっぽいど、メグッポイド、miki、氷山キヨテル、歌愛ユキという、市販されている日本語VOCALOID 2はもちろんのこと、英語もサポートしているそうなのでBig Al、Sonika、Sweet Ann、Prima、そして今度出るTonioも使える。言及はありませんが、KAITO、MEIKOはどうでしょ?

 これに加えて、初音ミクAppendをはじめとする歌声バリエーションも対応するようなので、使用できる音声は非常に広がります。

 TTS(Text to Speech)ソフトはたくさんありますが、これだけ多くの種類の声が使えるものは存在しないはず。歌声の部分を除外したとしても、ほかのTTSに対して大きなアドバンテージになると思われます。それぞれの歌声の人気もあるし。

 で、何に使うかですが、ぼくが考えているのはこんなこと。

 Twitterの読み上げアプリ。初音ミクの声でタイムラインをすべて読み上げてくれる。女性フォロワーの場合にはミクで、男性の場合にはボカロ先生で、若い女の子の場合には歌愛ユキで(これは違うか)というふうに、リスト化した属性に従って使用する声を変えるとかができます。

 処理はすべてサーバ上で行っておいて、結果だけをiPhoneに送ってくれるようなNetVOCALOID的サービスならば十分に可能ではないかと思います。それを作るのはクリプトンやインターネット、AHSなどの個々のVOCALOIDライセンシーになるわけですが。

 既にコナミのMETAL GEAR SOLIDはこの技術を使っているそうです。CEATECでの未夢のデモもたぶんそうで、清水フィルで剣持さんがやったミクのおしゃべりもこの技術を使ったのでしょう。

 iidaは既にNetVOCALOIDを活用しているのでauのほうが動きははやいかな?

 あとAHS。Voiceroidを持ってますからね。AIのTTSと組み合わせるというのが可能ならばおもしろい展開ができるかも。

 クリプトンはAppendにより感情バリエーションが可能なので、おしゃべりの表現力が格段に違ってくるはずです。気になるのは、声優さんの歌声を使っているので、再利用されてしまうことをプロダクション・声優側がいやがる可能性があるということですね。

 このように、ファーストチャンスは既存のVOCALOIDライセンシーになるわけですが、自分でVOCALOID歌声ライブラリを持っていない企業でも、ヤマハが秘蔵しているライブラリを使えるはずなので、アイデアを持っているところはコンタクトしてみてはいかがでしょうか?

 あと、個人のアプリケーションデベロッパーにも門戸は開いてほしいですね。アイデアはたくさんあると思うので。

追記:既にインターネットが開発意向表明をしてます。


本日、ヤマハさんより発表があった、しゃべる合成エンジンソフト「VOCALOID-flex(ボーカロイドフレックス)」を使った製品展開は、ただ今当社にてプロジェクト進行中です。

追記:大雑把にTTSという書き方をしましたが、文章解析して読み上げの韻律をつけるところについては、別の技術を使う必要があり、プレスリリースにはそこについての言及あはりません。そこはライセンシーが自分で見つけるか、ヤマハが適切なところを紹介するか、もしくは既にそういう技術を持っていてそれを使わせるようにするのか、ということになるかと思います。

追記:ITmedia Newsでも記事になりました:
・しゃべるVOCALOID「flex」、ヤマハが開発 「メタルギア」に採用

Comment(4)

コメント

謎の匿名希望

> あと、個人のアプリケーションデベロッパーにも門戸は開いてほしいですね。
個人向けへのランタイム販売とデベロッパーへのSDK販売ですか。
いずれは実現して欲しいですが、まずはクリプトン・インターネット社・AHSの3社がどう動くかですね。
とはいえ、今回UIの提供がなく、各ディストリビューターでの作成が必要みたいなので、案外クリプトンがいちばん動きづらいかも。

koya

そうですね。アプリ開発の機能を持っていないと、というのはありますね

ミク好き

ホント、合成音声が流行ってますね。
最近、個人的にはStudio ToSpeakを試してみています。(http://tospeak.toshiba.co.jp/)
ミクみたいに簡単に歌えるとうれしいのですが。
これからの展開にちょっと期待しています。

774

コナミは音声合成のデータを持ってますもんね。
VOCALOIDの開発よりも前に商品化してゲームに乗せてますから。
名前を呼ぶ限定でしか使ってないですが、あの自然さには驚いた。もう12年ぐらい前か。
もしかしたら、YAMAHAとKONAMIの合わせ技・・・っていうところかもしれませんね。

コメントを投稿する