CloseBox and OpenPod:ITmediaオルタナティブ・ブログ (RSS) CloseBox and OpenPod

Mac、iPhone、iPod、VOCALOID、DTM、楽器、各種ガジェット、自転車、メディアなどの情報・雑感などなど

 きのう予告されていた、VOCALOIDの新しい発表、正式なリリースがきました。

ヤマハが歌声合成ソフトVOCALOID(ヴォーカロイド)の新バージョン 表現豊かにしゃべる機能を付加したVOCALOID-flexの提供を開始

今回開発したVOCALOID-flexは、歌声に比べ音の微細な変化が要求される「しゃべり」を実現する為に、従来のVOCALOIDでは実現できなかった、音韻(音素などの音の構成や長さ)や韻律(音の高さ、強さ)の細かな編集を可能にした歌声および発話の合成エンジンソフトウェアです。  具体的には、これまで出来なかった母音の無声化(母音を無声音として発音するケース(例:北[ki ta]の[i]))や脱落化(母音を発音しないケース(例:~です[de su]の[u])が表現可能となり、子音の長さならびに音の高さや強さも細かく編集することが出来るようになりました。その結果、より人間に近い発話が出来るようになり、話し声における細かいニュアンスや、表情豊かな方言等のアクセントやイントネーションもつけることが可能となりました。  なお、VOCALOID-flexで使用する音声ライブラリは新たに新しい音の素材を追加することなく、既存の歌声ライブラリの活用が可能となります。

 既存のVOCALOID歌声ライブラリがそのまま使える。ということは、初音ミク、鏡音リン、鏡音レン、巡音ルカ、がくっぽいど、メグッポイド、miki、氷山キヨテル、歌愛ユキという、市販されている日本語VOCALOID 2はもちろんのこと、英語もサポートしているそうなのでBig Al、Sonika、Sweet Ann、Prima、そして今度出るTonioも使える。言及はありませんが、KAITO、MEIKOはどうでしょ?

 これに加えて、初音ミクAppendをはじめとする歌声バリエーションも対応するようなので、使用できる音声は非常に広がります。

 TTS(Text to Speech)ソフトはたくさんありますが、これだけ多くの種類の声が使えるものは存在しないはず。歌声の部分を除外したとしても、ほかのTTSに対して大きなアドバンテージになると思われます。それぞれの歌声の人気もあるし。

 で、何に使うかですが、ぼくが考えているのはこんなこと。

 Twitterの読み上げアプリ。初音ミクの声でタイムラインをすべて読み上げてくれる。女性フォロワーの場合にはミクで、男性の場合にはボカロ先生で、若い女の子の場合には歌愛ユキで(これは違うか)というふうに、リスト化した属性に従って使用する声を変えるとかができます。

 処理はすべてサーバ上で行っておいて、結果だけをiPhoneに送ってくれるようなNetVOCALOID的サービスならば十分に可能ではないかと思います。それを作るのはクリプトンやインターネット、AHSなどの個々のVOCALOIDライセンシーになるわけですが。

 既にコナミのMETAL GEAR SOLIDはこの技術を使っているそうです。CEATECでの未夢のデモもたぶんそうで、清水フィルで剣持さんがやったミクのおしゃべりもこの技術を使ったのでしょう。

 iidaは既にNetVOCALOIDを活用しているのでauのほうが動きははやいかな?

 あとAHS。Voiceroidを持ってますからね。AIのTTSと組み合わせるというのが可能ならばおもしろい展開ができるかも。

 クリプトンはAppendにより感情バリエーションが可能なので、おしゃべりの表現力が格段に違ってくるはずです。気になるのは、声優さんの歌声を使っているので、再利用されてしまうことをプロダクション・声優側がいやがる可能性があるということですね。

 このように、ファーストチャンスは既存のVOCALOIDライセンシーになるわけですが、自分でVOCALOID歌声ライブラリを持っていない企業でも、ヤマハが秘蔵しているライブラリを使えるはずなので、アイデアを持っているところはコンタクトしてみてはいかがでしょうか?

 あと、個人のアプリケーションデベロッパーにも門戸は開いてほしいですね。アイデアはたくさんあると思うので。

追記:既にインターネットが開発意向表明をしてます。


本日、ヤマハさんより発表があった、しゃべる合成エンジンソフト「VOCALOID-flex(ボーカロイドフレックス)」を使った製品展開は、ただ今当社にてプロジェクト進行中です。

追記:大雑把にTTSという書き方をしましたが、文章解析して読み上げの韻律をつけるところについては、別の技術を使う必要があり、プレスリリースにはそこについての言及あはりません。そこはライセンシーが自分で見つけるか、ヤマハが適切なところを紹介するか、もしくは既にそういう技術を持っていてそれを使わせるようにするのか、ということになるかと思います。

追記:ITmedia Newsでも記事になりました:
・しゃべるVOCALOID「flex」、ヤマハが開発 「メタルギア」に採用

koya

Special

- PR -
コメント
謎の匿名希望 2010/02/25 12:26

> あと、個人のアプリケーションデベロッパーにも門戸は開いてほしいですね。
個人向けへのランタイム販売とデベロッパーへのSDK販売ですか。
いずれは実現して欲しいですが、まずはクリプトン・インターネット社・AHSの3社がどう動くかですね。
とはいえ、今回UIの提供がなく、各ディストリビューターでの作成が必要みたいなので、案外クリプトンがいちばん動きづらいかも。

koya 2010/02/25 13:11

そうですね。アプリ開発の機能を持っていないと、というのはありますね

ミク好き 2010/02/25 21:18

ホント、合成音声が流行ってますね。
最近、個人的にはStudio ToSpeakを試してみています。(http://tospeak.toshiba.co.jp/)
ミクみたいに簡単に歌えるとうれしいのですが。
これからの展開にちょっと期待しています。

774 2010/02/26 13:00

コナミは音声合成のデータを持ってますもんね。
VOCALOIDの開発よりも前に商品化してゲームに乗せてますから。
名前を呼ぶ限定でしか使ってないですが、あの自然さには驚いた。もう12年ぐらい前か。
もしかしたら、YAMAHAとKONAMIの合わせ技・・・っていうところかもしれませんね。


コメントを投稿する
メールアドレス(必須):
URL:
コメント:
トラックバック

http://app.blogs.itmedia.co.jp/t/trackback/77444/23428255

トラックバック・ポリシー


» このブログのTOP

» オルタナティブ・ブログTOP



プロフィール

松尾 公也

松尾 公也

Mac誕生前夜の1983年業界入り。
PC Magazine、PC WEEK、MacUserなどを経て、IT業界の裏道を歩みつつ現在に至る。

詳しいプロフィール

カレンダー
2012年2月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29      
カテゴリー
エンタープライズ・ピックアップ

news094.gif 富士通元社長の山本卓眞氏が残した次代へのメッセージ
富士通の社長、会長を務めた山本卓眞氏が亡くなった。哀悼の意を込めて、日本のIT産業界の大御所が残した次代へのメッセージを紹介しておきたい。(2/6)

news094.gif Facebook就活はもう古い?
約260人のブロガーが、ITにまつわる時事情報などを日々発信しているビジネス・ブログメディア「ITmedia オルタナティブ・ブログ」。その中から今回は「就活」「都心の雪」「ソーシャルメディア」などを紹介しよう。(2/4)

news094.gif 東北をコットンの生産地としてブランディングしたい──リー・ジャパン・細川取締役
塩害に強い綿の生産で東北に新たな産業を作りたい。オーガニックコットンの採用など、環境負荷を下げるジーンズ生産に取り組んできたリー・ジャパンの新たなチャレンジとは──。(1/30)

news094.gif 東北から始まるイノベーション
企業のICTを活用と若手IT技術者による東北発のイノベーションが、中長期的な震災復興の鍵となる。(1/27)

news094.gif 貧困国の雇用を創出する印刷屋、丸吉日新堂印刷の挑戦
全国から約2万7000件の名刺制作を受注をする札幌の小さな印刷会社の成功の秘密は、地道な社会貢献にあった。(1/16)

オルタナティブ・ブログは、専門スタッフにより、企画・構成されています。入力頂いた内容は、アイティメディアの他、オルタナティブ・ブログ、及び本記事執筆会社に提供されます。

Special

- PR -

サイトマップ | 利用規約 | プライバシーポリシー | 広告案内 | お問い合わせ