日頃考えていることをぽちぽち書きます。

東芝コエテーションを試してみた

»

先週に発表された、東芝声ステーションを試してみました。アプリから指示されるフレーズを読み聞かせてトレーニングすることで、自分の声で音声合成できるサービスです。
ITmedia記事: 「あなたの声」でしゃべり出す――音声合成スマホアプリ「コエステーション」東芝が公開

冷静に考えると、自分の声だったら、それを録音すればいいだけ。他の人の声は利用価値がありそうだけれども、詐欺行為もできそうです。故人の声でなんて、今までのSFの世界。

さて、アプリでは、合計で10、50、100、150、200件のフレーズを読み聞かせたそれぞれの段階で、サービスに処理してもらうと、自分の声で合成できるようになります。処理の時間は早くて10分程度でした。最初の10件での合成結果は、何か違います。録音された僕の声との比較で、声質が明らかに異なります。
50件での段階でも、違和感は変わりませんでした。
ところが、100件での段階では、少し良くなった感じがします。
150件は時間の余裕がなくて確認はスキップして、最後の200件で確認すると、良くなったとは思いますが、まだ違います。妻に聞いてもらったところ、声が実物より低いのではないか、と。

今回はあらかじめ決められた音声の録音ですが、いずれは一定の録音量があれば十分では。政治家、タレント、アナウンサーとかは容易に作れそうな感じがします。

ところで、利用規約には、「ユーザーから本サービスに提供する自らの音声データ」や「ユーザーが作成した合成音声の音声データ」等を「当社が運営するウェブサイト内に掲載されている本サービスのプライバシーポリシーに従って利用する、永続的で取消又は撤回が不可能な、非独占的、譲渡可能かつ再許諾可能な世界的な権利を無償で許諾する」とあり、少し気になるため、以上の実験を済ませたら、全て削除することにします。

Comment(0)

コメント

コメントを投稿する