フリーの音声合成ソフトCeVIO Creative Studio FREEが公開されたので,
早速いじってみた.
2004年にYAMAHAかたVocaloidが発売されて以来,
歌声合成技術は完全に一般が認知するところとなったが,
あの鼻を摘んだような歌声がどうしても気に入らなかった.
もちろん,それなりの調教師がいじればそれなりのものにはなったのだけど.
が,このCeVIOプロジェクトでは,デフォルトで鼻摘み感がかなり無くなってる.
隠れマルコフモデルの音声合成への応用なんかをちら読みしたんだけど,
如何にして音素同士を自然に滑らかに繋ぐかに力がそそがれていて,
一定量の文脈での学習データを揃えたのち,学習外の音素をつなぐ際には,
隠れマルコフモデルで尤もらしいつなぎ方で合成する,ってなことなのかな.
自然(この場合音声会話)を単純化して数学モデルにし,
そこに数学という道具を使って解析と合成を行って,再び現実世界へ還元したものであり,
まさに数学という思考の道具箱が十二分に使われている様がよく分かる例じゃないかな.