12/01/28 01:23:47.98 ps0fQ49M0
>>21
ボカロエンジンの基本動作は、ライブラリにある音素片をテキストと音程の指定に合わせて拾い上げ、
周波数変換をかけながら接続して行くんだけれど、
そのもとの音素片の多くは、ほとんどインパルスのような短い音なので、
周波数成分を正確に分析/変換することができない。
そこで最尤化制御の方法を使ってそれらしい信号を補充するが、
これが雑音になったり鼻声っぽくなる。
困った事に、自然な声に近づけようとすればするほど、
こうした分析の難しいインパルス的な音素が増えて行く。
叫び声なんて出そうとしたら、もう絶望的。
というわけで、原理の根本的な進歩が無いと難しい。
多分この先は、そうした音素片の変換では対応しにくい成分については、
物理モデルで発生させるようになっていくと思う。
そうすると中の人は、声のサンプルを取られるだけでは済まなくて、
声帯や呼吸器や口の形、肺の容量、体脂肪率や骨・筋肉の分量まで
精密に測定されるようになるだろう。