10/07/19 18:14:56 kEm8A6lA
Q.喋り声をピッチ検出に掛けると、激しく値が変動している。ボカロでは厳しそうだろうか?
A.喋り声を誤検出するのは歌声と喋り声は全く別のメカニズムで発声されているから。
喋り声には音楽的なピッチ成分が希薄である。
喋り声は4つのピッチとノイズ成分で構成されており、一つのピッチとして検出しようとすると失敗するのは当然である。
Aに対する反論B→音楽的なピッチの変動をしている喋り声もあるのでは?
Bに対する反論A'→違う(何に対して「違う」のかが不明)。以下Aの繰り返し
A'に対する反論B'→歌唱のピッチ変動で大まかに喋り声をなぞればいいのでは?
B'に対する反論A''→(B'のどうでもいい部分に反論後)Aの繰り返し。
歌声のピッチは喋り声のフォルマント変移とは全く別である
以下煽り合い
ボカロでは、Aの言うノイズ成分(非調和成分)と4つのピッチ=フォルマント(調和成分)をバラバラに抽出し、
同時に鳴らすことで歌声を再現している。
Aの発言をボカロの喋り調教に生かすなら、
全体の音量、調和成分の中域と非調和成分のゲインを複雑に制御しているDYNと、
中~高域の調和成分のみを制御しているBRIの調整が重要であるということ。
歌声のシンセ臭さを減らすためには、DYNによる中域制御以外にもBRIによる中~高域の制御によって
フォルマントのピークを擬似的に変える方法があるということでもある。
そして、調和成分だけを制御しているBRIを上げ下げする擬似的なフォルマントの制御によって、
発音の明瞭さを変えることができるということも言える