Stylianous提出了谐波加噪声模型(Harmonic Plus Noise Model,HNM)。将信号分成谐波成分和噪声成分,谐波成分代表信号中的低频部分,可以由基频、幅度、相位三个参数表示;噪声代表信号的高频部分,可由高斯白噪声通过高通滤波器来表示。
谐波加噪声的数学描述如下:
s(n)为语音信号,sh(n)为语音信号的谐波成分,为复幅度,L为谐波个数,e(n)为随机噪声。
在浊声端,用最小权重均方差准则来估计每帧的谐波部分的幅度和相位
最小二乘准则下,估计Ak,目标函数为
对上式求x偏导,并令=0,则可以得到关于最小二乘问题的最优值方程为
T为共轭转置,令,R是一个托普利茨矩阵,采用Levinson-Dubin算法,求得,则谐波成分的幅度
和实相位分别表示为
该算法求出的幅度和相位值如下图所示: