跳至正文

Select your region & language

Global

Region

基础频率分析 (31) -倒谱

这次我们将讨论语音处理领域中经常使用的“倒谱分析”。

倒谱分析可以从时间波形求出功率谱,将该谱数据视为波形,对其进行FFT,求出该谱波形的周期性等。

此外,通过使用倒谱,可以从通过诸如滤波器的系统的时间信号估计滤波器系统的传输特性。

通常,假设测量的时间信号x (t) 由两种时间信号f (t) 和g (t) 组成,考虑从x (t) 提取f (t) 或g (t) 的信号信息。

首先,假设x (t) 是两个信号的和。即:

x(t) = f (t) + g(t)

在本例中,由于这是线性运算,因此如果将表达式 (1) 的两边都进行傅里叶变换,

X ( f ) = F( f ) + G( f )

同样在频域中,频率分量X (f) 是两个信号的频率分量F (f) 和G (f) 之和。

如图1所示,如果每个频率分量的带宽不同,则可以通过滤波处理 (图2) 容易地分离和提取它们。

  • 图1和信号x (t) 的频谱
    图1和信号x (t) 的频谱
  • 图2通过滤波处理分离信号
    图2通过滤波处理分离信号

实际获得的信号很少是这样简单的例子,并且通常作为诸如滤波器之类的线性系统的输出获得。
如果脉冲响应g (t) 的线性系统的输入信号是f (t) 并且输出信号是x (t),

,输出时间信号x (t) 是f (t) 和g (t) 的卷积积分。将公式 (3) 的两边
里叶变换

X ( f ) = F( f )G( f )

即,频率分量X (f) 是两个信号的频率分量F (f) 和G (f) 的乘积。为了从公式 (4) 中提取原始输入信号f (t),需要获得G (f) 的反滤波器,并且当g (t) 也未知时相当困难。因此,在公式 (4) 中,如果能够将积转换为和,则可以使用上述方法来分离每个频带。具体来说,根据公式 (4) 求出功率谱并取其对数,可以表示为两个和分量。
由式 (4)、

Pxx ( f ) = P ff( f )P gg( f )

其中,P xx (f) =P ff (f) P gg (f) 分别求出x (t),f (t),g (t) 的功率谱,取两边的对数。

log Pxx ( f ) = log Pff ( f ) + log Pgg ( f )

的形式。与上述公式 (1) 相同,将公式 (6) 的左侧视为时间数据并执行傅里叶变换可实现频带分离。

对原始时间信号进行傅立叶变换以获得功率谱,然后对其对数数据再次进行傅立叶变换,这种方法称为倒谱分析。倒谱 (cepstrum) 的横轴为时间,与通常的时间波形中的时间不同,因此其“频率” (frequency) 也被称为“quefrency”。频率轴上的“过滤器” (filter) 也称为“提升” (lifter) 。表1总结了频谱和倒谱术语的对比。

表1频谱和倒谱用语的比较

名称 spectrum (光谱) 倒谱 (cepstrum)
横轴 frequency (频率) quefrency (quefrency)
频带分离 过滤器 (filter) 升降器 (lifter)

以语音分析为例。人声产生为通过声道 (例如喉咙或口腔) 过滤的声音,声带的脉冲振动作为声源。

  • 图3声音产生模型
    图3声音产生模型

在图3中,声源 (a) 对应于f (t),g (t) 对应于声道的频谱 (b),并且生成的声音
(c) 对应于观察到的时间信号x (t) 。

  • 图4女性声音/A/的时间波形和功率谱 (纵轴为对数)
    图4女性声音/A/的时间波形和功率谱 (纵轴为对数)

图4显示了成年女性声音 (A) 的时间时间信号及其分析结果。现在,您可以看到语音 (A) 的基本频率 (音高) 约为225 Hz。图4对下图中的功率谱 (对数) 进一步执行FFT以获得倒谱,如图5所示。

  • 图5女声/A/倒谱
    图5女声/A/倒谱

图5中的水平轴是凯夫伦西,单位为时间 (s) 。
从图中,您可以看到以下内容。高于图中红点线 (约3.5毫秒) 的Kefrency波段是声带振动产生的声源的倒谱分量,代表原始频谱的周期性 (基频及其谐波分量的重复) 。峰值约为450 ms,频谱间隔周期约为450 ms,因此倒数约为220 Hz,这表明它是基频220 Hz及其谐波分量的信息。
此外,低于图中红点线 (约3.5 ms) 的Kefrency频带表示声道频谱,因为它是原始频率轴上变化缓慢的信息。

接着,以红点线 (约3.5ms) 附近为界,将高辉度设为0进行提升处理 (低通提升器),再次进行FFT后返回频率轴上,如图6的上图所示。这称为提升频谱,对应于原始功率谱中的包络 (包络) 。图7显示了原始功率谱和提升谱的重叠。

因此,倒谱分析的应用包括提取光谱的周期信息,确定光谱的包络线 (包络) 等。其他应用包括分离声音的反射波。

  • 图6提升频谱和原始功率频谱
    图6提升频谱和原始功率频谱
  • 图7提升频谱与原始功率频谱的重叠显示
    图7提升频谱与原始功率频谱的重叠显示

最后,总结一下。

  1. 倒谱是将对数化功率谱视为时间信号并对其进行傅里叶变换的结果。
  2. 倒谱是频谱 (其横轴为频率) 的傅里叶变换,因此其横轴返回到时间轴 (单位:s),称为Kefrency。
  3. 倒谱用于语音分析,可以检测声带的基本频率和声道的频谱形状。
  4. 提升低凯夫伦斯,然后再次进行傅里叶变换以获得原始光谱的包络,称为提升光谱。
  5. 倒谱的用途包括:
    (1) 提取频谱的周期信息
    (2) 检测频谱的包络线
    (3) 分离声音的反射波等

关键字
倒谱、脉冲响应、卷积积分、凯夫伦斯、升程、基频、俯仰、低凯夫伦斯、高凯夫伦斯、升程频谱、包络、包络

【关键词】

倒谱、脉冲响应、卷积积分、quefrency、升程基频 (俯仰)、升程谱、包络 (包络)

【参考】
森下严、小畑秀文共著「信号处理」(社) 计测自动控制学会 (1982年)
城户健一著「数字傅里叶分析 (II) -高级篇-」新冠社 (2007年)

(摘自2017年1月24日发行的电子邮件杂志)