倒频谱cepstrum),顾名思义,就是将频谱(spectrum)的英文前四个字母反过来写。倒频谱是为了某些时候,为了计算方便,将原来信号的频谱先转成类似分贝的单位,再作逆傅里叶变换,把它视为一种新的信号做处理。倒频谱有复数倒频谱,及实数倒频谱。

倒频谱的范例

倒频谱被定义在1963的论文(Bogert等)。定义如下:

  • 字义:倒频谱(信号)是信号频谱取对数的傅里叶变换后的新频谱(信号),有时候会称频谱的倒频谱。
  • 数学上:信号的倒频谱 = IFT ( log ( | FT (信号) | ) + j2πm )(m为实数)
  • 算法:信号 -> 傅立叶变换 -> 取绝对值 -> 取对数 -> 相位展开 -> 逆傅立叶变换 -> 倒频谱

复数倒频谱拥有频谱大小跟相位的信息,实数倒频谱只有频谱大小的信息,各有各的不同应用。

复数倒频谱与实数倒频谱

复数倒频谱

 
其中 
可能遭遇的问题
1.  
2.  有无限多的解
当输入是实数时,因为 偶对称 奇对称,所以复数倒频谱的值为实数

实数倒频谱

 
可能遭遇的问题
1.  

应用

  • 倒频谱可以被视为在不同频带上变化速率的信息,倒频谱一开始被发明在地震炸弹产生的地震回音,现今也被使用在分析雷达信号,以及信号处理等问题。
  • 自相关倒频谱(autocepstrum)被定义为倒频谱的自相关性,自相关倒频谱有时在分析处理回传信号时比倒频谱还准确。
  • 倒频谱在处理人声信号以及音乐信号有非常好的效果,例如梅尔频率倒频谱(Mel-Frequency Cepstrum),用来做声音的辨认,侦测音高等。近年来梅耳倒频谱也被应用在音乐信息的回复。
  • 倒频谱在声学中可以将声带震动的影响去除。
  • 倒频谱用在处理多路径问题时(如声波回音电磁波的折、反射等),如果将其他路径干扰视为噪声,为了消除噪声,利用倒频谱,不需测量每条多路径的延迟时间,可以利用传送多次信号,观察其他路径在倒频谱上的效果,并且加以滤除。
  • 语音大致上是由音高、声带脉冲、声门波形所组成,我们可以利用倒频谱将这三种元素在倒频域上分开,以利于做语音信号的分析。
  • 倒频谱的微分适用于影像处理上的图形辨认(pattern recognition)。
  • 倒频谱与同型声音理论(homomorphic sound theory)有关。

倒频谱观念

频谱图上的独立变数是频率,而倒频谱图上的独立变数为倒频率(quefrency),倒频率是一种时间的度量单位。举个例子,声音信号采样速率等于44100赫兹,在倒频谱上有个很大的值在倒频率等于100,代表实际上在44100/100=441赫兹有很大的值,这值出现在倒频谱上因为频谱上周期性出现,而频谱上出现的周期与倒频谱很大的值出现的位置有关。

倒滤波器

滤波器(filter)常使用在频谱上,用来保存或删除我们所要或不要的信息,经过上面的许多讨论,不难猜到,倒滤波器(lifter)就是在倒频谱上所使用的滤波器。低通的倒滤波器跟低通滤波器有点类似,它可以借由在倒频谱上乘以一个window系数,使倒频谱上的高倒频率被压抑,如此依来,当信号转回时域空间时会变成一个较平滑的信号。

计算倒频谱的方法

直接计算IDTFT(反离散时间傅里叶变换)

 
问题:   可能会无限大, 且对于arg(x[n])有无限多个解

利用Z变换的零点与极点

先对信号做Z变换, 并整理一下系数, 让他变成下面的形式
 
其中 

分子:
第一项A是系数
第二项 是延迟
第三项是位于单位圆内的零点
第四项是位于单位圆外的零点

分母:
第一项是位于单位圆内的极点
第二项是位于单位圆外的极点

 取log变成 
 
假设r=0, 因为这只是延迟, 并不会破坏波形
根据Z变换所得到的系数, 我们可以利用泰勒展开得到Z的逆变换
 

注意事项
1. 总是IIR(无限冲激响应)
2.对于FIR(有限冲激响应)的情况,  

利用Z变换与微分

 
 
对其做Z的逆变换
 

 

分别对于x[n]的四种不同的状况做延伸
1.对于x[n]是因果(causal)和最小相位(minimum phase) i.e.  
对于 
可得出
 

 
2.对于x[n]是最小相位(minimum phase)
 
3.对于x[n]是反因果(anti-causal)且最大相位(maximum phase) i.e.  
 
4.对于x[n]是最大相位(maximum phase)
 

特性

1. 复数倒频谱至少以 的速度衰退
 
其中  
2. 如果X(Z)没有在单位圆以外的零点和极点, 则
 
因为 
3. 如果X(Z)没有在单位圆以内的零点和极点, 则
 
因为 
4. 如果x[n]是有限长度, 则 是无限长度

同态解卷积的应用(Application of Homomorphic Deconvolution)

同态解卷积有非常多应用面,尤其是在声学工程和语音分析方面的实用性

(1) 回声的均衡化

 
其中 是接收到的信号, 是原始信号, 是延迟的样本数, 是衰减系数
 是冲激响应,描述原始信号与回声信号之间的关系
 ,其中 是单位脉冲函数
 
系统函数  
透过对系统函数进行对数变换,简化回声成分的分析和处理
 
 变换到时域
 

(2) 声学工程

 ,其中 是合成音乐, 是原始音乐, 是冲激响应(例如建筑物空间的影响)

(3) 语音分析

透过在complex cepstrum domain中进行滤波,分离这些成分,使得对语音信号的理解和处理更为精确。
 ,其中 是语音波, 是全局波形, 是声道脉冲, 是音高,*是卷积

(4) 地震信号分析

(5) 任意波传播的多路径分析

梅尔频率倒频谱

梅尔频率倒频谱是倒频谱的一种应用,梅尔频率倒频谱常应用在声音信号处理,对于声音信号处理比倒频谱更接近人耳对声音的分析特性,而梅尔频率倒频谱与倒频谱的差别在于:

  1. 梅尔频率倒频谱的频带分析是根据人耳听觉特性所设计,人耳对于频率的分辨能力,是由频率的"比值"决定,也就是说,人耳对200赫兹和300赫兹之间的差别与2000赫兹和3000赫兹之间的差别是相同的。
  2. 梅尔频率倒频谱是针对信号的能量对数,而倒频谱是针对信号原始在频谱上的值取对数
  3. 梅尔频率倒频谱是使用离散余弦变换,倒频谱是用离散傅里叶变换
  4. 梅尔频率倒频谱系数足够描述语音的特征。


梅尔频率倒频谱系数(MFCCs)的推导步骤:

  1. 将信号做傅里叶变换
  2. 频谱上的值取绝对值再平方成为能量,在乘上频谱上对应的梅尔频率倒频谱三角重叠窗(window)的系数。
  3. 对每个梅尔频率取对数
  4. 离散余弦变换
  5. 求得梅尔频率倒频谱系数。

梅尔频率倒频谱应用

  • 梅尔频率倒频谱系数常利用在辨认语音技术上,例如辨认电话中说话的人的身份。
  • 利用每种乐风、或乐器在梅尔频域上有不同特性来分析音乐的种类与类型,并且可以加以分类。

噪声敏感性

梅尔频率倒频谱系数很容易被外来的噪声所破坏,因此有些研究结果指出,在求梅尔频率倒频谱系数时,在作离散余弦变换前,提升适当的能量(大约2或3倍),以减少噪声在低能量成分的影响。

梅尔频率倒频谱优点

相较于原始的倒频谱

  • 有绝对值平方

卷积

倒频谱领域上的一项重要的特性为二信号卷积之产生,其产生之程序为二倒频谱值(cepstra)之相加:

 



微分倒频谱(differential cepstrum)

定义

  

 
If  
 
 
 
 
优点: (a)没有模糊的相位 (b)可以处理延迟问题

特性

(1)微分倒频谱在shift和scaling时,结果不改变。
ex:  
 
(proof):
 
 
 
(2)复数倒频谱  与 微分倒频谱  和原信号x[n]有关
  diff cepstrum
  recursive formula
 复数频谱做得到的事情, 微分倒频谱也做得到
(3)如果x[n]是最小相位(minimum phase),则 ,当 
minimum phase 意思为 no poles 或 zeros 在单位圆外
(4)如果x[n]是最大相位(maximum phase),则 ,当 
maximum phase 意思为 no poles 或 zeros 在单位圆内
(5)如果x(n)为有限区间,则 为无限区间

  • 复数倒频谱的衰减率反比于n
  • 微分倒频谱的衰减率下降

 

范例

  •   ,otherwise 0 , Find its cepstrum.

 

step 1. Z transform:  
step 2. log:  
step 3. reverse Z transform:  

  •   ,otherwise 0 , Find its inverse cepstrum.

 

step 1. Z transform:  
step 2. exp:  
step 3. reverse Z transform:  

  • Suppose that an IIR filter is  

 

step 1. Z transform:  
step 2. log:  
step 3. reverse Z transform:  



参考文献

  1. B. P. Bogert, M. J. R. Healy, and J. W. Tukey: "The quefrency analysis of time series for echoes: cepstrum, pseudo-autocovariance, cross-cepstrum, and saphe cracking". Proceedings of the Symposium on Time Series Analysis (M. Rosenblatt, Ed) Chapter 15, 209-243. New York: Wiley, 1963.
  2. D. G. Childers, D. P. Skinner, R. C. Kemerait, "The Cepstrum: A Guide to Processing页面存档备份,存于互联网档案馆)," Proceedings of the IEEE, Vol. 65, No. 10, October 1977, pp. 1428-1443.
  3. Jian-Jiun Ding, Advanced Digital Signal Processing class note,the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2008
  4. Jian-Jiun Ding, Advanced Digital Signal Processing class note,the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2024