采样定理

采样定理数字信号处理领域的重要定理。定理内容是连续信号(通常称作“模拟信号”)与离散信号(通常称作“数字信号”)之间的一个基本桥梁。它确定了信号带宽的上限,或能捕获连续信号的所有信息的离散采样信号所允许的采样频率的下限。

图1:带宽限制的函数的傅里叶变换的模

严格地说,定理仅适用于具有傅里叶变换的一类数学函数,即频率在有限区域以外为零(参照图1)。离散时间傅里叶变换泊松求和公式的一种形式)提供了实际信号的解析延拓,但只能近似该条件。直观上我们希望,当把连续函数化为采样值(叫做“样本”)的离散序列并插值到连续函数中,结果的保真度取决于原始采样的密度(或采样率)。采样定理介绍了对带宽限制的函数类型来说保真度足够完整的采样率的概念;在采样过程中"信息"实际没有损失。定理用函数的带宽来表示采样率。定理也导出了一个数学上理想的原连续信号的重构公式。

该定理没有排除一些并不满足采样率准则的特殊情况下完整重构的可能性。(参见下文非基带信号采样,以及压缩感知。)

奈奎斯特–香农采样定理的名字是为了纪念哈里·奈奎斯特克劳德·香农。该定理及其在插值理论中的原型曾被奥古斯丁-路易·柯西埃米尔·博雷尔雅克·阿达马夏尔-让·德拉瓦莱·普桑埃德蒙·泰勒·惠特克弗拉基米尔·亚历山德罗维奇·科捷利尼科夫等人发现或研究[1]:1-4。所以它还叫做奈奎斯特–香农–科捷利尼科夫定理惠特克–香农–科捷利尼科夫定理惠特克–奈奎斯特–科捷利尼科夫–香农定理插值基本定理

简介

采样是将一个信号(例如时间或空间上连续的函数)转换为数字序列(时间或空间上离散的函数)的过程。这个定理的香农版本陈述为:[2]

如果周期函数 x(t) 不包含高于 B cps(次/秒)的频率,那么,一系列小于 1/(2B) 秒的x(t)函数值将会受到前一个周期的x(t)函数值影响。

因此 2B 样本/秒或更高的采样频率将能使函数不受干扰。相对的,对于一个给定的采样频率 fs,完全重构的频带限制为 Bfs/2。

在频带限制过高(或根本没有频带限制)的情形下,重构表现出的缺陷称为混叠。现在对于此定义的陈述有时会很小心的指出x(t)必须不包括频率恰好为B正弦曲线,或是B必须小于½的采样率。这二个门槛,2Bfs/2会称为奈奎斯特速率英语Nyquist rate奈奎斯特频率。这些是x(t)及采样设备的属性。上述的不等式会称为奈奎斯特准则,有时会称为拉贝准则(Raabe condition)。此定理也可以用在其他定义域(例如离散系统)的函数下,唯一的不同是量测t, fsB的单位。

 
正规化的Sinc函数:sin(πx) / (πx) ...其中央峰值在x= 0,其他整数值的x时为零交越点

符号 T = 1/fs 常用来表示二次采样之间的时间间隔,称为采样周期或是采样区间。函数x(t)的采样常用x[n] = x(nT)表示(较早期的文献会用xn),其中n为正整数。在数学上理想的采样还原(插值)和Sinc函数有关,每次的采样都用中心点在采样时间nT,幅度是采样值x[n]的Sinc函数代替。最后将Sinc函数加总,得到连续的函数。数学上等效的方式是将Sinc函数和一连串的狄拉克δ函数卷积,再依采样到的值来加权。不过这些方式在数学上都是不实际的。不过有些有限长度的函数可以近似Sinc函数,这种因为近似的不完美造成的误差称为插值误差(interpolation error)。

实际的数字模拟转换器既不会产生加权而有延迟的Sinc函数,也不会产生理想的狄拉克δ函数,若是其模拟重建是用零阶保持,其输出的是由不同幅度及有延迟的矩形函数组成的阶跃函数,一般后面会有抗镜像滤波器(anti-imaging filter)来清除假的高频成分。

混叠

 
二个正弦波的频率不同,但其采样值相关,其中至少有一个的频率超过采样率的一半

如果不能满足上述采样条件,采样后信号的频率就会重叠,即高于采样频率一半的频率成分将被重建成低于采样频率一半的信号。这种频谱的重叠导致的失真称为混叠,而重建出来的信号称为原信号的混叠替身,因为这两个信号有同样的样本值。

x(t)为一函数,其傅里叶变换X(f)为:

 

泊松求和公式指出x(t)的采样x(nT)足以产生X(f)的周期和英语periodic summation,结果为:

  Eq.1
 
图4:X(f)(上图蓝色部分)及XA(f)(下图蓝色部分)是二个不同函数x(t)及xA(t)(原函数省略不列出)的连续傅里叶变换。当二个函数以fs的速率采样时,且确认信号的离散傅里叶变换(DTFT)时,其镜相(image,绿色部分)会和变换后信号(蓝色部分)叠加。在这个假设的例子中,二函数的离散傅里叶变换相同,表示采样到的信号也相同,可是在采样前的原函数是不同的。若这是声音频号,x(t)和xA(t)听起来是不一样的,可是其以fs速率的采样是一样的,因此最后重制的声音是相同的,xA(t)是x(t)在此采样率下的混叠(alias)

是一个周期函数,等效为傅里叶级数,系数为Tx(nT)。此函数也称为数列Tx(nT)的离散时间傅里叶变换 (DTFT),n为整数。

如图4所示,X(f) 的拷贝被平移了 fs 的倍数,并相加合并。对于一个带限函数(对所有 |f| ≥ BX(f) = 0),在 fs 足够大的时候,这些拷贝之间仍然分得清楚。但如果奈奎斯特准则并不满足,相邻部分就会重叠,一般就不能明确辨别出 X(f)。任何超过 fs/2 的频率分量都会与较低的频率分量难以区分,称作与其中一个拷贝发生“混叠”。在这种情况下,通常的插值法就会产生混叠,而不是原始的分量了。

以下两种措施可避免混叠的发生:

  1. 提高采样频率,使之达到最高信号频率的两倍以上;
  2. 引入低通滤波器或提高低通滤波器的参数;该低通滤波器通常称为抗混叠滤波器

当采样率预先由其他因素(如行业标准)确定的时候,x(t) 通常要先滤波以将高频分量减少到可以接受的水平,再进行采样。所需的滤波器的种类为低通滤波器,而在这种应用中叫做抗混叠滤波器。抗混叠滤波器可限制信号带宽,使之满足采样定理的条件。这在理论上是可行的,但是在实际情况中不可能做到。因为滤波器不可能完全滤除奈奎斯特频率之上的信号,所以,采样定理要求的带宽之外总有一些“小的”能量。不过抗混叠滤波器可使这些能量足够小,以至可忽略不计。

 
图5:Xs(f)是由适当带宽滤波器滤波后的信号,其频谱(蓝色)和其相邻的DTFT镜像(绿色)不会重叠。brick-wall低通滤波器H(f)可以移除镜像,留下原始的频谱X(f),由采样后的信号还原为(滤波后)的原始信号

由泊松求和的特例来推导

从图5中可以看到,若X(f)的复本(也称为镜像)之间没有和k = 0的项重叠,可以由Xs(f)用以下的乘积来还原:

       where:
 

此时证明了采样定理,因此X(f)可以确定x(t),而且只有唯一解。

剩下的就只有推导重构的公式。H(f)不需在[B, fsB]的区域有准确的定义,因为Xs(f)在此区域为零。不过最坏的情形是B = fs/2,奈奎斯特频率。一个在此情形及其他较轻微的条件下都适用的函数为:

 

其中rect(•)为矩形函数,因此:

 
       (根据上面的 Eq.1
      [3]

等式二侧逆变换,可以得到惠特克-香农插值公式英语Whittaker–Shannon interpolation formula

 

上式就是用采样值x(nT)来重构x(t)的方式。

  • fs大于所需值,也就是T较小,称为过采样(oversampling),由图5可以看出过采样对重构信号没有任何效果,但可以提供一块“转态区”,此区域内的H(f)可以是一些非零的值。相反的,欠采样英语Undersampling会造成混叠,一般而言无法重构原始信号。
  • 理论上,插值公式可以用低通滤波器来实现,其冲激响应为sinc(t/T),输入为 ,即为一个被采样信号调制过的脉冲序列英语Dirac comb函数。实际的数字模拟转换器(DAC)会用零阶保持器英语zero-order hold来近似,此时过采样可以减少近似的误差。

香农的原始证明

泊松证明了Eq.1中的傅里叶级数会产生 X(f) 的周期求和,不管 fsB 是什么值。然而香农只推导了 fs = 2B 情形下级数的系数。 几乎引用了香农原始的论文:

   的频谱。则
   
 
因为假设在频带   以外   为零。若我们令
 
其中 n 为任意正整数或负整数,我们得到
 
在等式左边的是 在采样点的数值,右边的积分在本质上可以视为是 n次系数,以–BB为其基础周期[note 1]。这表示 的采样值也决定了 傅里叶展开的第n次系数。对于比B低的频率,若其傅里叶系数确定了, 也就确定了,而在高于B的频率,其数值为零,因此整个 都可以确定。因为一函数的频谱若确定了,其函数也就确定了,因此 可以完全的决定原始函数,也就表示原始的采样可以完整的决定函数 

香农对于此定理的证明已经完成了,不过香农进一步探讨用Sinc函数重构原函数,也就是今日的惠特克–香农内插公式英语Whittaker–Shannon interpolation formula,他没有推导或是证明sinc函数的性质,但这些对于当时阅读其作品的工程师不会觉得陌生,因为当时已经知道矩形函数Sinc函数的傅里叶对关系。

 为第n个采样点,则函数 可以表示为:
 

和其他证明类似,此处假设原函数的傅里叶变换存在,因此证明中没有说明采样定理是否可以延伸到有限带宽的固定随机过程。

脚注

  1. ^ 实际的系数包括一个系数 ,因此香农系数为 ,和Eq.1相符。

在多变量信号及图形上的应用

 
图6:采样不足的图,会出现莫列波纹
 
图7

采样定理常表示为单一变量的函数,因此定理可以直接应用到和时间相关的一维信号。不过采样定理可以直接延伸到任意数量变量的函数。例如像灰阶影像常表示为二维的实数数组(或是矩阵),其中的实数表示在对应行及列的采样位置下,像素的相对强度。因此图案会需要二个独立的变量来表示其位置,一个表示对应的行,一个表示对应的列。

彩色影像一般会包括三个独立的灰阶值,分别表示红色、绿色及蓝色等三原色(三原色光模式,简称RGB)的强度。其他用三个元素的向量表示一个点的颜色空间有HSL和HSV色彩空间CIELABXYZ等。而像CMYK则是用浅蓝色、紫红色、黄色及黑色的强度来表示。这些色彩空间都是二维空间上的向量值函数

和一维离散信号的情形类似,若图形的采样分辨率(或是像素密度)不适当,可能会有混叠的情形。例如密条纹衬衫若是用的数值若是用数字相机的图像传感器采样时,可能会造成混叠,这种二维的混叠会形成莫列波纹,改善方式是提高空间的采样率,例如拍照时更靠近衬衫,用高清晰度的传感器,或是在采样前先进行光学模糊处理。

另一个例子是右边的方格条纹,上方的图是不满足采样定理下的信号。下方则是先经过低通滤波器再降采样,得到一个较小,但没有莫列波纹。上图则是直接降采样,没有先经过低通处理后的图。

采样定理在影像上的应用需小心的进行。例如相机中标准影像传感器(CCD或CMOS)的采样程序和理想的采样程序有相当的差距,理想的采样程序会在一个点量测其影像强度,但影像传感器中为了获得足够的光量,其感测影像的区域较。换句话说,传感器是一个有限宽度的点扩散函数。一般而言这类传感器采样到的模拟光学信息不是有限带宽的,而不理想的采样本身即为低通滤波器,不过不一定可以移除会造成混叠的高频噪声。若采样区域(传感器大小)没有大到可以有反锯齿效果时,一般会需要独立的反锯齿滤镜(光学低通滤镜)来使影像模糊。虽然影像有这些和采样定理有关的问题,不过采样定理可以描述提升采样及减采样的基础。

 
图8:一组在临界频率的弦波,采样时都是反复出现的+1和–1,他们都是彼此的混叠信号,甚至其频率还没超过采样率的一半

临界频率

为了描述fs > 2B的必要性,考虑右图(图8)中的一组弦波,公式如下,但θ值各有不同:

 

其中fs = 2B或是可以写为T = 1/(2B),采样值为:

 

和θ值无关。上述的歧义是采样定理中使用严格的不等式,不允许等式的原因。

对于非基带信号的采样

香农曾提到[2]

若频带的最小值不是零,而是由其他较大的值,也可以产生类似的结果,可以用线性变换(对应物理上的单边带调制)到最小值为零的频带来证明。此例中基本脉冲是单边带调制下的sin(x)/x

因此这是一个针对没有基带成分信号(其频带有一部分的信号非零,但此宽度又和最大频率无关)进行采样的充份条件。

带通条件为X(f) = 0,针对在所有在开区域范围以外的非负f

 

针对某非负整数N。此公式包括一般的基带条件,N=0。

对应的内插函数为理想Sinc带通滤波器的冲激响应,(而不是之前用的理想Sinc低通滤波器),会切掉频带的上方及下方,这也是一组低通滤波器冲激响应的差:

 

其他的推广,例如信号在数个不连续的频带,也是可行的。甚至是最广义的采样定理也不一定有一个可能正确的反例。也就是说无法确定是否只要不满足采样定理,就一定会有信号的丧失。不过以工程的角度来看,比较保守的作法是假设若不满足采样定理,就很可能会有信号的丧失。

非均匀采样

香农的采样定理可以延伸到非均匀采样,也就是采样的时间间隔非一定值。非均匀采样的采样定理指出针对band-limited的信号,只要平均采样频率满足奈奎斯特条件,就可以从采样信号完整重建原始信号[4]。因此虽然均匀采样在信号重建的算法上比较简单,但这不是完整重建的必要条件。

非基带及非均匀采样的泛用理论是在1967年由亨利·蓝道提出[5]。简单的说,蓝道证明了平均采样率至少需要是信号占据带宽的二倍,但前提是已知信号的频谱及其占据的带宽。 在1990年代末期,此研究已延伸到信号占据带宽的数量已知,但实际在频谱上位置未知的情形[6]。在2000年代已利用压缩感知发展了一个完整的理论。此理论用信号处理的语言写成,在2009年的论文中发表[7]。论文中证明,若频率的位置未知,则采样率需至少为奈奎斯特准则的二倍。换句话说,因为不知道光学频谱的位置,需要将采样率乘二为代价。注意此最小采样率的要求不一定保证其数值稳定性

欠采样

当一个信号被欠采样英语Undersampling时,必须满足采样定理以避免混叠。为了满足采样定理的要求,信号在进行减采样操作前,必须通过一个具有适当截止频率的低通滤波器。这个用于避免混叠的低通滤波器,称为抗混叠滤波器

在奈奎斯特速率以下,有额外限制条件的采样

奈奎斯特–香农采样定理是对于带限函数采样及重建的充分条件。若是用惠特克–香农内插公式英语Whittaker–Shannon interpolation formula重建原信号,奈奎斯特准则也是避免混叠的必要条件,因为若采样速率小于信号频带限制的二倍,可能有些信号无法正确重建。不过若信号有其他的限制,则奈奎斯特准则就不是混叠的必要条件了。

像近来在进行研究的压缩感知就是一个利用对信号额外假设来进行压缩的例子,压缩感知可以用奈奎斯特速率要慢的速率采样,然后可以完整的重建原信号。这特别用在信号在一些层面较稀疏(或可压缩)的情形。像压缩感知可以处理有效带宽(EB))很低,但不确定其频率分布位置的信号(此时采样定理就不适用了)。换句话说,其频谱较稀疏。若用采样定理,最小的采样速率是2B,若是用压缩感知,采样速率若略低于2EB,仍可以完整的重建。不过此作法的重建已不再是用公式处理,而是要求解凸优化,需要有良好研究,而可能是非线性的方式处理。

历史背景

哈里·奈奎斯特1928年的论文《Certain topics in telegraph transmission theory》中就已隐含了采样定理,他证明了一个带宽为B的系统可以发送最多2B个独立的脉冲,不过他没有直接处理连续信号采样及重建的问题。同一时期的卡尔·库普夫米勒英语Karl Küpfmüller证明了类似的结果[8],也讨论到频带限制滤波器的sinc函数冲激响应,以及其积分,步阶响应的三角积分,频带限制滤波器及信号重建滤波器是采样定理的核心,因此在一些地区会将这二个滤波器称为Küpfmüller filter。

采样定理是在香农在1949年《Communication in the presence of noise》中提出。之前相关的研究有V. A. Kotelnikov英语弗拉基米爾·科捷利尼科夫在1933年《在电缆及"以太"中电子通信的传输能力》(翻译自俄文),以及数学家埃德蒙·泰勒·惠特克在1915年的《Expansions of the Interpolation-Theory》(Theorie der Kardinalfunktionen)、J. M. Whittaker在1935年的《Interpolatory function theory》以及丹尼斯·加博尔1946年提出的《Theory of communication》。1999年时爱德华莱茵基金会英语Eduard Rhein Foundation给予科捷利尼科夫基础研究奖,原因是“第一位提出理论正确的采样定理”[9]

相关条目

参考资料

  1. ^ John J. Benedetto, Paulo J. S. G. Ferreira (编). Modern Sampling Theory: Mathematics and Applications. Applied and Numerical Harmonic Analysis. Boston, MA, USA: Birkhäuser. 2001. ISBN 978-0-8176-4023-1 (英语). 
  2. ^ 2.0 2.1 , "Communication in the presence of noise", Proc. Institute of Radio Engineers, vol. 37, no. 1, pp. 10–21, Jan. 1949. Reprint as classic paper in: Proc. IEEE, vol. 86, no. 2, (Feb. 1998) 互联网档案馆存档,存档日期2010-02-08.
  3. ^ sinc函数依照傅里叶变换表的202行及102行
  4. ^ Nonuniform Sampling, Theory and Practice (ed. F. Marvasti), Kluwer Academic/Plenum Publishers, New York, 2000
  5. ^ Landau, H. J. Necessary density conditions for sampling and interpolation of certain entire functions. Acta Math. 1967, 117 (1): 37–52. doi:10.1007/BF02395039. 
  6. ^ see, e.g., Feng, P. Universal minimum-rate sampling and spectrum-blind reconstruction for multiband signals. Ph.D. dissertation, University of Illinois at Urbana-Champaign. 1997. 
  7. ^ Mishali, Moshe; Eldar, Yonina C. Blind Multiband Signal Reconstruction: Compressed Sensing for Analog Signals. IEEE Trans. Signal Processing. March 2009, 57 (3). CiteSeerX: 10.1.1.154.4255 . 
  8. ^ Küpfmüller, Karl. Über die Dynamik der selbsttätigen Verstärkungsregler. Elektrische Nachrichtentechnik. 1928, 5 (11): 459–467 (德语).  (English translation 2005)页面存档备份,存于互联网档案馆).
  9. ^ Basic Research Award 1999 互联网档案馆存档,存档日期2015-02-02.

外部链接