3.4 传统傅里叶变换缺点及时频分析的思想
一般信号都是随着时间的变化而发生变化,要深入理解信号的本质,需要从多个角度研究信号的不同表现方式。时域和频域是观察信号的两种方式,时域分析和频域分析技术也是目前信号处理的主要方法。时域分析方法完全是在时间域中分析信号,时间分辨率理论上可以达到无穷大,但频率分辨率为零,而频域分析方法则相反。一般在频域里分析信号可以得到更多的信息,因此以往人们更重视在频域内对信号加以分析。
自牛顿以来,人们笃信和向往世界的稳定性、规则性、和谐性以及本质上的简单性。傅里叶分析就体现了这种信念。基于傅里叶变换的信号频域表示及其能量的频域分布揭示了信号在频域上的特征。事实上,傅里叶变换是一个强有力的数学工具,它具有重要的物理意义,即信号的傅里叶变换表示信号的频谱。正是傅里叶变换这样重要的物理意义,决定了傅里叶变换在信号分析和信号处理中的独特地位,特别是它可作为平稳信号分析的最重要的工具。然而在实际应用中,所遇到的信号大多数并不是平稳的,至少在观测的全部时间段内它不是平稳的,所以随着应用范围的逐步扩大和理论分析的不断深入,傅里叶变换的局限性就渐渐展示出来。主要表现在如下三个方面。
1.传统傅里叶变换的时间分辨率为零
传统傅里叶变换的本质在于,它将一个任意的函数表示为一族标准函数的加权和,即正弦函数的加权和。其中的权函数便是原来函数的傅里叶变换。这样就将对原来函数的研究转化为对其权函数,即其傅里叶变换的研究。由于这些正弦函数的频率是固定不变的,并且其波形是无始无终的,因此不难看出,傅里叶分析只适于分析信号组成分量的频率不随时间变化的平稳信号,分析结果也仅能揭示一个信号是由多少个正弦波叠加而成的,以及各正弦波的相对幅度,但不能给出任何有关这些正弦波何时出现与何时消亡的信息。因此,经典的傅里叶分析是一种纯频域分析。理论上频率分辨率可以达到无穷大,但时域内无任何分辨能力,即时域信息完全丧失。傅里叶变换不能反映信号在各个指定时刻的附近所希望的任何频率范围内的频谱信息,这无论在理论上还是在实际中都带来了许多困难和不便。从理论上说,为了用傅里叶变换来研究一个时域信号的频谱特性,就必须获得信号在时域中的全部信息,甚至将来的信息。
2.传统傅里叶变换基于信号平稳的假设
对于平稳信号,时域分析和频域分析方法都是有效的。传统傅里叶变换的频谱分析是建立在信号平稳假设的基础上。然而,在许多实际应用场合,信号不是平稳的,其统计量是随时间变化的函数。许多天然的和人工的信号,诸如语音、生物医学信号、音乐、雷达和声呐信号、在色散媒质中传播的波、机械振动和动物叫声等都是典型的非平稳信号,其特点是持续时间有限,并且是时变的。对于这种时变信号,必须研究其在时域和频域中的全貌和局部性质,既要能总体上把握信号,又要能深入到信号局部中分析信号的非平稳性,这样才能提取更多的特征信息。这时,只了解信号在时域或频域的全局特性是远远不够的,希望得到的是信号频谱随时间变化的情况。
3.传统傅里叶变换在全频域范围内分辨率相同
因为一个信号的频率与它的周期成反比,所以在应用中,一个合理的要求是,对于待分析信号的高频信息,其参与分析的信号时间长度应相对较短,以给出精确的高频成分;而对于待分析信号的低频信息,参与分析的信号时间长度应相对较长,以给出一个周期内完整的信息。即要能给出一个对信号进行分析的灵活多变的时间和频率函数,使得由它给出的时域和频域的联合窗口函数宽度具有如下的制约关系:在中心频率高的地方,时间窗自动变窄,而在中心频率低的地方,时间窗应自动变宽。然而,傅里叶变换是一种整体变换,它在整体上将信号分解为不同的频率分量,而对信号的表征要么完全在时域,要么完全在频域。作为频域表示的功率谱,并不能反映出某种频率分量出现在什么时候以及其变化情况。此外,从应用的角度来看,如果一个信号只在某一时刻的一个小的范围内发生变化,那么信号的整个频谱都要受到影响,而频谱的变化从根本上来说又无法标定发生变化的时间位置和发生变化的剧烈程度,即傅里叶变换对信号的局部畸变没有标定和度量的能力。在许多实际的应用中,畸变正是我们所关心的信号在局部范围内的特征,比如对于音乐和语音信号,人们关心的是什么时候演奏什么音符、发出什么音节。
为了分析和处理非平稳信号,人们对傅里叶变换进行了推广,提出并发展了一系列新的信号分析理论。联合时频分析(简称时频分析)就是其中一种重要的方法。它着眼于真实信号组成成分的时变谱特征,将一个一维的时间信号以二维的时间-频率密度函数形式表示出来。时频分析的基本思想是设计时间和频率的联合函数,用该函数同时描述信号在不同时间和频率的能量密度和强度。这种分析方法旨在揭示信号中包含多少频率分量,以及每一分量是怎样随时间变化的。信号的时频表示方法是针对频谱随时间变化的确定性信号和非平稳的随机信号发展起来的。它将一维时域信号x(n)或频域信号X(ω)映射成为时间频率平面上的二维信号,即使用时间和频率的联合函数来表示信号,这种表示简称为信号的联合时频表示。
3.4.1 信号的时频表示
傅里叶谱和功率谱都是信号变换到频域的一种表示,对于频谱不随时间变化的确定信号及平稳的随机信号,可以用它们进行分析和处理。但当信号的频谱随时间变化时,它不能表示某个时刻信号的频谱分布情况,因此这种分析方法就存在着严重的不足。
针对频谱随时间变化的确定信号和非平稳随机信号,近年来出现了信号的时频域表示方法,如前面3.3节中介绍的短时傅里叶变换方法等。其目的是将一维的时间信号x(n)或频域信号X(ω)映射成时间-频率平面上的二维信号Px(n,ω)。这样,信号的瞬时能量和功率谱可以分别表示为
而信号在时频域n∈[n1,n2],ω∈[ω1,ω2]的能量成分表示为
可以根据函数Px(n,ω)计算在某一特定时间的频率密度,计算该分布的整体和局部的各阶矩等。然而,在寻求理想的时频表示方法时却遇到了很大的困难。因为理想的Px(n,ω)应该表示信号在时间频率点(n,ω)处的能量密度。然而,根据下面即将介绍的不确定性原理,不允许有“某个特定时间和频率处的能量”这一概念,这样理想的Px(n,ω)并不存在。因此,只能研究伪能量密度或时频结构,根据不同的要求和不同的性能去逼近理想的时频表示。
人们提出了多种时频表示方法,它们各有优缺点。这些时频表示方法主要有线性时频表示、二次时频表示以及其他形式的时频表示方法。
1.线性时频表示
这一类时频表示是由傅里叶谱演化而来的,其特点是变换为线性的。由于傅里叶谱具有线性变换的性质,如果信号之间满足线性关系,那么它们的谱函数之间同样满足这样的线性关系,即
则
其中,X(ω),X1(ω)和X2(ω)分别是x(n),x1(n)和x2(n)的傅里叶变换;a1和a2为常数。因此,由傅里叶谱演化而来的线性时频表示也同样满足这样的线性关系。当x1(n)和x2(n)的频谱是随时间变化时,其时频表示和是线性变换的,则有
其中,Px(n,ω)是x(n)的时频表示。
属于这类的时频表示主要有前面讲述的短时傅里叶变换与Gabor变换及小波变换等。其中,短时傅里叶变换和Gabor变换是一种加窗的傅里叶变换,使用固定大小的时频网格,时频网格在时频平面上的变化只限于时间平移和频率平移。在短时傅里叶变换和Gabor变换这两种时频表示中,窗函数宽度是固定的,其时频分辨率也是固定的,因此只适用于分析具有带宽固定不变的非平稳信号。而实际应用中,常希望在对低频成分分析时,频率的分辨率高一些;对高频成分分析时,时间的分辨率高一些;这就要求窗函数的宽度能随着频率变化而变化。小波变换的时频分析网格的变化除了时间平移外,还有时间和频率轴比例尺度的改变,它使用长宽大小不一的长方形时频分析网格,因而适用于分析具有固定比例带宽的非平稳信号。
2.二次时频表示
这类时频表示是由能量谱或功率谱演化而来的,其特点是变换为二次的(也称为双线性的)。能量谱或功率谱具有双线性变换特性,即当信号之间满足式(3-46)的线性关系,则能量谱函数之间为如下的双线性关系:
其中,ε(ω)、ε1(ω)与ε2(ω)分别为x(n)、x1(n)和x2(n)的能量谱;∗号表示对信号的频谱取共轭操作。这样,当x1(n)和x2(n)的频谱随时间变化时,根据能量谱或功率谱得到的时频表示和是二次的,则有
其中,Px(n,ω)是x(n)的时频表示;右边最后一项为交叉项或互项;为x1(n)和x2(n)的互时频表示。
维格纳分布是这类时频表示中非常重要的一种。除此之外,还有一些其他二次型能量化的时域表示,可以统一地由L.Cohen提出的广义双线性时频表示,即
其中,φ(ξ,τ)表示核函数,它决定Px(n,ω)的特性。
采用不同的核函数,将得到不同的时频分布。对核函数的要求是,希望既能压缩交叉干扰项,又能有好的特性。常用的Cohen类广义双线性时频分布有指数分布或称Choi-Williams分布、广义指数分布等。
3.其他时频表示
除了上述线性与二次时频表示外,还有一些其他形式的时频表示,如Cohen-Posch类正值分布,L.Stankovic等人在维格纳分布基础上提出的L-维格纳分布等。此外,比较重要的还有分数傅里叶变换等。在下面的章节中,将介绍现在应用研究中常见的几种线性时频表示方法:短时傅里叶变换、Gabor变换、小波变换及它们的联系与区别。
总之,对给定的信号x(n),人们希望能找到一个二维函数Px(n,ω),它应是人们最关心的两个物理量n和ω的联合分布函数,可以反映x(n)的能量随时间n和频率ω变化的形态,同时,又希望Px(n,ω)既具有好的时间分辨率,同时又具有好的频率分辨率。但这受到下面将介绍的不确定原理的制约。
3.4.2 不确定原理
在信号分析与信号处理中,信号的“时间中心”及“时间宽度(time-duration)”,以及频率的“频率中心”与“频带宽度(frequency-bandwidth)”是非常重要的概念。它们分别说明信号在时域和频域的中心位置及在两个域内的扩展情况。
如果分别用w(n)和W(ω)来作为信号的时域和频域表示,则可以用Δ(w)和Δ(W)来分别衡量它们的宽度,分别称为有效时域半径和有效频域半径。数值2Δ(w)和2Δ(W)称为窗口函数w(n)的有效时宽和有效频宽,而用E(w)和E(W)表示它们的中心。这里中心和半径分别表示为
信号在时间和频率这两个物理量的测量上有一个重要的约束原则,这就是著名的“不确定原理”,或称为“测不准原理”。它的意义是:信号波形在频率轴上的扩张和在时间轴上的扩张不可能同时小于某一界限,即若函数w(n)和W(ω)构成一对傅里叶变换,则它们不可能同时都是短宽度的,即
若w(n)及其傅里叶变换W(ω)满足窗口函数的条件,则
这里等号成立的充分必要条件是w(n)为高斯函数,即。
下面证明这一定理。如果将w(n)的导函数的傅里叶变换记为W′(ω),那么由傅里叶变换的性质可以得到
于是,由著名的柯西-施瓦茨(Cauchy-Schwarts)不等式得
所以
在上面推导过程中,等号成立的条件就是Cauchy-Schwarts不等式成为等式的条件,最后,通过解微分方程可以得到全部的证明。
不确定原理是信号处理中的一个重要的基本定理,该定理指出,对给定的信号,其时宽与带宽的乘积为一常数。当信号的时宽减小时,其带宽将相应增大,当时宽减到无穷小时,带宽将变成无穷大,例如时域的δ函数;反之亦然,例如时域的正弦信号。即信号的时宽与带宽不可能同时趋于无限小,这一基本关系就是前面几节中所讨论过的时间分辨率和频率分辨率的制约关系。在这一基本关系的制约下,人们在竭力探索既能得到好的时间分辨率,又能得到好的频率分辨率的信号分析方法。