音樂信號時頻分析 (英語:Time–frequency analysis for music signals )為時頻分析 應用之一。音樂聲音可以比人聲更加複雜,佔用更寬的頻帶,音樂信號為隨時間變化的信號,只使用單純的傅立葉變換 無法清楚分析,所以利用時間-頻率分析做更有效的分析工具。時頻分析為傳統傅立葉變換延伸版。短時距傅立葉變換 、加伯轉換 與維格納分佈 最被廣泛使用之時頻分析方法,對於分析音樂信號也相當管用。
音樂信號相關基礎知識
音樂為在一個時間週期內具有穩定頻率的聲音,音樂可以通過幾種方法來產生,例如,鋼琴的聲音由撞擊琴弦產生的,小提琴的聲音由彎曲琴弦產生的。所有音樂的聲音都有其基頻與色彩,基本頻率是諧波系列的最低頻率,在一個週期信號,基頻為週期長度的倒數,而泛音的頻率是基頻的整數倍。在音樂理論 裡,音準代表對聲音感知的基頻,然而實際的基頻可能因感知基頻的不同而不同。
短時距傅立葉變換
圖1 "Chord.wav"的波型[哪裡?]
圖2 "Chord.wav"之加伯轉換
圖3"Chord.wav"之頻譜圖
連續型短時距傅立葉變換
短時距傅立葉變換為時頻分析之基本類型,如果有一個連續的信號x (t ),我們可以從下方等式計算短時距傅立葉變換
S
T
F
T
{
x
(
t
)
}
≡
X
(
t
,
f
)
=
∫
−
∞
∞
x
(
τ
)
w
(
t
−
τ
)
e
−
j
2
π
f
τ
d
τ
{\displaystyle \mathbf {STFT} \left\{x(t)\right\}\equiv X(t,f)=\int _{-\infty }^{\infty }x(\tau )w(t-\tau )e^{-j2\pi f\tau }\,d\tau }
w (t ) 為一窗函數 ,當 w (t )為方波時, 此轉換被稱為離散之方波短時距傅立葉變換 。當 w (t ) 為高斯函數 時, 此轉換被稱為加伯轉換。
離散型短時距傅立葉變換
一般的音樂信號通常為不連續信號,所以無法使用公式去計算離散之方波短時距傅立葉變換,將原本型式改為
X
(
n
Δ
t
,
m
Δ
f
)
=
∑
p
=
n
−
Q
n
+
Q
x
(
p
Δ
t
)
e
−
j
2
π
p
m
Δ
t
Δ
f
Δ
t
{\displaystyle X(n\,\Delta t,m\,\Delta f)=\sum _{p=n-Q}^{n+Q}x(p\,\Delta t)e^{-j2\pi pm\,\Delta t\,\Delta f}\,\Delta t}
令
t
=
n
Δ
t
{\displaystyle t=n\,\Delta t}
,
f
=
m
Δ
f
{\displaystyle f=m\,\Delta f}
,
τ
=
p
Δ
t
{\displaystyle \tau =p\,\Delta t}
,
B
=
Q
Δ
t
{\displaystyle B=Q\,\Delta t}
.
短時距傅立葉變換有些限制如下
Δ
t
Δ
f
=
1
N
,
{\displaystyle \Delta t\,\Delta f={\frac {1}{N}},}
,N'為整數
N
≥
2
Q
+
1
{\displaystyle N\geq 2Q+1}
Δ
<
1
2
f
max
{\displaystyle \Delta <{\frac {1}{2f_{\max }}}}
,
f
max
{\displaystyle f_{\max }}
為最高頻率
s
p
e
c
t
r
o
g
r
a
m
(
t
,
f
)
=
|
S
T
F
T
(
t
,
f
)
|
2
{\displaystyle \mathbf {spectrogram} (t,f)=\left|\mathbf {STFT} (t,f)\right|^{2}}
雖然頻譜圖非常有用,但仍然有一個缺點,頻率刻度為線性,但是音階頻率的變動為對數成長。
維格納分布
維格納分布亦可用來分析音樂信號,其優點為高清晰度,但是需要高度計算,並具有交叉項的問題,所以它更適合於在同一時間內,並且不超過一個頻率的狀況下分析信號。
W
x
(
t
,
f
)
=
∫
−
∞
∞
x
(
t
+
τ
/
2
)
x
∗
(
t
−
τ
/
2
)
e
−
j
2
π
τ
f
d
τ
,
{\displaystyle \mathbf {W} _{x}(t,f)=\int _{-\infty }^{\infty }x(t+\tau /2)x^{*}(t-\tau /2)e^{-j2\pi \tau \,f}\,d\tau ,}
x (t )為其原訊號。
参考资料