第四章 噪音 | Noise
在英文中,noise (噪音)指的是不想要的或是令人不悅的聲音。在訊號處理的領域裡,它有兩個不同的意思:- 如同英文的意思,它意指不想要的訊號。如果兩個訊號互相干擾,彼此都會認為是噪音。
- 噪音也可以被認為是有許多頻率成份的訊號,所以它沒有諧波結構。我們在前幾章的週期訊號會有諧波結構。
4.1 不相關噪音 | Uncorrelated noise
最簡單來瞭解噪音的方式就是製造它,最容易製造的噪音就是「不相關均勻噪音 uncorrelated uniform noise (UU noise)」。Uniform 均勻,指的是訊號的值是均勻分佈的隨機值,也就是在範圍中的每個值出現機率都一樣。uncorrelated 不相關,指的是每個值都獨立,不互相影響。也就是知道一個值之後,也沒有訊息可以預測其他的值。
UU noise 的程式碼如下:
class UncorrelatedUniformNoise(_Noise):
def evaluate(self, ts):
ys = np.random.uniform(-self.amp, self.amp, len(ts))
return ys
UncorrelatedUniformNoise 繼承 _Noise。而 _Noise 繼承 Signal。照舊,evaluate 依照 ts 來計算對應的訊號值 ys。它使用 np.random.uniform,這是從均勻分佈產生值的函式。在這個例子裡,數值範圍從 -amp 到 amp。
接下來的例子是產生一個 UU noise,持續時間 0.5 秒,取樣率每秒 11025 次。
signal = thinkdsp.UncorrelatedUniformNoise()
wave = signal.make_wave(duration=0.5, framerate=11025)
如果你播放這個波,這聽起來像是你調收音機時,在兩個頻道之間的聲音。圖4.1 顯示這波形的長像,它看起來很隨機。圖4.2:不相關均勻噪音的能量頻譜
spectrum = wave.make_spectrum()
Spectrum.plot_power 類似於 Spectrum.plot,只是它畫的是能量密度而不是振幅。功率密度是振幅的平方。我這章從振幅換到功率,是因為在討論噪音時這樣比較方便。圖4.2 顯示了結果,跟訊號的波形相同,頻譜也看起來很隨機。事實上,隨機這個字必須更精確定義。在噪音訊號或頻譜這方面,至少有三件事要知道:
- 分佈:隨機訊號的分佈由一組可能的值與裡面的值出現的機率所組成。例如,在均勻噪音的訊號,值的範圍是從 -1 到 1,所有的值出現的機率都相同。另外一種分佈是高斯噪音,值的範圍是負無窮大到正無窮大,但是接近 0 的值有比較高的出現機率,兩端下降的機率則依照高斯曲線(或說鐘形曲線)
- 相關性:在訊號中的每個值是否獨立於其他的值,或是它們彼此相依?在 UU noise,值是獨立的。另一個相關性的例子是布朗噪音,每個值,都是前一個值的總和再加上隨機的一個步進值。所以如果訊號的值在某個特定點是高的,我們可以預期它接下來還是高的,如果原來是低的,也會預期它會留在低處。
- 功率與頻率的關係:在 UU noise 的頻譜裡,每個頻率的功率是與分佈相同。也就是說平均功率對於所有頻率來說是一樣的。與之不同的一個例子是 pink noise,它的功率與頻率有相反的關係,也就是在頻率 f 的功率會正比於 1/f。
4.2 積分頻譜 | Integrated spectrum
對於 UU noise 來說,使用積分頻譜,我們可以比較清楚看到功率與頻率的關係。積分頻譜會是頻率的函數,隨著頻率增加而顯示到某頻率的功率的累積和。圖4.3:不相關均勻噪音的積分頻譜
Spectrum 提供了一個方法計算積分頻譜 IntegratedSpectrum:
def make_integrated_spectrum(self):
cs = np.cumsum(self.power)
cs /= cs[-1]
return IntegratedSpectrum(cs, self.fs)
self.power 是 numpy 的 array,包含每個頻率的功率。np.cumsum 則是計算功率的累積和。把每個值除以最後一個元素值,做正規化的動作讓積分頻譜的值落在 0 到 1 之間。回傳的是 IntegratedSpectrum,這是類別的定義:
class IntegratedSpectrum(object):
def __init__(self, cs, fs):
self.cs = cs
self.fs = fs
像 Spectrum 物件一樣,IntegratedSpectrum 提供 plot_power,所以我們可以畫出功率的積分頻譜:integ = spectrum.make_integrated_spectrum()
結果就顯示在圖4.3,它是個直線,代表每個頻率的功率平均來說是常數,是個定值。在每個頻率有一樣功率的噪音,叫做「white noise 白噪音」。這是把它類比於光,光若是所有的頻率都有且量都一樣時,看起來是白的。4.3 布朗噪音 | Brownian noise
UU noise 說是不相關,是指它的每個值都與其他值無關。一個有相關的例子是「布朗噪音 Brownian noise」,裡面的每個值都是前值的總和再加一個隨機步進值。
會叫做布朗,是類比於布朗運動。國中應該學過,一個微粒在液體裡看起來像是隨機的運動,因為它被液體裡看不見的作用而影響。布朗運動常用「隨機行走 random walk」來描述,這是一個路徑的數學模型,步進值是隨機分佈。
class BrownianNoise(_Noise):
def evaluate(self, ts):
dys = np.random.uniform(-1, 1, len(ts))
ys = np.cumsum(dys)
ys = normalize(unbias(ys), self.amp)
return ys
evaluate 使用 np.random.uniform 產生一個不相關訊號,然後 np.cumsum 計算它們的累積和。因為加總會讓值離開 -1 到 1 範圍,所以需要 unbias 讓平均值移動到 0,最後 normalize 調整上下值到想要的最大振幅的值。
要產生 BrownianNoise 物件且畫一個波形,程式碼如下:
signal = thinkdsp.BrownianNoise()
wave = signal.make_wave(duration=0.5, framerate=11025)
圖4.4 顯示這個結果,波形忽高忽低,接連的值都有很明顯的相關性。當振幅是高的,它傾向保持在高,反之亦然。圖4.5:布朗噪音的頻譜畫在線性座標圖與 log-log 對數座標圖上
如果你畫了布朗噪音的頻譜放在線性座標圖上,像圖4.5 左圖。幾乎功率都在低頻,若用線性座標畫,高頻部份幾乎看不到。
為了要看清楚頻譜的形狀,我們可以把功率密度與頻率畫在 log-log 比例,也就是對數座標圖上:
spectrum = wave.make_spectrum()
spectrum.plot_power(low=1, linewidth=1, alpha=0.5)
thinkplot.config(xscale='log', yscale='log')
結果顯示在圖4.5 的右圖,功率與頻率的關係有點亂,但接近直線。Spectrum 提供 estimate_slope 方法,它使用 scipy 計算最小平方差來擬合(fit)功率頻譜:
#class Spectrum
def estimate_slope(self):
x = np.log(self.fs[1:])
y = np.log(self.power[1:])
t = scipy.stats.linregress(x,y)
return t
它忽略頻譜的第一個成份,因為這個成份對應到 f=0,log0 是無定義的。estimate 回傳 scipy.stats.linegress 的結果,它是一個物件,包含了斜率與截距的估計值、判定係數(coefficient of determination )、p-值、標準差。在這裡我們只需要斜率。
對布朗噪音來說,功率頻譜的斜率大約是 -2 (第九章會知道為什麼)。所以我們可以寫下這個關係式:
是功率, 是頻率, 是直線的截距,它現在對我們來說不重要。兩邊都取指數,會得到:
是 ,這裡我們還是先不討論它。重要的是,功率與 成正比,這是布朗噪音的特徵。
布朗噪音也叫做紅噪音,與白噪音一樣的原因。如果把可見光依照功率正比於的關係組合起來,多數功率會出現在頻譜的低頻位置,那是紅光。布朗噪音在英文也有人寫成 “brown noise”,我想這會讓人誤會,所以就不這樣寫。
4.4 粉紅噪音 | Pink Noise
圖4.6:β=1 的 pink noise 的波形
這個指數 2 沒有什麼特別。那讓我們改成比較通用的寫法,讓我們可以用任意的指數值 β 產生噪音:
在 β = 0 的時候,對於所有的頻率來說,功率是常數,產生的就是白噪音。當 β = 2 的時候,產生的是紅噪音。
那麼,β 在 0 跟 2 之間呢?產生的是白與紅之間的噪音,所以叫做「pink noise 粉紅噪音」
有幾個方法可以產生粉紅噪音,最簡單是產生白噪音,然後用個低通過濾器,濾出想要的成份。thinkdsp 提供一個類別:
class PinkNoise(_Noise):
def __init__(self, amp=1.0, beta=1.0):
self.amp = amp
self.beta = beta
amp 是想要的振幅,beta 是上面的公式的指數值。PinkNoise 提供 make_wave 來產生 Wave 物件:def make_wave(self, duration=1, start=0, framerate=11025):
signal = UncorrelatedUniformNoise()
wave = signal.make_wave(duration, start, framerate)
spectrum = wave.make_spectrum()
wave2 = spectrum.make_wave()
return wave2
duration 是波持續的時間,start 是波開始的時間,會在這裡是為了保持介面的一致,所有的 noise 的介面都會長成一樣,但對隨機噪音而言,這項用不到。framerate 是每秒取樣的數目。圖4.7:白、粉紅、紅噪音的頻譜,畫在 log-log 對數座標上
make_wave 產生白噪音的波,計算它的頻譜,設定好過濾器的指數值,執行過濾的動作。然後再從頻譜轉回波,然後調整偏置與正規化到想要的振幅。
Spectrum 提供的 pink_filter 如下:
def pink_filter(self, beta=1.0):
denom = self.fs ** (beta/2.0)
denom[0] = 1
self.hs /= denom
pink_filter 把每個頻譜的元素都除以 。因為功率是振幅的平方,這樣等於是每個頻率的功率都除以 。因為頻率 0 的元素需要特別處理,一部份為了要避免除以 0 的問題,一部份因為此元素是訊號的偏置。最後偏置我們會調整到 0。圖4.6 顯示最後的結果,跟布朗噪音一樣,它也是忽上忽下與前值有相關,但它看起來又比較隨機。在下一章,我們會回頭再觀察它,屆時會更精確地說明相關性與隨機。
最後,圖4.7 顯示白、粉紅、紅噪音在同一張對數圖上,指數 β 與圖上的斜率的關係也顯示在圖上。
4.5 高斯噪音 | Gaussian noise
我們開始時是介紹 UU noise (不相關均勻噪音),並且說明 UU noise 之所以叫白噪音是因為從頻譜來看,每個頻率的功率是一樣的。
但當人們談到白噪音,不見得都是 UU noise。事實上,他們更常指的是所謂的「不相關高斯噪音 uncorrelated Gaussian(UG) Noise」。
thinkdsp 提供 UG noise 的實作:
class UncorrelatedGaussianNoise(_Noise):
def evaluate(self, ts):
ys = np.random.normal(0, self.amp, len(ts))
return ys
np.random.normal 會回傳 numpy array,裡面的值是高斯分佈。這例範例是要平均值為 0,標準差為 self.amp。在理論上,值的範圍是從負無窮大到無窮大,但我們預期 99% 的值會在 -3 與 3 之間。UG noise 在很多地方跟 UU noise 很像。在頻譜上,每個頻率的功率平均來說是相同的,所以 UG 也是白的。它還有另一個有趣的性質,UG noise 的頻譜也是 UG noise。更精確地說,頻譜的實部與虛部也是不相關高斯值。
為測試這個宣告,我們可以產生 UG noise 的頻譜,然後產生 “normal probability plot”(常態機率圖)。用這種圖形化方式來驗證是否一個分佈是高斯分佈。
signal = thinkdsp.UncorrelatedGaussianNoise()
wave = signal.make_wave(duration=0.5, framerate=11025)
spectrum = wave.make_spectrum()
NormalProbabilityPlot 由 thinkstats2 提供,它也在這本書附的程式碼中。如果你不熟悉常態機率圖,你可以閱讀 ThinkStats 的第五章。http://thinkstats2.com/圖4.8 顯示了結果,灰線顯示由資料擬合成一個直線模型,而深色線顯示資料。
在常態機率圖裡,一條直線表示資料來自高斯分佈。除了一些隨機變化的情況,這些直線滿直的,這表示 UG noise 的頻譜是 UG noise。
UU noise 的頻譜也是 UG noise,至少是相近。事實上,依據中央極限原理,大多數的不相關噪音的頻譜,都近似高斯分佈,只要分佈有有限的平均值與標準差,而且取樣數目夠大。
4.6 練習
