數字信號有自身相應的缺點,即存儲容量需求的增加及傳輸時信道容量要求的增加。以CD為例,其采樣率為44.1 kHz,量化精度為16 bit,則1 min的立體聲音頻信號需占約10 MB的存儲容量,也就是說,張CD唱盤的容量只有1 h左右。
當然,在帶寬高得多的數字視頻領城這一問題就顯得更加突出。是不是所有這些比特都是必需的呢?研究發現,接采用PCM碼流進行存儲和傳輸存在非常大的冗余度。事實上,在無損的條件下對聲首至少可進行4:1壓縮,即只用25%的數字量保留所有的信息,而在視頻領域壓縮比甚至可以達到幾百倍。因此,為利用有限的資源,壓縮技術從一出現便受到廣泛的重視。
信號(數據)之所以能進行壓縮,是因為信號本身存在很大冗余度。根據統計分析結果,音頻信號中存在著多種冗余,其主要部分可分別從時域和頻域來考慮。另外,由于音頻主要是給人聽的,所以考慮人的聽覺機理,也能對音頻信號實行壓縮。
1、時城冗余
音頻信號在時城上的冗余主要表現為以下幾個方面:
(1)幅度分布的非均勻性
統計表明,在大多數類型的音頻信號中,小幅度樣值出現的概率比大幅度樣值出現的概率要高。人的語音中,間歇、停頓等出現了大量的低電平樣值;實際講話的功率電平也趨向于出現在編碼范圍的較低電平端。
(2)樣值間的相關性
對語音波形的分析表明,相鄰樣值之間存在很強的相關性。當采樣頻率為8 kHz時,相鄰樣值之間的相關系數大于0.85。如果進步提高采樣頻率,則相鄰樣值之間的相關性將更強。因此,根據較強的維相關性,可以利用差分編碼技術進行有效的數據壓縮。
(3)周期之間的相關性
雖然音頻信號分布于20 Hz ~ 20 kHz的頻帶范圍,但在特定的瞬間,某一聲音卻往往只是該頻帶內的少數頻率成分在起作用。當聲音中只存在少數幾個頻率時,就會像某些振蕩波形一樣,在周期與周期之間存在著一定的相關性。利用音頻信號周期之間的相關性進行壓縮的編碼器,比僅僅利用鄰近樣值間的相關性的編碼器效果好,但要復雜得多。
(4)靜止系數
兩個人之間打電話,平均每人講話時間為通話時間的一半,并且在這一半的通話過程中也會出現間歇停頓。分析表明,話音間隙使全雙工話路的典型效率約為40% (或稱靜止系數為0.6)。?顯然,話音間隔本身就是一種冗余,若能正確檢測出這些靜止段,可“插空”傳輸更多信息。
(5)長時自相關函數
統計樣值、周期間的一些相關性時,在20 ms時間間隔內進行統計的稱為短時自相關函數。如果在較長的時間間隔(如幾十秒)內進行統計時,則稱為長時自相關函數。長時統計表明,當采樣頻率為8 kHz時,相鄰的樣值之間的平均相關系數可高達0.9。
2、頻域冗余
音頻信號的頻域冗余主要表現為以下幾個方面:
(1)長時功率譜密度的非均勻性
在相當長的時間間隔內進行統計平均,可以得到長時功率譜密度函數,其功率譜呈現明顯的非平坦性。從統計的觀點看,這意味著沒有充分利用給定的頻段。或者說存在固有的冗余度。功率譜的高頻成分能量較低。
(2)語音特有的短時功率譜密度
語音信號的短時功率譜,在某些頻率上出現“峰值”,而在另一些頻率 上出現“谷值”。這些峰值頻率,也就是能量較大的頻率,通常稱其為共振峰頻率。共振峰頻率不止一個,最主要的是前三個,由它們決定不同的語音特征。另外,整個功率譜也是隨頻率的增加而遞減的。更重要的是整個功率譜的細節以基音頻率為基礎,形成了高次諧波結構。
3、聽覺冗余
人是音頻信號的最終用戶,因此,要充分利用人類聽覺的生理和心理特性對音頻信號感知的影響。利用人耳的頻率特性靈敏度以及掩蔽效應,可以壓縮數字音頻的數據量。
①可以將會被掩蔽的信號分量在傳輸之前就去除,因為這部分信號即使傳輸了也不會被聽見。
②可以不理會可能被掩蔽的量化噪聲。
③可以將人耳不敏感的頻率信號在數字化之前濾除,如語音信號只保留300 -3 400 Hz的信號。
編輯:jq
-
噪聲
+關注
關注
13文章
1125瀏覽量
47503 -
音頻信號
+關注
關注
9文章
263瀏覽量
33582 -
函數
+關注
關注
3文章
4345瀏覽量
62902 -
PCM碼
+關注
關注
0文章
2瀏覽量
5294
原文標題:音頻冗余的主要表現形式
文章出處:【微信號:xunwei201508,微信公眾號:訊維官方公眾號】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論