聲音的基礎(chǔ)知識
聲音的產(chǎn)生是由于物體的振動,造成空間內(nèi)空氣的波動而共鳴發(fā)音,再由大氣的傳播,使人的聽覺神經(jīng)感受到的一種物理現(xiàn)象。
聲音的三要素是響度,音調(diào)和音色。
響度,和聲音震動的幅度有關(guān),用的力越大,人的鼓膜震動幅度就越大,發(fā)出的聲音越響。
音調(diào),主要是和頻率有關(guān)。聲波的頻率越高,音調(diào)也越高。
音色在同樣的音調(diào)(頻率)和響度(振幅)下,鋼琴和小提琴的聲音聽起來是完全不相同的,因為它們的音色不同。
聲音傳播的介質(zhì)是固體、液體、氣體。介質(zhì)不同,傳播的速度也不同。真空的情況下聲音是無法傳播的。
數(shù)字音頻
對自然界的聲音(模擬信號)進行采樣,采樣就是根據(jù)奈奎斯特定理在時間軸上對信號進行數(shù)字化信號,即按照一定時間間隔△t 在模擬信號 x(t)上逐點采取其瞬時值。采樣率越高,聲音的還原程度越高,質(zhì)量就越好,同時占用空間會變大。
量化是用有限個幅度值近似原來連續(xù)變化的幅度值,把模擬信號的連續(xù)幅度變?yōu)橛邢迶?shù)量的有一定間隔的離散值。
編碼是按照一定的規(guī)律,把量化后的值用二進制數(shù)字表示,然后轉(zhuǎn)化成二值或多值的數(shù)字信號流。這樣得到的數(shù)字信號通過可以通過電纜,衛(wèi)星通道等數(shù)字線路傳輸。在接收端與上述模擬信號數(shù)字化過程相反,再經(jīng)過后置濾波再恢復(fù)成原來的模擬信號。
上面數(shù)字化的過程又叫做脈沖編碼調(diào)制,通常我們說的音頻的裸數(shù)據(jù)格式就是脈沖編碼調(diào)制(PCM)數(shù)據(jù)。描述一段 PCM 數(shù)據(jù)需要幾個量化指標,常用的量化指標是采樣率,位深度,字節(jié)序,聲道數(shù)。
采樣率(Sample rate):每秒鐘采樣多少次,以 Hz 為單位。
位深度(Bit-depth):表示用多少個二進制位來描述采樣數(shù)據(jù),一般為 16bit。
字節(jié)序:表示音頻 PCM 數(shù)據(jù)存儲的字節(jié)序是大端存儲(big-endian)還是小端存儲(little-endian),為了數(shù)據(jù)處理效率的高效,通常為小端存儲。
聲道數(shù)(channel number):當前 PCM 文件中包含的聲道數(shù),是單聲道(mono)、雙聲道。
-
音頻
+關(guān)注
關(guān)注
29文章
2879瀏覽量
81569 -
音視頻
+關(guān)注
關(guān)注
4文章
477瀏覽量
29882 -
數(shù)字化
+關(guān)注
關(guān)注
8文章
8748瀏覽量
61808
發(fā)布評論請先 登錄
相關(guān)推薦
評論