您需要1080p視頻圖像嗎?到達那里需要許多部件,包括昂貴的新鏡頭,相機,存儲等。但是,如果您在路徑中有H.264或H.265等壓縮,則不會獲得您支付的費用。原因如下。
高清錄像機通常使用壓縮來減小視頻剪輯文件大小,以適應(yīng)小型存儲。如果您的相機(源)和錄像機、存儲或顯示器(目標(biāo))相距超過 500 英尺,則可能會使用壓縮來傳輸視頻。實際上,壓縮會損害源圖像的許多方面。分辨率是另一種降級效果。
MPEG H.264 和 H.265 壓縮編碼器分析視頻序列中的每個圖像,以創(chuàng)建參考幀和差分幀,以滿足系統(tǒng)所連接的傳輸或存儲容量的比特率限制。所有框架基本上都分為不同大小的塊的馬賽克。塊大小取決于每個鑲嵌區(qū)域中影像的細節(jié)內(nèi)容。參考系被劃分為宏塊。每個宏塊由一系列圖像樣本組成 - 亮度(亮度)和色度(顏色) - 由相機使用正在使用的采樣系統(tǒng)(例如4:2:2)提供。塊大小為 8×8、16×16 和 32×32。H.265 編碼器還可以合并大型低細節(jié)區(qū)域中相鄰的宏塊。該工具有助于H.265的50%壓縮效率。編碼器用于確定塊大小以及塊是否可以合并的標(biāo)準(zhǔn)是特定編碼器的功能,不受任何標(biāo)準(zhǔn)的控制。這就是為什么人們可以看到符合H.264和H.265規(guī)范的編碼器之間的圖像質(zhì)量差異的部分原因。
然而,圖像被劃分為宏塊,每個塊都通過離散余弦變換(DCT)。DCT基本上將宏觀塊的空間輪廓轉(zhuǎn)換為二維(2D)頻率陣列。左上角代表“DC” - 即具有一定亮度的無輪廓區(qū)域。右下角表示數(shù)組中可以表示的最高頻率等值線。DCT 提供了一個系數(shù),在應(yīng)用此數(shù)組的每個元素來重建宏塊的原始輪廓時,可以使用該系數(shù)。零值不使用 元素。系數(shù)可以是任何值,正負(fù)值,并且是DCT的輸出。
在單維空間中,這種方法在概念上類似于如何將時域信號(波形)轉(zhuǎn)換為頻域。使用從方波的傅里葉變換(振幅和相位)得出的系數(shù),可以將原型正弦波陣列相加以重建時域波形(圖)。由于離散變換不是連續(xù)頻譜,因此無論陣列的大小如何,重建中都內(nèi)置了量化誤差(所示的元素提供了256個元素,可用于重建8×8像素陣列的亮度輪廓)。
[圖3|使用從方波的傅里葉變換導(dǎo)出的系數(shù),可以將原型正弦波陣列相加以重建時域波形式。
顏色樣品(鉻和Cb)的處理方式相同。大多數(shù)攝像機可提供 4:2:2 采樣圖像。這樣做的困難是圖像樣本是矩形的(兩個亮度樣本共享一個色度樣本)而不是正方形。為了簡化處理,大多數(shù)編碼器會將傳入的 4:2:2 采樣轉(zhuǎn)換為 4:2:0 采樣,其中 4 個亮度樣本共享一個色度樣本。這樣做時,會出現(xiàn)一些細節(jié)損失和顏色偏移。這在直接比較信號時可以觀察到。從 4:2:2 轉(zhuǎn)換為 4:2:0 采樣可有效地將像素位深度從 20 位減少到 15 位。數(shù)字圖像分辨率為三維、行數(shù)、每行像素數(shù)和位深度。雖然每行的像素數(shù)和行數(shù)保持不變,但位深度減少了,這已被證明可以通過限制動態(tài)范圍來減少精細的圖像細節(jié)。也就是說,高對比度區(qū)域?qū)⒃馐茏畲蟮募毠?jié)損失。
編碼器(壓縮器)還負(fù)責(zé)管理輸出比特率,以確保視頻和數(shù)據(jù)流可以可靠地傳輸?shù)狡渥罱K目的地。一個工具是管理宏塊大小。影像的區(qū)域(如天空)將沒有太多的輪廓,因此 DCT 的許多系數(shù)將等于或接近于零。可以使這些區(qū)域越大,零系數(shù)就越多。長時間的零系數(shù)可以很好地壓縮而不會丟失數(shù)據(jù)(熵編碼階段)。零系數(shù)越大,可以實現(xiàn)的熵壓縮就越多。
門檻
編碼器可用的另一個工具是調(diào)整值閾值,其中任何低于某個值的絕對幅度的 DCT 系數(shù)都設(shè)置為零。這里的策略是,解碼反向DCT數(shù)組中具有小系數(shù)的元素將在生成的宏塊重建輪廓中引入小誤差。由于可用的傳輸比特率受到限制,編碼器可以增加系數(shù)閾值,從而產(chǎn)生更多的零值,從而增加熵相位壓縮比。
圖 4 模擬了 8×8 宏塊陣列(64 個元素)中圖像系數(shù)的直方圖。有些系數(shù)非常小。編碼器可以根據(jù)數(shù)組系數(shù)的值調(diào)整閾值以消除數(shù)組的元素。這些元素是重建宏塊輪廓的小貢獻者。當(dāng)然,隨著此閾值的增加,源宏塊輪廓與重建輪廓之間的誤差也會增加。該效應(yīng)類似于前面所示的方波的頻率到時域重建。也就是說,如果頻率從總和中下降,則波紋出現(xiàn)在正方形的頂部,并且上升和下降斜率偏離原始輸入。
[圖4|8x8 宏塊數(shù)組中圖像系數(shù)的直方圖。
輪廓因宏塊而異,因此效果隨輪廓而變化。在具有復(fù)雜等值線的宏塊中,采樣的有效帶寬通常會降低(零系數(shù))。從視覺上看,這可以將宏塊中的精細細節(jié)轉(zhuǎn)換為模糊。但是,閾值設(shè)置到什么級別取決于傳送視頻和數(shù)據(jù)流所需的總比特率。因此,編碼器將根據(jù)DCT階段后圖像流的聚合比特率來設(shè)置閾值。在任何宏塊中,閾值可以消除很少(如果有的話)數(shù)組點;在其他情況下,它可能會消除許多。在圖5中的圖像序列中,中間圖像是最左側(cè)圖像的重建。在此示例中,請注意背景中的樂譜。在這種情況下,閾值消除了宏塊陣列中足夠多的高頻分量,以支持傳輸比特率,即樂譜上的細節(jié)被抹去(比較區(qū)域用紅色圈出)。壓縮完成后,此信息將永久丟失。
隨著宏塊大小的增加,重新創(chuàng)建樂譜的輪廓的復(fù)雜性也會增加。然而,與打印它的紙張的直流水平和陰影相比,這些元素產(chǎn)生的DCT系數(shù)更小。防止這種信息丟失的唯一方法是減小目標(biāo)距離處宏塊的大小,以降低輪廓的復(fù)雜性。這可以通過減小宏塊本身的大小(32×32到16×16或8×8)或增加放大倍率來實現(xiàn)。增加放大倍率可以減小宏塊在圖像中覆蓋的目標(biāo)區(qū)域。
表示 64 個原始視頻像素的 8×8 數(shù)組被替換為按閾值濾波的 DCT 系數(shù)。MPEG標(biāo)準(zhǔn)定義了如何將這些信息傳達給解碼器。解碼器現(xiàn)在只有要執(zhí)行的濾波數(shù)據(jù),并反轉(zhuǎn)DCT來重新創(chuàng)建像素陣列輪廓。解碼后的圖像是這些重新創(chuàng)建的輪廓(宏塊)縫合在一起的馬賽克。在這里,可以將算法應(yīng)用于解碼的馬賽克以隱藏接縫。該算法沒有標(biāo)準(zhǔn)化,通常是解碼器供應(yīng)商與主觀圖像質(zhì)量相關(guān)的差異化因素。
在圖 5 中,從左到右是原始圖像,從漸變宏塊的馬賽克重新創(chuàng)建的解碼圖像,以及去塊后的相同馬賽克,其中馬賽克元素的邊緣被弄臟。
除了丟失的細節(jié)之外,還會對宏塊周圍的區(qū)域進行著色以隱藏邊界。此過程進一步修改原始圖像數(shù)據(jù)。當(dāng)作為單個圖像捕獲時,修改是永久性的。污跡本身可能因解碼器而異,并導(dǎo)致站點之間的精細細節(jié)差異,圖像捕獲與圖像捕獲。
您如何將所有這些與分辨率丟失聯(lián)系起來?當(dāng)反向DCT陣列的高頻元件被移除時,邊緣細節(jié)變得模糊。模糊性可以被認(rèn)為是隨著高頻元件被移除以滿足比特率限制而逐漸散焦鏡頭。
但是,哪些細節(jié)受到損害?它重要嗎?答案是規(guī)模問題。在 1080×1920 圖像中,我們知道 16×16 宏塊像素在圖像幀上占的百分比,但更重要的是宏塊輪廓的復(fù)雜性。復(fù)雜性在很大程度上取決于目標(biāo)范圍內(nèi)宏塊的圖像區(qū)域中的內(nèi)容。
為了說明比例影響,圖6模擬了目標(biāo)處的微距區(qū)域,鏡頭變焦位置會影響微距區(qū)域中的細節(jié)。左側(cè)表示任意鏡頭設(shè)置。右圖表示以較窄的視場 (FOV) 查看同一區(qū)域。如您所見,左圖中突出顯示的宏塊(紅色)的復(fù)雜性遠遠大于FOV較小的同一宏塊的復(fù)雜性。在左圖中,閾值的增加將沖刷掉男人眼睛周圍的細節(jié)。在右圖中,同一宏塊的輪廓不太復(fù)雜。在DCT完成后,它將產(chǎn)生較少的有效系數(shù),因此在解碼過程中保留了大部分細節(jié)。
[圖6|鏡頭變焦位置會影響微距區(qū)域的細節(jié)。
什么是分辨率損失?答案很復(fù)雜:它依賴于圖像,宏塊縮放依賴于比特率。影響哪些細節(jié)還取決于宏塊中的內(nèi)容。話雖如此,人們可以將其與宏塊大小以及可用比特率和存儲容量相關(guān)聯(lián),可用比特率越低,宏塊區(qū)域必須在目標(biāo)圖像處表示越小,以保留來自源的原始像素提供的相同或幾乎相同的細節(jié)。
需要更多的變焦和更好的光學(xué)元件來提供解碼器側(cè)具有相似細節(jié)的圖像,這會導(dǎo)致在此過程中圖像分辨率損失。分辨率損失是不可恢復(fù)的,因為由編碼側(cè)的DCT創(chuàng)建的2D元素在編碼過程中永遠丟失,這些元素被歸零以滿足比特率限制。
假設(shè)一個1080p相機被用來查看500英尺外的物體。如果將 1000 mm 鏡頭與 25 mm 傳感器一起使用,則 FOV 約為 1.5 度。目標(biāo)范圍內(nèi)覆蓋的水平距離約為160英寸(13英尺)。此范圍內(nèi)的每個像素將覆蓋 0.08 英寸或大約 0.007 英寸2.8×8 宏塊覆蓋約 0.43 英寸2.0.007英寸圖像的復(fù)雜程度是多少2與 0.43 英寸相比2圖像區(qū)域?顯然,宏塊覆蓋的區(qū)域越小,細節(jié)損失就越低。相反,為了補償壓縮編碼器的細節(jié)損失,比特率越低,所需的放大倍率就越大。在指定視頻傳送路徑中包含壓縮的系統(tǒng)時,要求必須考慮這些效果。如果魔鬼在細節(jié)中,那么細節(jié)就很重要。全分辨率單幀照片是分析或證據(jù)保留的一個組成部分。隨著視頻記錄儀器(VRI)的最新創(chuàng)新,現(xiàn)在可以捕獲未壓縮的HD-SDI視頻,零色移,量化誤差或DCT系數(shù)損失。
審核編輯:郭婷
-
顯示器
+關(guān)注
關(guān)注
21文章
4990瀏覽量
140140 -
編碼器
+關(guān)注
關(guān)注
45文章
3651瀏覽量
134775
發(fā)布評論請先 登錄
相關(guān)推薦
評論