Alex Zatsman, Mark Rossman, Rich Greene, Will Hooper, Phil Halmark, Bill Valentine, 和 David Skolnick
ADV601是一款低成本、單芯片、全數字、專用功能CMOS VLSI芯片,用于實時壓縮和解壓縮數字視頻信號。它可以支持高達 350:1 的壓縮率,對自然圖像進行基本上無損的 4:1 壓縮。ADV601支持所有常見的隔行掃描視頻格式(見表1)。該器件針對要求以低成本實時壓縮的視頻應用進行了優化,并具有廣播級質量的應用,如非線性視頻編輯、視頻捕獲系統、遠程閉路電視監控、便攜式攝像機、高質量電話會議和視頻分發系統、視頻插入設備、圖像和視頻存檔系統以及數字錄像帶。除壓縮和解壓縮外,ADV601的子帶編碼架構還提供視頻縮放和空間濾波的固有支持。
表 1.ADV601 場速率和尺寸
標準 | 活動區域 | 場速率 | 像素率 | |
水平 | 垂直 | (赫茲) | (兆赫) | |
CCIR-601/525 |
720 | 243 | 59.94 | 13.50 |
CCIR-601/625 |
720 | 288 | 50.00 | 13.50 |
平方像素/525 |
640 | 243 | 59.94 | 12.27 |
平方像素/625 |
768 | 288 | 50.00 | 14.75 |
由于具有里程碑意義的標準已經以JPEG,H.261,MPEG 1和MPEG 2的形式存在,我們是否需要新的壓縮范式?簡而言之,是的。在許多封閉系統應用中,成本、圖像質量和靈活性比互操作性(標準的優勢)更重要。對于不需要互操作性的應用程序,壓縮解決方案的選擇應由這些因素的評估以及對稱性(編碼(壓縮)和解碼(解壓縮)的低成本和復雜性來驅動。以下對小波壓縮及其在ADV601中的作用的概述應該有助于理解它可以為視頻壓縮應用帶來的價值。
圖1
圖1顯示,在編碼模式下,ADV601通過其視頻接口接受分量數字視頻,并通過主機接口輸出壓縮比特流。在解碼模式下,情況正好相反:ADV601在其主機接口上將壓縮的比特流轉換為視頻接口上的分量數字視頻。主機可通過主機接口訪問ADV601的所有控制和狀態寄存器。
ADV601編解碼器的壓縮算法基于雙正交小波變換,由7抽頭高通和9抽頭低通濾波器組成,并實現與場無關的子帶編碼。子帶編碼器將二維空間視頻數據轉換為空間頻率濾波子帶。然后使用可調量化和熵編碼過程來提供壓縮(見圖2)。
圖2
ADV601基于小波理論,小波理論是一種新的數學工具,在1980年代中期Morlet和Grossman的地球物理學著作中首次明確引入。[1]這一理論很快在理論物理和應用數學中流行起來;80年代末和90年代,小波在信號和圖像處理中的應用急劇增長。[2,3,4,5]
了解小波內核是理解小波在視頻應用中的優勢的關鍵。設備的這一部分包含濾波器和抽取器,可在水平和垂直方向上處理圖像。濾波器基于精心挑選的分段小波基函數,如圖 3 所示。這些基函數具有 3 個主要優點:與傅里葉變換的正弦波相比,它們與圖像的寬帶性質的相關性更好;ADV601可以通過簡單、緊湊的7抽頭和9抽頭FIR濾波器(低成本硅的關鍵)實現這些功能;這些功能提供全圖像過濾,從而消除壓縮圖像中出現的塊狀偽影,當圖像被分解成更小的區域進行單獨壓縮時(在某些應用程序中,JPEG 和 MPEG* 都可能受到此偽影的影響)。
圖3
*壓縮基于聯合圖像專家組和電影專家組的標準。
濾波樹涉及二維(x 和 y)數據的連續高通和低通濾波,每一步抽取 2(圖 4a),從而產生連續更小的數據塊,組合在 Mallat 圖 (4b) 中。所有三個組件(例如,Y,Cb,Cr)的彩色視頻信號場交替通過過濾器樹,以創建總共42個新圖像(14個代表Y,14個代表Cr,C 為 14b).
圖 4a
圖 4b
圖 5 顯示了變換對黑白圖像(僅亮度)執行的操作示例。在這種情況下,ADI公司總部映像已轉換為14個新映像,每個映像包含有關原始映像的不同信息集。人們可以清楚地看到塊A中高通x濾波產生的垂直邊緣,塊D中高通y濾波產生的水平邊緣,以及塊N中抽取和低通濾波產生的縮小尺寸的原始圖像。 用于描述顯示的 14 個塊的數據點總數與原始圖像中使用的數據點總數相同。.但是現在圖像已經轉換,我們可以做一些有用的事情:1)實現幾乎無損的壓縮,2)以恒定質量或恒定比特率實現有損壓縮,3)在沒有計算開銷的情況下創建高質量的縮放圖像,以及4)創建容錯的壓縮位流,因為每個塊都包含有關整個圖像的信息。
圖 5b
圖6顯示了在無損模式下使用ADV601的方案。在這種情況下,42 個轉換后的塊被發送到 2 種類型的無損熵編碼器。熵編碼器受益于在轉換后的塊中發現的相關性增加。在這種操作模式下,壓縮性能與原始的復雜程度有關。如果原始圖像是簡單的斜坡,則除左上角最小的塊 (N) 外,所有塊都將包含零。這將產生超過 300:1 的無損壓縮(對于每秒 0 場的 5:4:2 編碼 CCIR2 分辨率視頻,需要不到 601.60M 位/秒)。但是,如果圖像是白噪聲,則沒有相關機會,并且壓縮必須接近1:1(需要大約168M位/秒)。在典型的真實視頻應用中,壓縮范圍從 2:1 (84Mb/s) 到 5:1 (16Mb/s),具體取決于每個場的復雜性。在需要近乎無損壓縮的應用中,如果允許比特率大幅波動,ADV601可以在此模式下使用。
圖6
圖7顯示了如何在有損壓縮模式下使用ADV601。在轉換圖像時,將提取所有 42 個塊的一組統計信息,包括每個塊的平方和(或能量)、最小像素值和最大像素值。這些信息進入量化器,并與人類視覺模型耦合,該模型將每個塊的重要性與人類視覺系統聯系起來。量化器算法獲取所有這些信息,加上用戶編程的比特率,并為每個字段計算 42 個值“箱寬度”;它們可以被認為是每個塊的精度預算。當輕微量化(即許多小量子)時,這個數字會很大。重量化(很少有大量子)導致數量少得多。下面有兩個示例來幫助說明其工作原理。實際量化器位于ADV601上,但主機或外部DSP執行箱寬計算。
Figure 7
第一種情況是高質量的應用程序,需要視覺無損壓縮,同時保持準確的比特率。在這種情況下,所有低頻段(較小的塊)都將被賦予最大的箱寬,以確保完美的重建。根據圖像的復雜性,高頻帶(最大的塊)將獲得可以分配的盡可能多的箱寬度。在這種情況下,為了保持所需的比特率,會放棄少量的高頻信息精度。這并不構成一個難題,因為人類視覺系統無法將高空間頻率分辨到與低空間頻率相同的水平。已經表明,人眼無法檢測到具有光量化的頻率塊(即使使用廣播級質量的視頻播放設備也是如此)。
在第二種情況下,需要極高的壓縮率(超過 100 比 1)。這意味著必須消除每個字段中99%的位!在這里,只有最小的塊才能獲得較大的箱寬。剩余的位預算散布在其余塊上,由箱寬分配器確定。僅基于每個字段中的信息的典型壓縮方案通常在高壓縮時失敗;因此,ADV601保持圖像相關信息的能力非常出色。當該算法以350:1的足球序列進行測試時,可以清楚地識別動作,甚至可以讀取球員制服上的數字。如此高的壓縮比下的視頻質量并不適合所有應用,但對于視頻序列識別和監控來說綽綽有余。
那么,當壓縮比太高而無法準確渲染圖像時,使用小波的偽像是什么樣子的呢?隨著壓縮比的增加,越來越多的噪聲被注入高空間頻率;由于描述高頻的精度較低,這些頻段的噪聲會增加。因此,小波視頻壓縮會像傳統的廣播模擬視頻一樣降低。雖然視頻中的偽像從來都不令人愉悅,但人類已經高度習慣于接受這種類型的偽影。由于ADV601允許控制每個子頻段的增益,因此可以通過使圖像“柔和”來降低噪聲。大多數其他壓縮方案將圖像分解為更小的塊,每個塊都單獨處理。隨著壓縮的增加,出現的第一個偽影是放置在圖像頂部的塊的固定網格。人們普遍認為,這種阻塞偽像比高頻噪聲或圖像柔化更能引起人類視覺系統的反感。
圖8
圖8是ADV601的功能框圖,圖9顯示了如何在典型的基于主機的ADV601應用中使用它。ADV601視頻接口設計用于所有常用的模擬視頻解碼器和編碼器,包括ADI公司、飛利浦、布魯克特里和雷神公司的解碼器和編碼器。視頻接口還能夠直接連接到所有符合CCIR656標準的并行設備(也稱為“D1”)。表1顯示了ADV601支持的場速率和鏡像尺寸。DRAM管理器為256Kx16快速頁面模式DRAM提供無膠合接口,這是在編碼和解碼模式下支持ADV601所必需的。通用主機接口的寬度可配置為 8 位、16 位和 32 位。主機接口還包括一個 512x32 位 FIFO,有助于實現壓縮視頻數據的流暢傳輸。
圖9
ADI公司為支持ADV601而開發的完整Windows視頻驅動程序包中,基于主機的軟件驅動程序包可幫助ADV601計算每個場的42個箱寬值。ADI公司還為Windows 95開發了一款名為Videolab的即插即用PCI板,用于評估ADV601的視頻質量。
ADV601還可用于獨立應用,借助ADSP21xx類DSP計算每個字段的箱寬值。ADV601 DSP串行接口支持與ADI公司所有DSP的無縫接口。
ADV601JS采用160引腳PQFP封裝,工作溫度范圍為0至+70°C商用溫度范圍。
社會背景:
-
CMOS
+關注
關注
58文章
5722瀏覽量
235635 -
寄存器
+關注
關注
31文章
5355瀏覽量
120541 -
VLSI
+關注
關注
0文章
73瀏覽量
42925
發布評論請先 登錄
相關推薦
評論