作者:余成偉,陸建華,鄭君里
在H.264/AVC編碼器中,由于采用了固定長度的圖像組(GOP)結構,不能有效地處理視頻序列中的場景切換,導致場景切換幀后續各幀編碼質量嚴重下降。為了有效解決該問題。提出一種自適應的碼率控制算法,通過場景切換的快速檢測方法檢測視頻序列中的場景切換,在場景切換幀處終止當前COP并對GOP層的碼率分配算法做出修正。仿真結果表明:采用該算法可以有效地降低場景切換對后續帖編碼質量的影響,而且合理地分配碼率資源,提高了整個視頻序列的編碼質量。在相同碼率條件下,整體編碼質量可以提高0.3~O.5 dB。
碼率控制技術在帶寬受限的多媒體通信系統中具有重要的作用。傳統的視頻通信碼率控制算法,如H.264/AVC編碼器中采用的碼率控制算法,在將碼率資源分配到圖像組(GOP)中各幀圖像時,僅僅考慮了各幀圖像自身的復雜度,而忽視了同GOP中各幀圖像之間的相關性,如對含有頻繁場景切換的視頻序列進行編碼時,GOP中某幀圖像可能因出現場景切換而與其參考幀之間毫無相關性,如果仍然采用傳統的碼率控制方法,將導致圖像編碼資源浪費和編碼質量的下降。
本文提出一種自適應改變GOP長度的碼率控制算法,可以有效地節省碼率資源,并且能夠有效地提高場景切換幀后續各幀的編碼質量和序列整體的編碼質量。
1 碼率控制技術與視頻場景切換
由于視頻序列中I、P及B幀編碼后產生的比特數不一樣,為了使輸出碼流速率與信道速率相匹配,提高信道利用率,一般在編碼器和信道之間加一個緩沖區,而緩沖區容量大小與通信時延的要求構成了一對新的矛盾,碼率控制的目的就是為了解決這一矛盾。對于編碼器來說,一個魯棒的碼率控制算法應該在充分利用帶寬資源和保證緩沖區不溢出的前提下,將有限的碼率資源進行合理分配,獲得盡可能好的編碼質量。
當視頻序列中出現場景切換時,其編碼質量將受到影響,影響程度取決于場景切換幀在其所處GOP中的位置。當場景切換發生在I幀時,由于I幀采用幀內編碼模式,場景切換對于I幀本身不會產生任何影響,同時也不會對后續幀的預測編碼產生影響;由于B幀為雙向預測,只要其前后2個參考幀有1幀與其處于同一場景中(假設序列中沒有連續2幀同時發生場景切換),其預測編碼的精度仍然能夠得到保證,編碼質量不會受到很大影響。不同于I幀和B幀,當場景切換發生在P幀,對當前GOP編碼質量的影響相當大:首先,由于當前P幀與其參考幀處于不同的場景中,幀間預測編碼將完全失效,宏塊必須通過RDO(rate-distortion optimiza-tion)模式選擇后才采取幀內編碼,優化過程極大浪費了編碼時間;其次,由于絕大多數宏塊采用幀內編碼模式,占用了大量的碼率資源,使得后續各幀由于碼率資源缺乏而編碼質量下降,此影響還會延續至后續的GOP。
圖1給出了一個有5處場景切換的測試序列(詳見2.3節)在80 kb/s碼率條件下各幀編碼比特曲線和Y分量PSNR(峰值信噪比)曲線。同時,表1也給出了場景切換幀前10幀和后10幀Y分量平均PSNR值數據及其變化值。由圖中(虛線表示場景切換幀位置)可以看出,在場景切換時,當前幀將占用較多編碼比特資源,從而導致后續幀由于碼率資源缺乏而PSNR值下降,詳細數據可見表1。
現實中的視頻序列,不可避免存在場景切換。如果編碼器不考慮場景切換的影響,就會浪費有限的碼率資源,從而導致編碼質量下降。目前,針對場景切換提出了很多碼率控制算法,其中常用的方法是通過改變GOP的結構和長度來重新分配碼率資源。如在文的算法中,當檢測到場景切換時,當前GOP剩余幀和下一個GOP的所有幀合并為一個GOP,因此,GOP長度要比默認長度N大,最糟的情況下為2N-1。由于GOP過長容易導致緩沖區的溢出,并且導致GOP中后面部分幀的編碼性能下降。在文提出的算法中,采取將過長的GOP拆分成2個新的GOP來解決這個問題,但這樣做的后果是導致增加一個I幀,造成碼率資源的浪費。本文算法與文相比,不額外增加I幀的數量,可以有效地節省碼率資源,同時有效地提高場景切換幀后續各幀的編碼質量和序列整體的編碼質量。
2 針對場景切換的自適應碼率控制算法
2.1 自適應碼率控制算法
在該算法中,當前GOP的長度將隨著場景切換幀的出現自適應地改變,并且同時對碼率資源進行重新分配。假設默認的GOP長度為N,分配給每個GOP的碼率資源為
其中:B表示帶寬;F表示幀速率;Rprev表示前一個GOP編碼剩余比特或超支比特。對于第1個GOP來說,Rprev=0。每編碼一幀圖像,R更新如下:
其中Sipb為剛編碼幀(可能為I幀、P幀或B幀)所用的比特數。當GOP所有幀編碼完畢后,Rprev=R。
假設當前GOP在編碼M(M<N)幀后,第M+1幀檢測出場景切換,在H.264編碼算法中,此幀內絕大多數宏塊經過RDO優化之后均采用幀內預測模式編碼,當前GOP也在編完所有N幀之后結束。采用本文的算法,當檢測到第M+1幀有場景切換時,當前GOP即提前終止,并提前進入下一個GOP的編碼。由上述分析可知,發生場景切換時當前GOP的實際長度為M幀,因此,其預分配的碼率按
照式(1)計算并不合適,應由下式決定:
由于GOP提前終止,其未編碼的N-M幀應分配的編碼比特數為
這部分比特應該從當前GOP按照式(1)計算的預分配碼率中減去,則當前GOP提前終止時,Rprev應該修正如下:
當前GOP提前終止后對Rprev做出修正,根據式(1)則可計算出下一個GOP的預分配碼率,并開始下一個GOP的編碼。
本算法的前提是必須能檢測出場景切換,因此,快速有效地檢測檢測出場景切換是十分必要的。
2.2 視頻場景切換快速檢測算法
視頻場景切換包含如下幾種類型:突變場景切換、消融和淡入淡出等。目前,已有的場景切換檢測算法分為3類:基于灰度值檢測、基于運動搜索檢測和基于邊緣輪廓檢測。雖然后2種檢測算法具有比較好的性能,但是算法的高復雜度極大地限制了它們的應用,尤其是在對于實時性要求比較高的視頻通信碼率控制算法中。
通過對視頻序列的統計分析發現,當有場景切換時,當前幀與其參考幀在灰度和色彩信息上有很大的區別,而沒有場景切換的時候,整個序列的灰度和色彩基本處于平穩或者緩變的狀態。選擇mobile和grandma 2個YUV視頻序列(無場景切換),其各分量(Y為亮度分量,U、V為色度分量)的均值變化緩慢,如圖2所示。同時,對于有頻繁場景切換的視頻序列(以CNN新聞摘要片斷和一個構造序列為例),可知在場景切換處,3個分量的均值全部或部分出現突變,如圖3所示。
圖中mean(x)為枧頻序列X分量的均值,X代表視頻序列的Y、U、V 3個分量。
通過以上分析可知,當圖像序列的各分量的均值發生突變時,一般來說是有場景切換發生。據此,采用當前幀和參考幀3個分量均值的絕對差值作為判斷當前幀圖像是否有場景切換的差異函數為
其中:mean()為均值函數;Scur和Sref分別表示當前幀圖像和其參考幀圖像;X代表其3個分量。
根據差異函數,判斷是否有場景切換可以依據式(7)和(8):
當式(7)和式(8)同時滿足時,可以判定當前幀有場景切換發生。式中:mean(Y)、mean(U)和mean(V)分別為當前GOP內當前幀之前所有幀各分量均值的平均值;tTHl和tTH2為判決門限系數,分別描述當前幀和參考幀之間亮度和色度均值的相對差異和絕對差異。
顯然,上述算法只需要計算各幀圖像3個分量的均值,算法復雜度非常低,很適合于碼率控
制等實時性要求高的應用中。通過對超過2105幀的視頻序列進行仿真,超過90%的場景切換能夠被檢測出來,并且誤檢率幾乎為0。
2.3 仿真結果
為了驗證提出的碼率控制算法,本文采用圖3中兩個序列進行驗證。一個是CNN新聞摘要中一段序列(QCIF,277幀共9處場景切換),另一個為將23幀grandma、38幀foreman、27幀news、41幀sales、33幀silent和29幀table合成為一個測試序列(QCIF,191幀共有5處場景切換)。采用本文提出的快速場景切換檢測算法,2個序列共14處場景切換可以全部被檢測出,其中2個參數tTH1和tTH2分別設為0.1和10。采用JM8.6平臺,測試序列編碼采取IPPP結構,默認GOP長度為10。
通過對本文提出的算法和JM8.6算法進行仿真比較可知,采用本文的算法,可以有效降低場景切換對后續幀編碼質量的影響,且更合理地分配碼率資源,使編碼后的視頻圖像質量更平穩,同時也可以從整體上提升了視頻序列的編碼質量。表1列出了
采用本文算法與JM8.6算法時,測試序列各場景切換點前后10幀Y分量PSNR均值變化情況,從中可以看出采用本文算法可以有效提高場景切換點后續幀的編碼質量;圖4給出了2種算法下測試序列3個分量PSNR值變化曲線,從圖中可以看出,采用本文的算法,重建視頻質量更加平穩,同時也提高了整個序列的平均編碼質量,仿真結果表明當給定碼率為80 kb/s,量化參數Qp初始值為32時,序列3個分量的PSNR值平均可以提高0.36 dB、0.42dB、0.37 dB。對CNN視頻序列進行仿真,也可以得到與表1和圖4相似的結果,在碼率為80 kb/s,初始Qp值為32時序列編碼質量可以提高0.3 dB。實驗結果表明,本文的算法可以有效地將碼率控制在給定碼率,誤差在3%以內。
在編碼時間上,本文的算法避免了由于場景切換導致的無效的運動搜索,節省了場景切換幀的編碼時間,而算法本身引入的額外運算量可以忽略不計,因而節省了整個序列的編碼時間。仿真結果也表明,對于含有5個場景切換的P幀的測試序列(191
幀),編碼時間節省了2%~3%。很顯然,隨著序列中場景切換的P幀數量占序列總幀數的比例增大,節省的編碼時間的比例也會增大。
3 結 論
本文分析了場景切換對于視頻序列編碼帶來的影響,并提出了一種基于快速場景切換檢測的自適應碼率控制算法,有效地降低了場景切換對后續幀編碼質量的影響。結合H.264/AVC編碼器的實驗研究表明,采用本文的算法,可以更合理地分配碼率資源,使編碼后的視頻圖像質量更平穩,也可以從整體上提升視頻序列的編碼質量。同時,本文的算法也降低了場景切換幀的編碼時間,且自身算法復雜度低,可以有效節省頻繁場景切換的視頻序列的編碼時間。該算法可有效地應用于如新聞摘要和電視短廣告等有頻繁場景切換的視頻序列編碼,有效地提高其編碼質量和降低編碼時間。
責任編輯:gt
-
編碼器
+關注
關注
45文章
3643瀏覽量
134525 -
通信系統
+關注
關注
6文章
1190瀏覽量
53350 -
多媒體
+關注
關注
0文章
498瀏覽量
36991
發布評論請先 登錄
相關推薦
評論