要想拍攝運動模糊效果的照片,需要高超的攝影技術(shù)。最近,谷歌兩名研究員開發(fā)了一種新算法,能夠使用兩張清晰圖像合成運動模糊效果。該技術(shù)也可用來合成訓練去模糊算法所需的訓練數(shù)據(jù)。
谷歌的研究人員最近開發(fā)了一種新技術(shù),使用連續(xù)拍攝的一對非模糊圖像,能夠合成運動模糊圖像。在發(fā)表在arXiv上的預印版論文中,研究人員概述了他們的方法,并與幾種基線方法對比,對其進行了評估。
當場景中的物體或相機本身在拍攝時發(fā)生移動,運動模糊就會自然產(chǎn)生。這導致移動的物體或整個圖像看起來是模糊的。在某些情況下,運動模糊可以用來表示被攝對象的速度或?qū)⑵渑c背景分離。
“在圖像理解方面,運動模糊是一個有價值的線索,”進行這項研究的谷歌研究員Tim Brooks和Jonathan Barron在論文中寫道:“給定一個包含運動模糊的圖像,我們可以估計導致觀察到的模糊的場景運動的相對方向和幅度。這種運動估計在語義上可能是有意義的,或者可以用去模糊算法來合成一個清晰的圖像。”
最近的研究已經(jīng)探討了使用深度學習算法從圖像中去除不想要的運動模糊或推斷給定場景的運動動力學。然而,為了訓練這些算法,研究人員需要大量的數(shù)據(jù),這些數(shù)據(jù)通常是通過合成模糊圖像生成的。最終,深度學習算法在多大程度上能夠有效去除真實圖像中的運動模糊,很大程度上取決于用于訓練運動模糊的合成數(shù)據(jù)的真實性。
“在這篇論文中,我們將這個已經(jīng)有充分研究的模糊估計/模糊去除任務(wù)的逆向問題視為一個頭等問題。”Brooks和Barron在他們的論文中寫道:“我們提出了一種快速有效的方法來合成訓練運動去模糊算法所需的訓練數(shù)據(jù),并且我們定量地證明了我們的技術(shù)能夠從合成的訓練數(shù)據(jù)推廣到真實的運動模糊圖像。”
圖1:(a)中展示了一個物體在圖像平面上移動的兩幅圖像。我們的系統(tǒng)利用這些圖像合成(b)中的運動模糊圖像,它傳達了一種運動的感覺,并將主體與背景分離。
他們設(shè)計的神經(jīng)網(wǎng)絡(luò)架構(gòu)包括一個新的“線性預測”(line prediction)層,它會教一個系統(tǒng)從連續(xù)拍攝的兩張圖像退回到跨越這兩張輸入圖像捕獲時間的運動模糊圖像。他們的模型需要大量的訓練數(shù)據(jù),因此研究人員設(shè)計并執(zhí)行了一種新策略,該策略使用幀插值技術(shù)(frame interpolation)生成運動模糊圖像及其各自輸入的大型合成數(shù)據(jù)集。
架構(gòu)的圖示:以兩個輸入圖像的連接作為輸入,并使用U-Net卷積神經(jīng)網(wǎng)絡(luò)來預測線性預測層的參數(shù)
Brooks和Barron還拍攝了一組由慢動作視頻合成的高質(zhì)量的真實運動模糊圖像,然后用這些圖像來評估他們的模型與基線技術(shù)。他們的模型取得了非常好的結(jié)果,在準確性和速度上都優(yōu)于現(xiàn)有的方法。
表1:在真實測試數(shù)據(jù)集上的性能,其中我們的模型與3個簡化變體和5個基線算法進行比較
研究人員在論文中寫道:“我們的方法快速、準確,并且使用來自視頻或’突發(fā)’的現(xiàn)成圖像作為輸入,因此能夠為攝影應用程序提供運動模糊處理,或為去模糊算法或運動估計算法所需的真實訓練數(shù)據(jù)的合成提供一種途徑。”
從合成訓練數(shù)據(jù)集中隨機抽取的5組輸入/輸出圖像對
雖然經(jīng)驗豐富的攝影師經(jīng)常將動態(tài)模糊視為一種藝術(shù)效果,但拍攝有效的動態(tài)模糊照片是非常具有挑戰(zhàn)性的。在大多數(shù)情況下,這些圖像是長期試錯過程的產(chǎn)物,而且需要先進的技術(shù)和設(shè)備。
在有經(jīng)驗的攝影師手中,利用運動模糊可以產(chǎn)生引人注目的照片,像(a)那樣。但是對于大多數(shù)業(yè)余攝影師來說,運動模糊更有可能像(b)那樣。
由于難以獲得高質(zhì)量的運動模糊效果,大多數(shù)消費者相機都被設(shè)計成盡可能少地拍攝運動模糊的圖像。這意味著業(yè)余攝影師幾乎沒有空間能在他們的圖像中嘗試運動模糊。
“通過將普通消費者相機拍攝到的傳統(tǒng)非模糊圖像合成為運動模糊圖像,我們的技術(shù)允許非專業(yè)人士在拍攝后創(chuàng)建運動模糊圖像。”研究人員在論文中解釋道。
最終, Brooks和Barron設(shè)計的方法可能會有許多有趣的應用。例如,它可以幫助業(yè)余攝影師實現(xiàn)藝術(shù)運動模糊效果,同時也能為訓練深度學習算法合成更逼真的運動模糊圖像。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4771瀏覽量
100767 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1208瀏覽量
24701 -
深度學習
+關(guān)注
關(guān)注
73文章
5503瀏覽量
121162
原文標題:谷歌新研究用深度學習合成運動模糊效果,手抖也能拍出攝影師級照片
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論