本文介紹算法的源碼在github上給出
https://github.com/TimChinenov/GraspPicture
前言
成產(chǎn)品及系統(tǒng)平臺(tái)的現(xiàn)場(chǎng)演示,編寫技術(shù)應(yīng)用服務(wù)方案等,編寫投標(biāo)類方案文件及標(biāo)書的制作;
通常,當(dāng)我們看到一張圖片時(shí),會(huì)在圖片中聚焦一個(gè)焦點(diǎn)。這個(gè)可能是一個(gè)人,一座建筑物甚至是一個(gè)桶。其他沒有聚焦區(qū)域雖然很清晰,但是卻由于顏色單調(diào)或者紋理較為平滑而很少引起關(guān)注。當(dāng)遇到此類圖象時(shí),我們希望從圖像中分割感興趣的對(duì)象。下面給出了顯著圖像的示例,本文探討了此類顯著圖像的分割方法,也稱為顯著性的圖像分割。
這中分割方式最開始起源于希望能夠自主尋找圖像中的Trimap。Trimap是圖像掩碼(mask),當(dāng)與掩碼算法配合使用時(shí),可用于分割圖像,同時(shí)能夠提示前景和背景之間的細(xì)節(jié)。Trimap通常包含定義前景的白色區(qū)域,定義背景的黑色區(qū)域以及代表不確定區(qū)域的灰色區(qū)域。
大部分摳圖算法問題在于,他們希望Trimap由用戶提供,這是一項(xiàng)非常耗時(shí)的任務(wù)。這里面介紹兩個(gè)試圖解決自主trimap生成問題的相關(guān)論文,這兩篇論文在文末給出。在第一篇論文中使用了一種相當(dāng)簡(jiǎn)單且易于實(shí)現(xiàn)的方法。
不幸的是,他們的方法并不是完全自主的,因?yàn)樗笥脩魹镚rabcut算法提供一個(gè)矩形區(qū)域。第二篇論文中,使用顯著性方法預(yù)測(cè)感興趣的區(qū)域。但是,它們的顯著性方法非常復(fù)雜,將三種不同的顯著性算法的結(jié)果結(jié)合在一起。這三種算法中有一種利用卷積神經(jīng)網(wǎng)絡(luò),為了易于實(shí)現(xiàn),應(yīng)該盡量避免這種技術(shù)。
如果忽略需要人為給出矩形區(qū)域,第一篇論文中能夠產(chǎn)生較好的分割結(jié)果。通過第二篇論文的原理去自動(dòng)給出一個(gè)Grabcut算法的矩形區(qū)域,那么將完美的解決自主分割的問題。
方法
對(duì)于大多數(shù)形式的圖像分割,目標(biāo)都是將圖像二值化為感興趣的區(qū)域。這個(gè)本文介紹方法的目標(biāo)也是這樣的。首先,大致確定感興趣的對(duì)象在哪里。將高斯模糊應(yīng)用于圖像,之后在模糊圖像中生成平均15像素大小的超像素。超像素算法旨在根據(jù)像素區(qū)域中值的顏色和距離來分解圖像。具體來說,使用了簡(jiǎn)單的線性迭代聚類(SLIC)算法。
超像素將圖像分解為大致相同的區(qū)域。這樣的一個(gè)優(yōu)點(diǎn)是,超像素允許區(qū)域的泛化。我們可以假設(shè)超像素內(nèi)的大多數(shù)像素具有相似的屬性。
在確定圖像中的超像素的同時(shí),計(jì)算圖像的顯著性圖。使用了兩種不同的顯著性技術(shù)。第一種方法使用OpenCV內(nèi)置的方法,即所謂的細(xì)顆粒顯著性。第二種方法涉及獲取細(xì)顆粒顯著性圖像的平均值,然后從圖像的高斯模糊版本中減去平均值,然后是新圖像的絕對(duì)值。
下方的圖像均突出顯示了感興趣的區(qū)域。細(xì)顆粒顯著性產(chǎn)生的圖像較為柔和。此外,細(xì)顆粒顯著性圖像主要勾勒出突出圖像的邊界。而另一種方法雖然也捕獲了突出圖像的內(nèi)部,但是與細(xì)顆粒方法相比,該方法會(huì)產(chǎn)生更多的噪音。之后需要對(duì)噪聲進(jìn)行去除。
為了將圖像二值化,對(duì)從彩色圖像生成的每個(gè)超級(jí)像素進(jìn)行迭代。如果顯著圖像內(nèi)該超像素區(qū)域的中值像素值大于閾值T1,則整個(gè)超像素將被二值化為白色。否則,整個(gè)超像素將保留為黑色。T1由用戶選擇,一般情況下,將T1設(shè)置為顯著圖像中最大像素值的25%-30%。
在對(duì)圖像進(jìn)行二值化之后,基于所使用的顯著性技術(shù)對(duì)圖像進(jìn)行擴(kuò)張。在第一種方法中,將圖像放大為平均超像素尺寸的兩倍。在第二種方法中沒有進(jìn)行擴(kuò)大,因?yàn)閳D像中存在的較大噪聲使擴(kuò)張風(fēng)險(xiǎn)增大。處理的結(jié)果在下面給出。
最后一步操作取決于使用的是哪種顯著性。在這兩種方法的結(jié)果中,都提取最大的白色像素區(qū)域。通過查找圖像中的輪廓并選擇面積最大的輪廓來執(zhí)行此操作,之后將邊界框擬合到所選區(qū)域。
根據(jù)一般性結(jié)果,第一種顯著性方法通常會(huì)導(dǎo)致區(qū)域碎片化。生成邊界框后,將落入該框的不屬于最大區(qū)域的所有其他白色區(qū)域添加到該框。框的邊界增加到包括這些區(qū)域。第二種顯著性方法不需要這樣做。通常,最大獲取的區(qū)域會(huì)超出期望的數(shù)量。
最后一步是將最終找到的邊界框提供給Grabcut算法。Grabcut是用于分割圖像的常用方法,該方法會(huì)將絕對(duì)是背景和前景的內(nèi)容分開。這里面我們直接使用OpenCV的內(nèi)置Grabcut函數(shù)。處理的結(jié)果如下所示。
結(jié)果
兩種顯著性計(jì)算方法對(duì)于結(jié)果會(huì)有一些影響。第一種顯著性方法更加適用于含有噪聲的圖像中,在含有噪聲的圖像中不會(huì)像第二種顯著性方法造成分割結(jié)果的溢出。,但是如果圖像太長(zhǎng)或有卷須,則這些部分通常會(huì)與圖像的其余部分?jǐn)嚅_連接。
編輯:jq
-
函數(shù)
+關(guān)注
關(guān)注
3文章
4338瀏覽量
62761 -
SLIC
+關(guān)注
關(guān)注
0文章
19瀏覽量
13845 -
OpenCV
+關(guān)注
關(guān)注
31文章
635瀏覽量
41388
原文標(biāo)題:基于自適應(yīng)顯著性的圖像分割(源碼開放)
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論