項(xiàng)目介紹
本項(xiàng)目將使用python3去識(shí)別圖片是否為色情圖片,會(huì)使用到PIL這個(gè)圖像處理庫(kù),并且編寫算法來(lái)劃分圖像的皮膚區(qū)域
介紹一下PIL:
PIL(Python Image Library)是一種免費(fèi)的圖像處理工具包,這個(gè)軟件包提供了基本的圖像處理功能,如:改變圖像大小,旋轉(zhuǎn)圖像,圖像格式轉(zhuǎn)化,色場(chǎng)空間轉(zhuǎn)換(這個(gè)我不太懂),圖像增強(qiáng)(就是改善清晰度,突出圖像有用信息),直方圖處理,插值(利用已知鄰近像素點(diǎn)的灰度值來(lái)產(chǎn)生未知像素點(diǎn)的灰度值)和濾波等等。
雖然這個(gè)軟件包要實(shí)現(xiàn)復(fù)雜的圖像處理算法并不太適合,但是python的快速開發(fā)能力以及面向?qū)ο蟮鹊戎T多特點(diǎn)使得它非常適合用來(lái)進(jìn)行原型開發(fā)。
在 PIL 中,任何一副圖像都是用一個(gè) Image 對(duì)象表示,而這個(gè)類由和它同名的模塊導(dǎo)出,因此,要加載一副圖像,最簡(jiǎn)單的形式是這樣的:
importImage img=Image.open(“dip.jpg”)
注意:==第一行的 Image 是模塊名;第二行的 img 是一個(gè) Image 對(duì)象;== Image 類是在 Image 模塊中定義的。關(guān)于 Image 模塊和 Image 類,切記不要混淆了。現(xiàn)在,我們就可以對(duì) img 進(jìn)行各種操作了,所有對(duì) img 的 操作最終都會(huì)反映到到 dip.img 圖像上
環(huán)境準(zhǔn)備
PIL 2009 年之后就沒(méi)有更新了,也不支持 Python3 ,于是有了 Alex Clark 領(lǐng)導(dǎo)的公益項(xiàng)目 Pillow 。Pillow 是一個(gè)對(duì) PIL 友好的分支,支持 Python3,所以我們這里安裝的是 Pillow,這是它的官方文檔。
默認(rèn)已經(jīng)有python3.0以上和包管理工具pip3。那要執(zhí)行如下命令升級(jí)pip3并安裝Pillow 工具包:
sudoinstall-Upip3 sudoinstallPillow
程序原理
根據(jù)顏色(膚色)找出圖片中皮膚的區(qū)域,然后通過(guò)一些條件判斷是否為色情圖片。
程序的關(guān)鍵步驟如下:
遍歷每個(gè)像素,檢查像素顏色是否為膚色
將相鄰的膚色像素歸為一個(gè)皮膚區(qū)域,得到若干個(gè)皮膚區(qū)域
剔除像素?cái)?shù)量極少的皮膚區(qū)域
我們定義非色情圖片的判定規(guī)則如下(滿足任意一個(gè)判斷為真):
皮膚區(qū)域的個(gè)數(shù)小于3個(gè)
皮膚區(qū)域的像素與圖像所有像素的比值小于15%
最大皮膚區(qū)域小于總皮膚面積的45%
皮膚區(qū)域數(shù)量超過(guò)60個(gè)
這些規(guī)則你可以嘗試更改,直到程序效果讓自己滿意為止。關(guān)于像素膚色判定這方面,公式可以在網(wǎng)上找到很多,但是世界上不可能有正確率100%的公式。你可以用自己找到的公式,在程序完成后慢慢調(diào)試。
RGB顏色模式
第一種:==r > 95 and g > 40 and g < 100 and b > 20 and max([r, g, b]) - min([r, g, b]) > 15 and abs(r - g) > 15 and r > g and r > b==
第二種:==nr = r / (r + g + b), ng = g / (r + g + b), nb = b / (r +g + b),nr / ng > 1.185 and r * b / (r + g + b) ** 2 > 0.107 and r * g / (r + g + b) ** 2 > 0.112==
HSV顏色模式
==h > 0 and h < 35 and s > 0.23 and s < 0.68==
YCbCr顏色模式
==97.5 <= cb <= 142.5 and 134 <= cr <= 176==
一幅圖像有零個(gè)到多個(gè)的皮膚區(qū)域,程序按發(fā)現(xiàn)順序給它們編號(hào),第一個(gè)發(fā)現(xiàn)的區(qū)域編號(hào)為0,第n個(gè)發(fā)現(xiàn)的區(qū)域編號(hào)為n-1
用一種類型來(lái)表示像素,我們給這個(gè)類型取名為Skin,包含了像素的一些信息:唯一的編號(hào)id、是/否膚色skin、皮膚區(qū)域號(hào)region、橫坐標(biāo)x、縱坐標(biāo)y
遍歷所有像素時(shí),我們?yōu)槊總€(gè)像素創(chuàng)建一個(gè)與之對(duì)應(yīng)的Skin對(duì)象,并設(shè)置對(duì)象的所有屬性,其中region屬性即為像素所在的皮膚區(qū)域編號(hào),創(chuàng)建對(duì)象時(shí)初始化為無(wú)意義的None。關(guān)于每個(gè)像素的id值,左上角為原點(diǎn),像素id值按照像素坐標(biāo)排布,那么看起來(lái)如下圖:
其實(shí)id的順序也即遍歷的順序。遍歷所有像素時(shí),創(chuàng)建Skin對(duì)象后,如果當(dāng)前像素為膚色,且相鄰的像素有膚色的,那么我們把這些膚色像素歸到一個(gè)皮膚區(qū)域。
相鄰像素的定義:通常都能想到是當(dāng)前像素周圍的8個(gè)像素,然而實(shí)際上只需要定義4個(gè)就可以了,位置分別在當(dāng)前像素的左方,左上方,正上方,右上方。因?yàn)榱硗馑膫€(gè)像素都在當(dāng)前像素后面,我們還未給這4個(gè)像素創(chuàng)建對(duì)應(yīng)的Skin對(duì)象:
實(shí)現(xiàn)腳本
直接在python中新建nude.py文件,在這個(gè)文件進(jìn)行代碼編寫:
導(dǎo)入所需要的模塊:
importsys importos import_io fromcollectionsimportnamedtuple fromPILimportImage
我們將設(shè)計(jì)一個(gè)Nude類:
classNude:
這個(gè)類里面我們首先使用collections.namedtuple()定義一個(gè) Skin 類型:
Skin=namedtuple("Skin","idskinregionxy")
collections.namedtuple()函數(shù)實(shí)際上是一個(gè)返回 Python 中標(biāo)準(zhǔn)元組類型子類的一個(gè)工廠方法。你需要傳遞一個(gè)類型名和你需要的字段給它,然后它就會(huì)返回一個(gè)類,你可以初始化這個(gè)類,為你定義的字段傳遞值等。詳情參見官方文檔。
然后定義 Nude 類的初始化方法:
def__init__(self,path_or_image): #若path_or_image為Image.Image類型的實(shí)例,直接賦值 ifisinstance(path_or_image,Image.Image): self.image=path_or_image #若path_or_image為str類型的實(shí)例,打開圖片 elifisinstance(path_or_image,str): self.image=Image.open(path_or_image) #獲得圖片所有顏色通道 bands=self.image.getbands() #判斷是否為單通道圖片(也即灰度圖),是則將灰度圖轉(zhuǎn)換為RGB圖 iflen(bands)==1: #新建相同大小的RGB圖像 new_img=Image.new("RGB",self.image.size) #拷貝灰度圖self.image到RGB圖new_img.paste(PIL自動(dòng)進(jìn)行顏色通道轉(zhuǎn)換) new_img.paste(self.image) f=self.image.filename #替換self.image self.image=new_img self.image.filename=f #存儲(chǔ)對(duì)應(yīng)圖像所有像素的全部Skin對(duì)象 self.skin_map=[] #檢測(cè)到的皮膚區(qū)域,元素的索引即為皮膚區(qū)域號(hào),元素都是包含一些Skin對(duì)象的列表 self.detected_regions=[] #元素都是包含一些int對(duì)象(區(qū)域號(hào))的列表 #這些元素中的區(qū)域號(hào)代表的區(qū)域都是待合并的區(qū)域 self.merge_regions=[] #整合后的皮膚區(qū)域,元素的索引即為皮膚區(qū)域號(hào),元素都是包含一些Skin對(duì)象的列表 self.skin_regions=[] #最近合并的兩個(gè)皮膚區(qū)域的區(qū)域號(hào),初始化為-1 self.last_from,self.last_to=-1,-1 #色情圖像判斷結(jié)果 self.result=None #處理得到的信息 self.message=None #圖像寬高 self.width,self.height=self.image.size #圖像總像素 self.total_pixels=self.width*self.height
isinstane(object, classinfo)如果參數(shù)object是參數(shù)classinfo的實(shí)例,返回真,否則假;參數(shù)classinfo可以是一個(gè)包含若干type對(duì)象的元組,如果參數(shù)object是其中任意一個(gè)類型的實(shí)例,返回真,否則假。
涉及到效率問(wèn)題,越大的圖片所需要消耗的資源與時(shí)間越大,因此有時(shí)候可能需要對(duì)圖片進(jìn)行縮小。所以需要有圖片縮小方法:
defresize(self,maxwidth=1000,maxheight=1000): """ 基于最大寬高按比例重設(shè)圖片大小, 注意:這可能影響檢測(cè)算法的結(jié)果 如果沒(méi)有變化返回0 原寬度大于maxwidth返回1 原高度大于maxheight返回2 原寬高大于maxwidth,maxheight返回3 maxwidth-圖片最大寬度 maxheight-圖片最大高度 傳遞參數(shù)時(shí)都可以設(shè)置為False來(lái)忽略 """ #存儲(chǔ)返回值 ret=0 ifmaxwidth: ifself.width>maxwidth: wpercent=(maxwidth/self.width) hsize=int((self.height*wpercent)) fname=self.image.filename #Image.LANCZOS是重采樣濾波器,用于抗鋸齒 self.image=self.image.resize((maxwidth,hsize),Image.LANCZOS) self.image.filename=fname self.width,self.height=self.image.size self.total_pixels=self.width*self.height ret+=1 ifmaxheight: ifself.height>maxheight: hpercent=(maxheight/float(self.height)) wsize=int((float(self.width)*float(hpercent))) fname=self.image.filename self.image=self.image.resize((wsize,maxheight),Image.LANCZOS) self.image.filename=fname self.width,self.height=self.image.size self.total_pixels=self.width*self.height ret+=2 returnret
Image.resize(size, resample=0)
size – 包含寬高像素?cái)?shù)的元祖 (width, height) resample – 可選的重采樣濾波器
返回Image對(duì)象
然后便是最關(guān)鍵之一的解析方法了:
defparse(self): #如果已有結(jié)果,返回本對(duì)象 ifself.resultisnotNone: returnself #獲得圖片所有像素?cái)?shù)據(jù) pixels=self.image.load()
接著,遍歷每個(gè)像素,為每個(gè)像素創(chuàng)建對(duì)應(yīng)的Skin對(duì)象,其中self._classify_skin()這個(gè)方法是檢測(cè)像素顏色是否為膚色:
foryinrange(self.height): forxinrange(self.width): #得到像素的RGB三個(gè)通道的值 #[x,y]是[(x,y)]的簡(jiǎn)便寫法 r=pixels[x,y][0]#red g=pixels[x,y][1]#green b=pixels[x,y][2]#blue #判斷當(dāng)前像素是否為膚色像素 isSkin=Trueifself._classify_skin(r,g,b)elseFalse #給每個(gè)像素分配唯一id值(1,2,3...height*width) #注意x,y的值從零開始 _id=x+y*self.width+1 #為每個(gè)像素創(chuàng)建一個(gè)對(duì)應(yīng)的Skin對(duì)象,并添加到self.skin_map中 self.skin_map.append(self.Skin(_id,isSkin,None,x,y))
若當(dāng)前像素并不是膚色,那么跳過(guò)本次循環(huán),繼續(xù)遍歷:
#若當(dāng)前像素不為膚色像素,跳過(guò)此次循環(huán) ifnotisSkin: continue
若當(dāng)前像素是膚色像素,那么就需要處理了,先遍歷其相鄰像素。
一定要注意相鄰像素的索引值,因?yàn)橄袼氐膇d值是從1開始編起的,而索引是從0編起的。變量_id是存有當(dāng)前像素的id值, 所以當(dāng)前像素在self.skin_map中的索引值為_id - 1,以此類推,那么其左方的相鄰像素在self.skin_map中的索引值為_id - 1 - 1,左上方為_id - 1 - self.width - 1,上方為_id - 1 - self.width,右上方為_id - 1 - self.width + 1:
#設(shè)左上角為原點(diǎn),相鄰像素為符號(hào)*,當(dāng)前像素為符號(hào)^,那么相互位置關(guān)系通常如下圖 #*** #*^ #存有相鄰像素索引的列表,存放順序?yàn)橛纱蟮叫。樞蚋淖冇杏绊?#注意_id是從1開始的,對(duì)應(yīng)的索引則是_id-1 check_indexes=[_id-2,#當(dāng)前像素左方的像素 _id-self.width-2,#當(dāng)前像素左上方的像素 _id-self.width-1,#當(dāng)前像素的上方的像素 _id-self.width]#當(dāng)前像素右上方的像素
把id值從0編起:
#用來(lái)記錄相鄰像素中膚色像素所在的區(qū)域號(hào),初始化為-1 region=-1 #遍歷每一個(gè)相鄰像素的索引 forindexincheck_indexes: #嘗試索引相鄰像素的Skin對(duì)象,沒(méi)有則跳出循環(huán) try: self.skin_map[index] exceptIndexError: break #相鄰像素若為膚色像素: ifself.skin_map[index].skin: #若相鄰像素與當(dāng)前像素的region均為有效值,且二者不同,且尚未添加相同的合并任務(wù) if(self.skin_map[index].region!=Noneand region!=Noneandregion!=-1and self.skin_map[index].region!=regionand self.last_from!=regionand self.last_to!=self.skin_map[index].region): #那么這添加這兩個(gè)區(qū)域的合并任務(wù) self._add_merge(region,self.skin_map[index].region) #記錄此相鄰像素所在的區(qū)域號(hào) region=self.skin_map[index].region
self._add_merge()這個(gè)方法接收兩個(gè)區(qū)域號(hào),它將會(huì)把兩個(gè)區(qū)域號(hào)添加到self.merge_regions中的元素中,self.merge_regions的每一個(gè)元素都是一個(gè)列表,這些列表中存放了 1 到多個(gè)的區(qū)域號(hào),區(qū)域號(hào)代表的區(qū)域是連通的,需要合并。
檢測(cè)的圖像里,有些前幾行的像素的相鄰像素并沒(méi)有 4 個(gè),所以需要用try“試錯(cuò)”。
然后相鄰像素的若是膚色像素,如果兩個(gè)像素的皮膚區(qū)域號(hào)都為有效值且不同,因?yàn)閮蓚€(gè)區(qū)域中的像素相鄰,那么其實(shí)這兩個(gè)區(qū)域是連通的,說(shuō)明需要合并這兩個(gè)區(qū)域。記錄下此相鄰膚色像素的區(qū)域號(hào),之后便可以將當(dāng)前像素歸到這個(gè)皮膚區(qū)域里了。
遍歷完所有相鄰像素后,分兩種情況處理:
所有相鄰像素都不是膚色像素:發(fā)現(xiàn)了新的皮膚區(qū)域。
存在區(qū)域號(hào)為有效值的相鄰膚色像素:region 的中存儲(chǔ)的值有用了,把當(dāng)前像素歸到這個(gè)相鄰像素所在的區(qū)域。
#遍歷完所有相鄰像素后,若region仍等于-1,說(shuō)明所有相鄰像素都不是膚色像素 ifregion==-1: #更改屬性為新的區(qū)域號(hào),注意元祖是不可變類型,不能直接更改屬性 _skin=self.skin_map[_id-1]._replace(region=len(self.detected_regions)) self.skin_map[_id-1]=_skin #將此膚色像素所在區(qū)域創(chuàng)建為新區(qū)域 self.detected_regions.append([self.skin_map[_id-1]]) #region不等于-1的同時(shí)不等于None,說(shuō)明有區(qū)域號(hào)為有效值的相鄰膚色像素 elifregion!=None: #將此像素的區(qū)域號(hào)更改為與相鄰像素相同 _skin=self.skin_map[_id-1]._replace(region=region) self.skin_map[_id-1]=_skin #向這個(gè)區(qū)域的像素列表中添加此像素 self.detected_regions[region].append(self.skin_map[_id-1])
somenamedtuple._replace(kwargs)返回一個(gè)替換指定字段的值為參數(shù)的namedtuple實(shí)例
遍歷完所有像素之后,圖片的皮膚區(qū)域劃分初步完成了,只是在變量self.merge_regions中還有一些連通的皮膚區(qū)域號(hào),它們需要合并,合并之后就可以進(jìn)行色情圖片判定了:
#完成所有區(qū)域合并任務(wù),合并整理后的區(qū)域存儲(chǔ)到self.skin_regions self._merge(self.detected_regions,self.merge_regions) #分析皮膚區(qū)域,得到判定結(jié)果 self._analyse_regions() returnself
方法self._merge()便是用來(lái)合并這些連通的皮膚區(qū)域的。方法self._analyse_regions(),運(yùn)用之前在程序原理一節(jié)定義的非色情圖像判定規(guī)則,從而得到判定結(jié)果。現(xiàn)在編寫我們還沒(méi)寫過(guò)的調(diào)用過(guò)的Nude類的方法。
首先是self._classify_skin()方法,這個(gè)方法是檢測(cè)像素顏色是否為膚色,之前在程序原理一節(jié)已經(jīng)把膚色判定該公式列舉了出來(lái),現(xiàn)在是用的時(shí)候了:
#基于像素的膚色檢測(cè)技術(shù) def_classify_skin(self,r,g,b): #根據(jù)RGB值判定 rgb_classifier=r>95and g>40andg100?and? ????????b?>20and max([r,g,b])-min([r,g,b])>15and abs(r-g)>15and r>gand r>b #根據(jù)處理后的RGB值判定 nr,ng,nb=self._to_normalized(r,g,b) norm_rgb_classifier=nr/ng>1.185and float(r*b)/((r+g+b)**2)>0.107and float(r*g)/((r+g+b)**2)>0.112 #HSV顏色模式下的判定 h,s,v=self._to_hsv(r,g,b) hsv_classifier=h>0and h35?and? ????????s?>0.23and s0.68 ????#?YCbCr?顏色模式下的判定 ????y,?cb,?cr?=?self._to_ycbcr(r,?g,??b) ????ycbcr_classifier?=?97.5?<=?cb?<=?142.5?and?134?<=?cr?<=?176 ????#?效果不是很好,還需改公式 ????#?return?rgb_classifier?or?norm_rgb_classifier?or?hsv_classifier?or?ycbcr_classifier ????return?ycbcr_classifier
顏色模式的轉(zhuǎn)換并不是本實(shí)驗(yàn)的重點(diǎn),轉(zhuǎn)換公式可以在網(wǎng)上找到,這里我們直接拿來(lái)用就行:
def_to_normalized(self,r,g,b): ifr==0: r=0.0001 ifg==0: g=0.0001 ifb==0: b=0.0001 _sum=float(r+g+b) return[r/_sum,g/_sum,b/_sum] def_to_ycbcr(self,r,g,b): #公式來(lái)源: #http://stackoverflow.com/questions/19459831/rgb-to-ycbcr-conversion-problems y=.299*r+.587*g+.114*b cb=128-0.168736*r-0.331364*g+0.5*b cr=128+0.5*r-0.418688*g-0.081312*b returny,cb,cr def_to_hsv(self,r,g,b): h=0 _sum=float(r+g+b) _max=float(max([r,g,b])) _min=float(min([r,g,b])) diff=float(_max-_min) if_sum==0: _sum=0.0001 if_max==r: ifdiff==0: h=sys.maxsize else: h=(g-b)/diff elif_max==g: h=2+((g-r)/diff) else: h=4+((r-g)/diff) h*=60 ifh0: ????????h?+=?360 ????return?[h,?1.0?-?(3.0?*?(_min?/?_sum)),?(1.0?/?3.0)?*?_max]
self._add_merge()方法主要是對(duì)self.merge_regions操作,而self.merge_regions 的元素都是包含一些 int 對(duì)象(區(qū)域號(hào))的列表,列表中的區(qū)域號(hào)代表的區(qū)域都是待合并的區(qū)。self._add_merge()方法接收兩個(gè)區(qū)域號(hào),將之添加到self.merge_regions中。
這兩個(gè)區(qū)域號(hào)以怎樣的形式添加,要分 3 種情況處理:
傳入的兩個(gè)區(qū)域號(hào)都存在于self.merge_regions中
傳入的兩個(gè)區(qū)域號(hào)有一個(gè)區(qū)域號(hào)存在于self.merge_regions中
傳入的兩個(gè)區(qū)域號(hào)都不存在于self.merge_regions中
具體的處理方法,見代碼:
ef_add_merge(self,_from,_to): #兩個(gè)區(qū)域號(hào)賦值給類屬性 self.last_from=_from self.last_to=_to #記錄self.merge_regions的某個(gè)索引值,初始化為-1 from_index=-1 #記錄self.merge_regions的某個(gè)索引值,初始化為-1 to_index=-1 #遍歷每個(gè)self.merge_regions的元素 forindex,regioninenumerate(self.merge_regions): #遍歷元素中的每個(gè)區(qū)域號(hào) forr_indexinregion: ifr_index==_from: from_index=index ifr_index==_to: to_index=index #若兩個(gè)區(qū)域號(hào)都存在于self.merge_regions中 iffrom_index!=-1andto_index!=-1: #如果這兩個(gè)區(qū)域號(hào)分別存在于兩個(gè)列表中 #那么合并這兩個(gè)列表 iffrom_index!=to_index: self.merge_regions[from_index].extend(self.merge_regions[to_index]) del(self.merge_regions[to_index]) return #若兩個(gè)區(qū)域號(hào)都不存在于self.merge_regions中 iffrom_index==-1andto_index==-1: #創(chuàng)建新的區(qū)域號(hào)列表 self.merge_regions.append([_from,_to]) return #若兩個(gè)區(qū)域號(hào)中有一個(gè)存在于self.merge_regions中 iffrom_index!=-1andto_index==-1: #將不存在于self.merge_regions中的那個(gè)區(qū)域號(hào) #添加到另一個(gè)區(qū)域號(hào)所在的列表 self.merge_regions[from_index].append(_to) return #若兩個(gè)待合并的區(qū)域號(hào)中有一個(gè)存在于self.merge_regions中 iffrom_index==-1andto_index!=-1: #將不存在于self.merge_regions中的那個(gè)區(qū)域號(hào) #添加到另一個(gè)區(qū)域號(hào)所在的列表 self.merge_regions[to_index].append(_from) return
在序列中循環(huán)時(shí),索引位置和對(duì)應(yīng)值可以使用enumerate()函數(shù)同時(shí)得到,在上面的代碼中,索引位置即為index,對(duì)應(yīng)值即為region。self._merge()方法則是將self.merge_regions中的元素中的區(qū)域號(hào)所代表的區(qū)域合并,得到新的皮膚區(qū)域列表:
ef_merge(self,detected_regions,merge_regions): #新建列表new_detected_regions #其元素將是包含一些代表像素的Skin對(duì)象的列表 #new_detected_regions的元素即代表皮膚區(qū)域,元素索引為區(qū)域號(hào) new_detected_regions=[] #將merge_regions中的元素中的區(qū)域號(hào)代表的所有區(qū)域合并 forindex,regioninenumerate(merge_regions): try: new_detected_regions[index] exceptIndexError: new_detected_regions.append([]) forr_indexinregion: new_detected_regions[index].extend(detected_regions[r_index]) detected_regions[r_index]=[] #添加剩下的其余皮膚區(qū)域到new_detected_regions forregionindetected_regions: iflen(region)>0: new_detected_regions.append(region) #清理new_detected_regions self._clear_regions(new_detected_regions) #添加剩下的其余皮膚區(qū)域到new_detected_regions forregionindetected_regions: iflen(region)>0: new_detected_regions.append(region) #清理new_detected_regions self._clear_regions(new_detected_regions)
self._clear_regions()方法只將像素?cái)?shù)大于指定數(shù)量的皮膚區(qū)域保留到self.skin_regions:
#皮膚區(qū)域清理函數(shù) #只保存像素?cái)?shù)大于指定數(shù)量的皮膚區(qū)域 def_clear_regions(self,detected_regions): forregionindetected_regions: iflen(region)>30: self.skin_regions.append(region)
self._analyse_regions()是很簡(jiǎn)單的,它的工作只是進(jìn)行一系列判斷,得出圖片是否色情的結(jié)論:
#分析區(qū)域 def_analyse_regions(self): #如果皮膚區(qū)域小于3個(gè),不是色情 iflen(self.skin_regions)3: ????????self.message?=?"Less?than?3?skin?regions?({_skin_regions_size})".format( ????????????_skin_regions_size=len(self.skin_regions)) ????????self.result?=?False ????????return?self.result ????#?為皮膚區(qū)域排序 ????self.skin_regions?=?sorted(self.skin_regions,?key=lambda?s:?len(s), ???????????????????????????????reverse=True) ????#?計(jì)算皮膚總像素?cái)?shù) ????total_skin?=?float(sum([len(skin_region)?for?skin_region?in?self.skin_regions])) ????#?如果皮膚區(qū)域與整個(gè)圖像的比值小于?15%,那么不是色情圖片 ????if?total_skin?/?self.total_pixels?*?100?15: ????????self.message?=?"Total?skin?percentage?lower?than?15?({:.2f})".format(total_skin?/?self.total_pixels?*?100) ????????self.result?=?False ????????return?self.result ????#?如果最大皮膚區(qū)域小于總皮膚面積的?45%,不是色情圖片 ????if?len(self.skin_regions[0])?/?total_skin?*?100?45: ????????self.message?=?"The?biggest?region?contains?less?than?45?({:.2f})".format(len(self.skin_regions[0])?/?total_skin?*?100) ????????self.result?=?False ????????return?self.result ????#?皮膚區(qū)域數(shù)量超過(guò)?60個(gè),不是色情圖片 ????if?len(self.skin_regions)?>60: self.message="Morethan60skinregions({})".format(len(self.skin_regions)) self.result=False returnself.result #其它情況為色情圖片 self.message="Nude!!" self.result=True returnself.result
然后可以組織下分析得出的信息:
definspect(self): _image='{}{}{}×{}'.format(self.image.filename,self.image.format,self.width,self.height) return"{_image}:result={_result}message='{_message}'".format(_image=_image,_result=self.result,_message=self.message)
Nude類如果就這樣完成了,最后運(yùn)行腳本時(shí)只能得到一些真或假的結(jié)果,我們需要更直觀的感受程序的分析效果,我們可以生成一張?jiān)瓐D的副本,不過(guò)這個(gè)副本圖片中只有黑白色,白色代表皮膚區(qū)域,那么這樣我們能直觀感受到程序分析的效果了。
前面的代碼中我們有獲得圖像的像素的 RGB 值的操作,設(shè)置像素的 RGB 值也就是其逆操作,還是很簡(jiǎn)單的,不過(guò)注意設(shè)置像素的 RGB 值時(shí)不能在原圖上操作:
#將在源文件目錄生成圖片文件,將皮膚區(qū)域可視化 defshowSkinRegions(self): #未得出結(jié)果時(shí)方法返回 ifself.resultisNone: return #皮膚像素的ID的集合 skinIdSet=set() #將原圖做一份拷貝 simage=self.image #加載數(shù)據(jù) simageData=simage.load() #將皮膚像素的id存入skinIdSet forsrinself.skin_regions: forpixelinsr: skinIdSet.add(pixel.id) #將圖像中的皮膚像素設(shè)為白色,其余設(shè)為黑色 forpixelinself.skin_map: ifpixel.idnotinskinIdSet: simageData[pixel.x,pixel.y]=0,0,0 else: simageData[pixel.x,pixel.y]=255,255,255 #源文件絕對(duì)路徑 filePath=os.path.abspath(self.image.filename) #源文件所在目錄 fileDirectory=os.path.dirname(filePath)+'/' #源文件的完整文件名 fileFullName=os.path.basename(filePath) #分離源文件的完整文件名得到文件名和擴(kuò)展名 fileName,fileExtName=os.path.splitext(fileFullName) #保存圖片 simage.save('{}{}_{}{}'.format(fileDirectory,fileName,'Nude'ifself.resultelse'Normal',fileExtName))
變量skinIdSet使用集合而不是列表是有性能上的考量的,Python 中的集合是哈希表實(shí)現(xiàn)的,查詢效率很高。最后支持一下命令行參數(shù)就大功告成啦!
我們使用argparse這個(gè)模塊來(lái)實(shí)現(xiàn)命令行的支持。argparse 模塊使得編寫用戶友好的命令行接口非常容易。程序只需定義好它要求的參數(shù),然后 argparse 將負(fù)責(zé)如何從 sys.argv 中解析出這些參數(shù)。argparse 模塊還會(huì)自動(dòng)生成幫助和使用信息并且當(dāng)用戶賦給程序非法的參數(shù)時(shí)產(chǎn)生錯(cuò)誤信息。
具體使用方法請(qǐng)查看argparse的官方文檔
if__name__=="__main__": importargparse parser=argparse.ArgumentParser(description='Detectnudityinimages.') parser.add_argument('files',metavar='image',nargs='+', help='Imagesyouwishtotest') parser.add_argument('-r','--resize',action='store_true', help='Reduceimagesizetoincreasespeedofscanning') parser.add_argument('-v','--visualization',action='store_true', help='Generatingareasofskinimage') args=parser.parse_args() forfnameinargs.files: ifos.path.isfile(fname): n=Nude(fname) ifargs.resize: n.resize(maxheight=800,maxwidth=600) n.parse() ifargs.visualization: n.showSkinRegions() print(n.result,n.inspect()) else: print(fname,"isnotafile")
測(cè)試效果
先來(lái)一張很正經(jīng)的測(cè)試圖片:
在PyCharm中的終端運(yùn)行下面的命令執(zhí)行腳本,注意是python3而不是python:
python3nude.py-v1.jpg
運(yùn)行截圖:
這表示1.jpg不是一張色情圖片
總結(jié)
這個(gè)項(xiàng)目就是熟悉了一下PIL的使用,了解了色情圖片檢查的原理。主要實(shí)現(xiàn)難點(diǎn)是在皮膚區(qū)域的檢測(cè)與整合這一方面。項(xiàng)目還有許多可以改進(jìn)的地方,比如膚色檢測(cè)公式,色情判定條件,還有性能問(wèn)題,得去學(xué)習(xí)一下用多線程或多進(jìn)程提高性能。
原文標(biāo)題:做了個(gè)圖片識(shí)別系統(tǒng),含檢測(cè)正經(jīng)圖片的源碼
文章出處:【微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
圖像處理
+關(guān)注
關(guān)注
27文章
1292瀏覽量
56747 -
python
+關(guān)注
關(guān)注
56文章
4797瀏覽量
84690 -
PIL
+關(guān)注
關(guān)注
0文章
19瀏覽量
8617
原文標(biāo)題:做了個(gè)圖片識(shí)別系統(tǒng),含檢測(cè)正經(jīng)圖片的源碼
文章出處:【微信號(hào):magedu-Linux,微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論