本文主要講述的是霍夫變換的一些內(nèi)容,并加入一些在生活中的應(yīng)用,希望能對讀者對于霍夫變換的內(nèi)容有所了解。
首先我先說的是,霍夫變換是一個特征提取技術(shù)。其可用于隔離圖像中特定形狀的特征的技術(shù),應(yīng)用在圖像分析、計算機(jī)視覺和數(shù)字圖像處理領(lǐng)域。目的是通過投票程序在特定類型的形狀內(nèi)找到對象的不完美實(shí)例。
這個投票程序是在一個參數(shù)空間中進(jìn)行的,在這個參數(shù)空間中,候選對象被當(dāng)作所謂的累加器空間中的局部最大值來獲得,所述累加器空間由用于計算霍夫變換的算法明確地構(gòu)建。此處我們主要介紹的是比較基本的霍夫變換在直線中的應(yīng)用,例如在圖像中檢測直線(線段),Hough變換的主要優(yōu)點(diǎn)是對于噪聲有良好的魯棒性。
基礎(chǔ)原理介紹
正如我們上面所介紹的那樣,霍夫變換最簡單的是檢測直線。我們知道,直線的方程表示可以由斜率k和截距b表示(這種表示方法,稱為斜截式,也就是高中的時候?qū)W習(xí)到的一種常用形式),如下所示:
y=kx+b
如果我們用參數(shù)空間表示則為(b,k),即,我們可以用斜率和截距就能表示一條直線。但這種形式會產(chǎn)生一個問題,那就是當(dāng)我們的直線斜率k為無限大的時候(即垂線),這會使得該直線無法使用斜截式來進(jìn)行表示,此處我們需要使用到另一種直線的表現(xiàn)形式:黑塞法線式(或者簡稱為法線式):
r=xcosθ+ysinθ
其中r是原點(diǎn)到直線上最近點(diǎn)的距離(其他人可能把這記錄為ρ,下面也可以把r看成參數(shù)ρ,兩者含義相同),θ是x軸與連接原點(diǎn)和最近點(diǎn)直線之間的夾角。
從而我們可以將圖像的每一條直線與一對參數(shù)(r,θ)相關(guān)聯(lián)。由參數(shù)(r,θ)構(gòu)成的平面有時被稱為霍夫空間,用于表示二維直線所構(gòu)成的集合。
我們經(jīng)過Hough變換后,我們圓來笛卡爾坐標(biāo)系中的一個點(diǎn)可以映射到Hough空間中去。
經(jīng)過原笛卡爾坐標(biāo)系中的定點(diǎn)(3,4),通過該點(diǎn)的所有可能直線的(r,θ)的關(guān)系。顯示了在極坐標(biāo)對極徑極角平面繪出所有通過該定點(diǎn)的直線, 將得到一條正弦曲線。正弦曲線的形狀取決于,點(diǎn)到所定義原點(diǎn)的距離r。通常,r越大,正弦曲線的振幅越大,反之則會越小。
所以我們可以得到一個結(jié)論,給定平面中的單個點(diǎn),那么通過該點(diǎn)的所有直線的集合對應(yīng)于(r,θ)平面中的正弦曲線,這對于該點(diǎn)是獨(dú)特的。一組兩個或更多點(diǎn)形成一條直線將產(chǎn)生在該線的(r,θ)處交叉的正弦曲線。因此,檢測共線點(diǎn)的問題可以轉(zhuǎn)化為找曲線相交點(diǎn)的問題。
例:
考慮下面三個點(diǎn),這里顯示為黑點(diǎn)。
(注:此處也展示了霍夫變換的幾個基本步驟:首先,對每個點(diǎn)均繪制不同角度的線條,這些線全部經(jīng)過各自的對應(yīng)點(diǎn)并顯示為實(shí)線。其次,對于每條實(shí)線,找到經(jīng)過原點(diǎn)的對應(yīng)垂線并顯示為虛線。然后找到虛線的長度和角度。這些值顯示在圖表下方的表格中。這對被轉(zhuǎn)換的三個點(diǎn)中的每一個都重復(fù)該過程。然后將結(jié)果繪制成圖,有時稱為霍夫空間圖)
曲線相交的點(diǎn)給出的距離和角度表示各個測試點(diǎn)相交的線。
分析上下文,邊緣段的點(diǎn)(一個或多個)的坐標(biāo)(xi,yi)在圖像中是已知的,并且因此作為參數(shù)線等式中的常量,而r與θ是未知變量是我們要尋找的。如果我們繪制由(r,θ)每個定義的可能值(xi,yi)。
笛卡爾圖像空間中的點(diǎn)映射到霍夫參數(shù)空間中的曲線(正弦曲線)。這個點(diǎn)到曲線的變換是直線的霍夫變換。當(dāng)在霍夫參數(shù)空間中查看時,在笛卡爾圖像空間中共線的點(diǎn)變得很明顯,因?yàn)樗鼈儺a(chǎn)生在相同(r,θ)點(diǎn)相交的曲線。
霍夫變換提取直線
我們通過將霍夫參數(shù)空間量化為有限間隔或累加器單元來實(shí)現(xiàn)變換。隨著算法的運(yùn)行,每個算法都把(xi,yi)轉(zhuǎn)換為一個離散化的 (r,θ)曲線,并且沿著這條曲線的累加器單元被遞增。累加器陣列中產(chǎn)生的峰值表示圖像中存在相應(yīng)的直線的相應(yīng)證明。
此時需要注意的是,現(xiàn)在我們考慮的是直線的霍夫變換。累加器陣列的維度是二維的(也就是r和θ)。
那么對于圖像來說,(x,y)處的每個像素及其鄰域,霍夫變換算法被用于確定該像素是否有足夠的直線證據(jù)。如果是,它將計算該線的參數(shù) (r,θ),然后查找參數(shù)落入的累加器箱,并增加該箱的值(投票值)。通過查找具有最高值的箱,通常通過查找累加器空間中的局部最大值,可以提取最可能的線,并且讀出它們的(近似的)幾何定義。
找到這些峰值的最簡單方法是通過應(yīng)用某種形式的閾值,但其他技術(shù)可能在不同情況下產(chǎn)生更好的結(jié)果。由于返回的行不包含任何長度信息,因此通常有必要在下一步中查找圖像的哪些部分與哪些行匹配。此外,由于邊緣檢測步驟中存在缺陷誤差,通常會在累加器空間中出現(xiàn)錯誤,這可能使得找到合適的峰值以及適當(dāng)?shù)木€條變得非常重要。
線性霍夫變換的最終結(jié)果是類似于累加器的二維陣列(矩陣),該矩陣的一個維度是量化角度θ,另一個維度是量化距離r。矩陣的每個元素的值等于位于由量化參數(shù) (r,θ)表示的線上的點(diǎn)或像素的總和。
所以具有最高值的元素表示輸入圖像中代表最多的直線。我們也可以把累計器單元的結(jié)果認(rèn)為是投票值。換句話說,將每個交點(diǎn)看成一次投票,也就是說A(r,θ)=A(r,θ)+1,所有點(diǎn)都如此進(jìn)行計算后,可以設(shè)置一個閾值,投票大于這個閾值的可以認(rèn)為是找到的直線。
霍夫變換提取圓
而當(dāng)我們需要去進(jìn)行圓檢測的時候,我們累加器是三維累加器,在圓檢測的情況下,我們可以知道的是其對應(yīng)的參數(shù)方程為:
(x?a)2+(y?b)2=r2
其中a和b是圓心的坐標(biāo)并且是r半徑。在這種情況下,算法的計算復(fù)雜度開始增加,因?yàn)槲覀儸F(xiàn)在在參數(shù)空間和三維累加器中有三個坐標(biāo)。(通常,累加器陣列的計算和大小隨著參數(shù)數(shù)量的增加而多項(xiàng)式增加,因此,基本霍夫技術(shù)僅適用于簡單曲線。)
它的算法步驟如下:
1.首先創(chuàng)建累加器空間,由每個像素單元格構(gòu)成。最初每個單元格都設(shè)置為0。
2.然后對于每個圖像中的邊緣點(diǎn)(i,j),按照圓方程(i?a)2+(j?b)2=r2將那些可能是一個圓中心的單元格值進(jìn)行累加。這些單元格在等式中由字母a表示。
3.然后在前面的步驟中由每個可能找到的值a,區(qū)找到滿足等式的所有可能值b。
4.搜索累加器空間中的局部最大值。這些單元格表示算法檢測到的圓圈。
如果我們不知道事先定位的圓的半徑,可以使用三維累加器空間來搜索具有任意半徑的圓。當(dāng)然,這在計算上更加昂貴。
該方法還可以檢測部分位于累加器空間外部的圓,只要該圓的區(qū)域內(nèi)仍有足夠的圓。
總結(jié)
霍夫變換在很多地方都有著應(yīng)用,如果是在OpenCV(Python)下想要使用霍夫變換,只需要使用函數(shù)cv2.HoughLinesP函數(shù),需要注意的是該函數(shù)并不是標(biāo)準(zhǔn)的霍夫變換,其為:概率霍夫變換,它只分析點(diǎn)的子集并估計這些點(diǎn)都屬于一條直線的概率,這是標(biāo)準(zhǔn)霍夫變換的優(yōu)化版本。該函數(shù)計算代價少,執(zhí)行更快,但準(zhǔn)確度有一定程度的下降。
cv2.HoughLinesP函數(shù)的語法如下:
cv2.HoughLinesP(image,rho,theta,threshold,minLineLength,maxLineGap)
其參數(shù)分別解釋如下:
·image:要處理的二值圖像;·rho:線段的幾何表示,表示取距離的間隔,一般取1;·theta:線段的幾何表示,表示取角度的間隔,一般取np.pi/180;·threshold:閾值,低于該閾值的會被忽略;·minLineLength:最小直線長度,小于該長度會被忽略;·maxLineGap:最大線段間隙,大于此間隙才被認(rèn)為是兩條直線。
霍夫變換在自動駕駛中也有所應(yīng)用,可以如下面一個簡單例子所示,其實(shí)現(xiàn)的是對我們畫面中的道路直線進(jìn)行的檢測:
import osimport reimport cv2import numpy as np
# 初始化一個掩膜def mask_create(): img = cv2.imread(‘0.png’) zero = np.zeros_like(img[:, :, 0]) poly = np.array([[50, 270], [220, 160], [345, 160], [480, 270]]) zero_fixed = cv2.fillConvexPoly(zero, poly, (255, 255, 255)) return zero_fixed
# 掩膜計算,傳入的圖像需要是BGR圖def mask_calc(frame, mask): img = cv2.bitwise_and(frame[:, :, 0], frame[:, :, 0], mask=mask) return img
# 圖像閾值操作,傳入的圖片需要是灰度圖def threshold(low, high, img): ret, thresh = cv2.threshold(img, low, high, cv2.THRESH_BINARY) return thresh
# 對圖像進(jìn)行霍夫變換,輸入的圖像需要是二值圖,距離r為1,旋轉(zhuǎn)角為1度,投票閾值為30,最遠(yuǎn)距離為200像素# 并在原圖上進(jìn)行繪制圖像def hough(thresh, img): lines = cv2.HoughLinesP(thresh, 1, np.pi/180, 30, maxLineGap=200) try: for line in lines: x1, y1, x2, y2 = line[0] img = cv2.line(img, (x1, y1), (x2, y2), (255, 255, 255), 3) except: return img else: return img# 主函數(shù)def mainn(): # 讀取數(shù)據(jù) col_frames = os.listdir(‘。。/frames/’) # 排序 col_frames.sort(key=lambda f: int(re.sub(‘D’, ‘’, f))) # 讀取畫面每一幀 for i in col_frames: img = cv2.imread(i) # 構(gòu)建一個掩膜 mask = mask_create() # 對原圖像進(jìn)行掩膜計算 masked_frame = mask_calc(img, mask) thresh = threshold(135, 255, masked_frame) img = hough(thresh, img) cv2.imshow(‘img’, img) if cv2.waitKey(40) == ord(‘q’): break cv2.destroyAllWindows()
mainn()
編輯:jq
-
函數(shù)
+關(guān)注
關(guān)注
3文章
4344瀏覽量
62812 -
OpenCV
+關(guān)注
關(guān)注
31文章
635瀏覽量
41424 -
python
+關(guān)注
關(guān)注
56文章
4801瀏覽量
84882
原文標(biāo)題:[OpenCV]經(jīng)典霍夫變換原理
文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論