我以前研究過一段時間的OpenMV的源碼,當時的功力太淺,看不大懂,現在又重新的翻出來看。
先確定代碼在哪里,OpenMV是在資源受限的情況下執行視覺算法,所以里面的很多寫法都是高效的,被優化過的,這也是我讀的一個原因。
第一先讀第一個文件,是一個角點的快速查找算法。圖像基礎的操作都被封裝在了我現在展示的這個文件里面。
什么是角點?
角點通常被定義為兩條邊的交點,或者說,角點的局部鄰域應該具有兩個不同區域的不同方向的邊界。角點檢測(Corner Detection)是計算機視覺系統中獲取圖像特征的一種方法,廣泛應用于運動檢測、圖像匹配、視頻跟蹤、三維重建和目標識別等,也可稱為特征點檢測。
這張圖可以說是非常的簡單明了。
角點的基本算法:選取一個局部窗口,將這個窗口沿著各個方向移動,計算移動前后窗口內像素的差異的多少進而判斷窗口對應的區域是否是角點。
這個就是數學上的描述
我們尋找的角點就是去滑動判斷。
這個就是我說的常見操作被打包的地方
它提供了低級圖像處理操作的定義和函數。像素格式,基本圖像統計,濾波,邊緣檢測,形狀檢測,條碼識讀等。
使用定點數代替浮點數。直接對原始像素緩沖區進行操作。
支持常見的圖像格式,像BMP,PPM,JPEG等。以及基本的機器視覺功能,比如模板匹配,QR碼識讀。
有在圖像上繪制基本形狀,線條,文字等的函數。
在可用時使用DMA和SIMD指令做硬件加速。不可用時回退到C實現。
使用C語言編寫,但可以通過FFI在更高級語言如MicroPython或Arduino中使用。
OpenMV開源開發,作為他們的機器視覺相機模塊的一部分。但可以獨立使用。
這個是要看的算法的函數
這個算法現在討論的很少,我就簡單的說下:自適應通用角點檢測(Adaptive and Generic Accelerated Segment Test,AGAST)算法,該算法是對FAST算法的一種改進主要提升了速度與亮度變化下的魯棒性,但沒有解決尺度不變性。
現在接著看代碼。上面的代碼里面大體是實現了:
init5_8_pattern() 函數:
初始化像素橫豎方向偏移量,用于后續快速訪問周圍像素。
agast58_detect() 函數:
使用5x5個像素組成的模板匹配算法掃描圖像,找到角點。
像素值大于或小于中心點像素值的偏移量編碼成一個64位的特征碼。
如果匹配了角點模板,記錄下角點坐標。
agast58_score() 函數:
使用二分法找到最佳的閾值,進一步提高角點質量。
周圍5x5像素值和該閾值進行比較,如果匹配角點模板,說明是角點。
不斷調整閾值,找到使得匹配模板的像素數最多的閾值。
nonmax_suppression() 函數:
應用非極大值抑制進一步提煉角點。
抑制掉像素梯度較小的不明顯角點。
alloc_keypoint() 函數:
將檢測到的角點包裝成 keypoints 數據結構。
第一次見這種寫法
該變量是用于儲存圖像像素的偏移量,用于快速訪問像素周圍的像素灰度值。
s_offset0 表示相對于當前像素的左上方像素的偏移量。
具體來說:
s_offset0 表示相對于(x,y)的(x-1, y-1)像素
s_offset1 表示相對于(x,y)的(x-1, y)像素
s_offset2 表示相對于(x,y)的(x, y-1)像素
以此類推
通過預先計算好這些固定的偏移量,就可以通過 指針偏移 的方式,快速獲取周圍像素的值,而不需要每次都計算坐標關系,從而提高效率。所以,這個 s_offset0 變量就是一個優化手段,用來加速周圍像素訪問。
我們看第一個函數的簽名,有個*,這里就要寫一下C語言的知識了。
先說這個函數的作用-agast58_detect() 是AGAST算法中用于檢測角點的主要函數。
它的主要功能是:
在輸入圖像img上,使用一個5x5像素模板滑動掃描。
將中心像素與周圍像素進行比較,大于或小于閾值b的編碼成一個特征碼。
如果特征碼與角點的模板匹配,則記錄該像素為角點候選。
所有檢測到的角點候選保存在 corner_t 結構體數組 corners 中。
num_corners 為輸出參數,用于返回檢測到的角點總數。
roi 參數用于指定只檢測圖像的某個區域。
其中corner_t結構體包含了每個檢測到角點的x,y坐標和score明顯性分數。
agast檢測依賴于一個經過優化的像素訪問順序以及二值比較來實現高效運算。
在C語言中,函數名前面的*代表該函數返回一個指針類型。
對于agast58_detect這個函數:
返回值的類型是corner_t*,是一個指向corner_t結構體的指針。
這個指針指向一個動態分配的數組,用于存儲檢測到的所有角點。
加上*的原因:
返回一個指針,函數可以返回一個數組或對象,不僅僅是一個scalar值。
指針訪問內存速度快,不需要拷貝整個數組。
函數執行結束后,指針變量還可以被外部代碼訪問,相當于函數可以修改外部變量。
把返回數組的內存管理交給調用者,函數執行完就可以釋放內部內存,不用維護資源。
總結一下:
*表示返回一個指針
可以返回動態數組/對象
提高效率,不拷貝大數組
指針可修改外部變量
內存管理交給調用者
程序的實現里面大量的使用了指針的偏移,基本思想是:
直接通過指針運算獲取相鄰像素,而不用每次計算坐標。
預先計算好偏移量,例如左上角像素的偏移量是 -1行 -1列。
將這些固定偏移量存儲在變量中,比如s_offset0。
在訪問像素時,直接基于指針偏移這個固定的值,這樣就跳過了坐標計算。
例如,當前指針指向像素 (x, y):
uint8_t *imgPtr = &img[y * width + x];
獲取左上角像素,不用偏移:
uint8_t leftUp = img[ (y-1) * width + (x-1) ]; // 需要計算坐標
使用偏移:
int offset0 = -width - 1; // 預先計算偏移量 uint8_t leftUp = imgPtr[offset0]; // 基于指針偏移
通過指針偏移,避免每次獲取相鄰像素時重復計算偏移量,這樣可以明顯減少計算量,從而加速像素訪問。
再看這個函數,這個alloc_keypoint()函數是用于分配和初始化一個關鍵點結構kp_t的。
它做了以下幾件事:
使用xalloc0()在堆上分配一個kp_t結構的內存,并初始化為0。
將傳入的x,y坐標及score分數存入kp_t中。
注釋里提到必須將描述子descriptor數組初始化為0。這里通過xalloc0()預先設置為0實現。
返回這個kp_t指針。
這樣調用者就可以拿到一個堆上分配的、坐標與分數填充了、描述子初始化為0的關鍵點結構kp_t。
需要注意的是:
必須初始化描述子數組,后續的特征描述算子會填充描述子。
使用xalloc0()而不是malloc,可以自動初始化內存為0。
返回 kp_t 指針,調用者可以進一步訪問關鍵點數據。
綜上,這是一個輔助函數,用于根據坐標分數快速創建一個關鍵點結構.
它自己又重寫了一次這個malloc的函數,xalloc0()是一種自定義的內存分配函數,與malloc()類似,但是有一些額外的功能:
當size為0時,直接返回NULL,而不報錯。這與malloc的行為不同。
使用gc_alloc在堆上分配內存,這是MaixPy特有的 gc 堆內存分配函數。
分配成功后用memset清零內存。這是xalloc0的關鍵功能之一。
如果分配失敗,調用xalloc_fail導致程序異常。
返回清零后的內存指針。
這樣使用xalloc0比malloc好在:
SIZE為0時不會錯誤。
自動清零內存,不需再memset。
與MaixPy的GC堆內存管理兼容。
出錯時終止程序,不需要額外判斷返回NULL情況。
這個init5_8_pattern()函數是用于初始化圖像像素的8方向偏移量,這是AGAST算法的一個優化。
它的作用是:
接收圖像的寬度width作為參數。
如果當前寬度與已保存的s_width相同,直接返回,不再初始化,避免重復計算。
如果寬度變了,更新s_width為新寬度。
計算8個方向相對當前像素點的偏移量:
s_offset0 (-1, -1) 左上角
s_offset1 (-1, 0) 正上方
...
s_offset7 (-1, 1) 左下角
偏移量根據圖像寬度width調整,即乘以width。
這樣,在后續檢測角點時,可以直接用這些預計算偏移訪問周圍像素,不需要每次都計算坐標偏移,加速了像素訪問。通過一次初始化,減少重復計算,從而提升檢測效率。充分利用了圖像具有固定尺寸的特點。
這個agast_detect()函數實現了AGAST角點檢測的完整流程:
初始化5x5窗口的偏移量init5_8_pattern()
調用agast58_detect()函數進行角點檢測,返回檢測到的角點數組
對每一個角點調用agast58_score()計算明顯性分數
進行非極大值抑制nonmax_suppression(),過濾掉弱角點
將剩下的角點保存在輸出的keypoints數組中
釋放臨時的角點內存fb_free()
所以這個函數將角點檢測、評分和濾波三個階段包裝起來,實現了一個完整的AGAST角點檢測器。
它接受輸入圖像,檢測參數(threshold),區域等,最終輸出經過優化的高質量角點集。
其實還沒有完全說完,這個函數很長:
大概是這樣的
初始化循環邊界 - xsizeB, ysizeB 定義了只在圖像有效區域內循環
分配內存 - 使用 fb_alloc 在內存池中分配 corner_t 數組
雙重循環 - 外層循環 y 方向,內層循環 x 方向掃描每個像素
像素比較 - 在 homogeneous 和 structured 兩個標簽下,使用偏移像素比較中心像素,判斷是否匹配角點模式
記錄角點 - 如果匹配就記錄下角點坐標到 corners 數組
返回結果 - 將檢測到的角點數量賦值給 num_corners,并返回角點數組
里面的循環做的這個事情比較多。
同樣下頭的還有一個函數, agast58_score() 函數主要實現了A-GAST算法中使用二分法搜索最佳閾值的步驟。
主要流程是:
初始化閾值的上下限 bmin、bmax。
不斷循環,將當前閾值 b 代入角點模式比較。
如果匹配了角點模式,則把 b 作為新的下限 bmin。
如果不匹配角點模式,則把 b 作為新的上限 bmax。
通過二分不斷逼近使得角點模式匹配的像素數最多的閾值。
當上下限只差1時,返回最佳閾值 bmin。
關鍵點:
使用二分搜索提升角點明顯性。
像素比較使用偏移訪問提速。
通過不斷調整閾值 b 尋找最佳角點模式匹配。
返回最佳閾值,作為該像素角點的分數。
看下這個檢測算法里面的這個句子,
循環遍歷所有檢測到的角點 corners
計算每個角點的像素指針 - 通過角點的 x,y 坐標,計算在圖像像素數組中的偏移量
調用 agast58_score() 并傳入像素指針和閾值threshold
agast58_score() 將返回0-255范圍的分數,記錄在 corner[i].score 中
最后每個角點除了有坐標x,y之外,還有一個分數score表示角點的明顯程度。
所以這個過程對每一個角點候選運行了二分搜索,找到了最佳的閾值,作為該點的分數。分數高的角點匹配度更好,更明顯,更穩定,這樣后續就可以基于分數進行非極大值抑制來過濾掉弱角點。這種為每個角點單獨密集計算的方式也是AGAST算法區別于FAST算法的主要特點之一。
這個非極大值抑制(non-maximum suppression)函數的作用是去除重復或邊緣響應較弱的非極大值角點,只保留每個局部區域響應最強的角點。
主要步驟是:
計算每一行的起始角點索引,用于快速查找上下行角點。
對每個角點,檢查其上下左右4鄰域是否存在更高分數的角點。
如果存在,則抑制該角點,不將其錄入最終角點集。
只保留每個局部區域分數最高的角點。
檢查內存是否足夠,不足則試圖釋放內存使能繼續錄入角點。
將抑制后的角點保存到輸出數組中。
這通過只保留局部最大值點,去除了邊緣響應較弱的重復角點,提升了角點質量。
AGAST算法相比FAST算法加入了這個非極大值抑制步驟,可以有效提升角點的重復性和分布均勻性。
里面有一個這樣的句子,是初始化 row_start 數組,row_start 數組用來記錄每一行的第一個角點在 corners 數組中的索引。
具體地:
row_start 的大小是圖像總行數+1,即 last_row + 1
使用 -1 來表示該行沒有檢測到角點
初始化所有值為 -1,表示剛開始還沒有任何角點
后面在檢測到角點時會記錄:
row_start[角點所在行] = 角點在corners數組中的索引
所以row_start[y] = x 表示:
第y行的第一個角點在corners數組中的索引為x
這樣初始化row_start為-1VeryAmerican,在后續的非極大值抑制中,就可以通過row_start數組快速獲取上下行的角點信息,從而高效實現非極大值抑制。
審核編輯:劉清
-
機器視覺
+關注
關注
162文章
4396瀏覽量
120476 -
C語言
+關注
關注
180文章
7613瀏覽量
137238 -
BMP
+關注
關注
0文章
48瀏覽量
17075 -
計算機視覺
+關注
關注
8文章
1699瀏覽量
46050 -
openMV
+關注
關注
3文章
39瀏覽量
9827
原文標題:OpenMV-AGAST算法代碼閱讀
文章出處:【微信號:TT1827652464,微信公眾號:云深之無跡】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論