OCR簡稱Optical Character Recognition,它是指對于紙上的打印的文字字符進行識別,將識別結果以文本方式存儲在計算機器中。根據識別的字符類型通常可分為印刷體識別和手寫體識別兩大類。
字符識別原理:通過對特征點形狀的提取,分離器分離字符,然后進行文本的輸出。
我們以手寫字體為例進行講解,識別的步驟如下:
1.打開機器視覺軟件。
2.采集圖像。點擊軟件界面“工具箱”-->“圖像處理”-->“采集圖像”,將采集圖像工具拖至流程欄,如圖一所示。采集圖像的方式有文件、目錄、相機三種方式,我們選擇“文件”下采集,如圖二所示。在電腦的文件夾中,選擇格式為JPG或BMP格式的圖片。
圖一
圖二
3.字符識別工具添加。添加“字符讀取”和“字符集合”工具至流程欄,如圖三所示
字符讀取:用于讀取字符文本,需要將標準的字符錄入字符集合中。
字符集合:配合“字符讀取”工具使用,用于存儲字庫模板。
圖三
4.選擇輸入圖像。點擊流程欄的“字符讀取”,選擇輸入的圖像為“Task.1采集圖像”。如圖四所示。
圖四
5.設置檢測區域。在區域設置中,選擇矩形方框,拖動到檢測的字符區域,如圖五所示。
圖五
6.銜接“字符集合”,參數設置。進行分割參數設置(閾值、字符極性、字符寬度、字符 高度)和識別參數設置(最小分數設置)。如圖六所示。
圖六
通過調整參數來達到將字符逐個分割,如圖七所示。
圖七
7.學習字符。如圖八所示,選擇單個學習或全部學習,如圖久所示,將圖像中的字符逐個輸入在學習字符的對話框內,然后“執行”。
圖八
圖九
8.結果顯示。將“系統工具”下的“數據顯示”,將拖至流程欄,點擊“數據顯示”,添加數據文本為“字符讀取”的文本,點擊確定。
圖十
最終的識別結果如下圖所示。
以上為手寫字符識別的全部過程,由于手寫字體具有隨機性、自由化程度高,識別起來比印刷字符困難,因此需要大量的學習才能達到快速正確的識別。
總結:
字符識別流程如下圖所示
-
分離器
+關注
關注
1文章
82瀏覽量
14949 -
機器視覺
+關注
關注
162文章
4399瀏覽量
120492
原文標題:機器視覺知識--手寫字體竟然是這樣識別的?
文章出處:【微信號:GKB1508,微信公眾號:工控幫】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論