什么是OCR

OCR的英文全稱：

OCR是英文Optical Charac ter Recognition的縮寫，意思是光學字符識別，也可簡單地稱為文字識別，是文字自動輸入的一種方法。它通過掃描和攝像等光學輸入方式獲取紙張上的文字圖像信息，利用各種模式識別算法分析文字形態特征，判斷出漢字的標準編碼，并按通用格式存儲在文本文件中，所以，OCR是一種非常快捷、省力的文字輸入方式，也是在文字量比較大的今天，很受人們歡迎的一種輸入方式。

OCR的發展簡況

OCR的概念是在1929年由德國科學家Tausheck最先提出來的，后來美國科學家Handel也提出了利用技術對文字進行識別的想法。而最早對印刷體漢字識別進行研究的是IBM公司的Casey和Nagy，1966年他們發表了第一篇關于漢字識別的文章，采用了模板匹配法識別了1000個印刷體漢字。

20世紀70年代初，日本的學者開始研究漢字識別，并做了大量的工作。我國研究漢字識別的起步比較晚，20世紀70年代末才開始進行OCR的研究工作。早期的OCR軟件，由于識別率及產品化等多方面的因素，未能達到實際要求。同時，由于硬件設備成本高，運行速度慢，也沒有達到實用的程度。只有個別部門，如信息部門、新聞出版單位等使用OCR軟件。1986年以后我國的OCR研究有了很大進展，在漢字建模和識別方法上都有所創新，在系統研制和開發應用中都取得了豐碩的成果，不少單位相繼推出了中文OCR產品。進入20世紀90年代以后，隨著平臺式掃描儀的廣泛應用，以及我國信息自動化和辦公自動化的普及，大大推動了OCR技術的進一步發展，使OCR的識別正確率、識別速度滿足了廣大用戶的要求。

目前，比較流行的OCR軟件很多，英文OCR主要有OmniPage，中文OCR主要有清華紫光OCR、清華文通OCR、漢王OCR、中晶尚書OCR、丹青OCR、蒙恬OCR等。盡管漢字字量大、字形復雜，但OCR技術已經走向成熟。許多OCR軟件不僅能識別黑白印刷體漢字，還能識別灰度和彩色印刷體漢字，識別速度很快，識別正確率達到了99％以上；可識別宋體、黑體、楷體等多種字體的簡、繁體；可對多種字體、不同字號的混排進行識別；有些OCR軟件還能識別圖像、表格。與此同時，對于手寫體漢字識別的研究也取得了很大進展，正確識別率已達到了70％以上。

OCR軟件的應用

在掃描儀市場上，許多類型的辦公和家用掃描儀均配有OCR軟件，如紫光的掃描儀配備了紫光O

CR，中晶的掃描儀配備了尚書OCR，Mustek的掃描儀配備了丹青OCR等。掃描儀與OCR軟件共同承擔著從文稿的輸入到文字識別的全過程。

文稿掃描在辦公領域中經常用到，即將報紙、雜志等媒體上刊載的有關文稿通過掃描儀進行掃描，隨后進行OCR識別，或存儲成圖像文件，留待以后進行OCR識別，將圖像文件轉換成文本文件或Word文件進行存儲。

此外，數字化信息的存儲、傳輸、不僅成本低、效率高，而且能夠適應排版，網絡傳輸等不斷發展的需要。目前我國有很多歷史遺留下來的大量圖書、報刊、雜志等紙質珍品，急需將其轉換成電子信息。如電子圖書館的建立，就需要將圖書逐頁掃描，加上OCR軟件的識別，更替代了人工鍵入文字的工作，大大縮短了錄入時間，減輕了勞動強度，節省了人力且降低了費用，提高了錄入正確率、工作效率和現代辦公自動化程度。

目前OCR軟件與掃描儀的搭配已應用到信息化時代的多個領域，如數字化圖書館，各種報表的識別，以及銀行、稅務系統票據的識別等。隨著網絡化、信息化的發展與普及，其應用范圍將越來越廣泛。

OCR系統的組成

漢字識別軟件OCR的功能是將各種錄入漢字、印刷體或手寫體中每個漢字的圖形或圖像通過計算機辨認出來，并標出漢字類別代碼。因此，漢字識別歸根結底是一個圖像識別問題。由于漢字信息量很大，具有不同的字形、字體，而且結構復雜，因此漢字識別的過程極其復雜。

由于掃描儀的普及與廣泛應用，OCR軟件只需提供與掃描儀的接口，利用掃描儀驅動軟件即可。因此，OCR軟件主要是由圖像處理模塊、版面劃分模塊、文字識別模塊和文字編輯模塊等4部分組成。

1、圖像處理模塊

圖像處理模塊主要具有文稿掃描、圖像縮放、圖像旋轉等功能。通過掃描儀輸入后，文稿形成圖像文件，圖像處理模塊可對圖像進行放大，去除污點和劃痕，如果圖像放置不正，可以手工或自動旋轉圖像，目的是為文字識別創造更好的條件，使識別率更高。

2、版面劃分模塊

版面劃分模塊主要包括版面劃分、更改劃分，即對版面的理解、字切分、歸一化等，可選擇自動或手動兩種版面劃分方式。目的是告訴OCR軟件將同一版面的文章、表格等分開，以便于分別處理，并按照怎樣的順序進行識別。

3、文字識別模塊

文字識別模塊是OCR軟件的核心部分，文字識別模塊主要對輸入的漢字進行"閱讀"，但不能一目多行，必須逐行切割，對于漢字通常也是一個字一個字地辨認，即單字識別，再進行歸一化。文字識別模塊通過對不同樣本漢字的特征進行提取，完成識別，自動查找可疑字，具有前后聯想等功能。

4、文字編輯模塊

文字編輯模塊主要對OCR識別后的文字進行修改、編輯，如系統識別認為有誤，則文字會以醒目的紅色或藍色顯示，并提供相似的文字供選擇，選擇編輯器供輸出等。

OCR軟件的使用方法

OCR軟件的種類雖然很多，但其使用方法大同小異。首先要對文稿進行掃描，然后進行OCR識別。OCR軟件的使用方法如下：

1、文稿掃描

為了利用OCR軟件進行文字識別，可直接在OCR軟件中掃描文稿。運行OCR軟件后，會出現OCR軟件界面。

將要掃描的文稿放在掃描儀的玻璃面上，使要掃描的一面朝向掃描儀的玻璃面并讓文稿的上端朝下，與標尺邊緣對齊，再將掃描儀蓋上，即可準備掃描。點擊視窗中的"掃描"鍵，即可進入掃描驅動軟件進行掃描，有關掃描方法這里不再贅述。但應注意的是：分辨力可設置在200～400dpi，對于文本文檔，調整亮度適中很關鍵。掃描后的文檔圖像出現在OCR軟件視窗中。

2、OCR識別

為了便于操作，可從菜單中選擇選項，各種圖標出現在視窗的左邊。

為了更好使用，首先從上到下介紹畫面左邊的圖標：

"放大"工具：用于放大圖像；"縮小"工具：用于縮小圖像；"設定識別區域"工具：用于設定識別區域；"設定識別順序"工具：用于設定識別順序；"刪除識別區域"工具：用于刪除識別區域；"擦除圖像雜點"工具：用于擦除圖像中的雜點；"擦拭圖像塊"工具：用于擦除圖像中的某一區域；"旋轉圖像"工具：用于將圖像旋轉90°、180°或270°；"傾斜校正"工具：用于手動圖像傾斜校正。

OCR識別的一般步驟：

(1)文稿掃描后，剛開始出現在視窗中的要識別的文字畫面很小，首先選擇"放大"工具，對畫面進行適當放大，以使畫面看得更清楚。必要時還可以選擇"縮小"工具，將畫面適當縮小。

(2)如果畫面需要旋轉90°，180°或270°，可使用"旋轉圖像"工具旋轉圖像。如果文字畫面傾斜，可選擇"傾斜校正"工具，將畫面調正。

(3)識別時選擇"設定識別區域"工具，在文字畫面上框出要識別的區域，這時也可根據畫面情況框出多個區域。如果所框區域有誤，則可使用"刪除識別區域"工具，刪除所選識別區域。

(4)為了提高識別率，如果所選識別區有雜點或有不能識別的圖像，則可選擇"擦除圖像雜點"工具，將雜點一點一點地擦除。如果需要成片地擦除，則可選擇"擦拭圖像塊"工具。

(5)點擊"識別"圖標，則OCR顯示正在進行文字切分，然后轉入"正在識別"畫面，將識別的文字逐步顯示出來，"文稿校對"窗口。

許多OCR軟件都具有文字修改功能，被識別出可能有錯誤的文字，用比較鮮明的顏色顯示出來，并且可以進行修改。

(6)將識別后的文件存儲成文本(TXT)文件或Word的RTF文件。

閱讀全文

OCR(16048) OCR(16048)

flutter_ocr Flutter開發的OCR軟件

./oschina_soft/flutter_ocr.zip

2022-06-24 14:43:41

OCR實戰教程

OCR 是光學字符識別（英語：Optical Character Recognition，OCR）是指對文本資料的圖像文件進行分析識別處理，獲取文字及版面信息的過程。

2023-02-24 10:36:16

436

樹洞OCR文字識別跨平臺的OCR小工具

./oschina_soft/tools-ocr.zip

2022-05-30 09:42:22

OpenHarmony集成OCR三方庫實現文字提取

1. 簡介Tesseract(Apache 2.0 License)是一個可以進行圖像OCR識別的C++庫，可以跨平臺運行。本樣例基于Tesseract庫進行適配，使其可以運行在OpenAtom

2022-11-15 12:09:50

OCR識別技術

在爬蟲對驗證碼進行破解時，經常需要對圖片中的文字內容進行識別，這時就需要用到OCR技術了，那么 OCR識別技術是如何實現對文字內容“即拍即得”的呢？

2021-03-12 09:07:15

3841

輸液袋噴碼OCR字符檢測# 機器視覺# OCR識別# 自動化檢測# 噴碼字符檢測

OCR

fuweizn發布于 2023-04-17 15:53:01

基于FPGA的OCR文字識別技術的深度解析

OCR在通用文字識別等場景下有廣泛應用，基于FPGA異構加速的OCR識別相比CPU/GPU實現具有延時小、成本低的優勢。我們設計了多FPGA芯片協同的異構加速架構，能快速適配業務OCR模型變化，檢測

2018-01-26 12:19:00

3457

使用數字識別和AI實現OCR的資料合集

本文檔的主要內容詳細介紹的是使用數字識別和AI實現OCR的資料合集。

2020-07-17 08:00:00

OCR光學圖文識別

使用OCR功能，您可以簡單地將掃描的PDF和基于圖像的PDF轉換為具有可編輯、可選擇和可搜索內容的各種格式，例如MicrosoftOffice格式、PPT、頁面或純文本文檔（TXT文件）。

2022-08-19 15:23:37

494

開源OCR 過程介紹

不久前，百度技術團隊在不久前，百度技術團隊在 GitHub 上正式開源了一款 OCR 神器，在發布后不久便多次沖上 GitHub Trending 榜單，引起了技術圈內開發者的熱議，今天就跟大家好

2020-10-30 10:54:39

2904

darknet-ocr中文自然場景文字檢測及識別

./oschina_soft/darknet-ocr.zip

2022-06-17 15:07:29

大模型時代的OCR，“CPU” 的味道更重了

金磊楊凈發自凹非寺量子位 | 公眾號 QbitAI 經典技術 OCR （光學字符識別），在大模型時代下要“變味”了。怎么說？我們都知道OCR這個技術在日常生活中已經普及開了，像各類

2023-07-08 14:25:02

140

移動端證件OCR識別/安卓IOS平臺

一、證件識別/證件OCR介紹移動端證件識別是開發的基于移動平臺的證件識別/證件OCR應用程序，支持Android、iOS等多種主流移動操作系統。該產品采用手機、平板電腦攝像頭拍攝證件圖像，然后通過

2018-06-15 15:42:05

159

基于傳統算法的OCR技術

對于文字識別，實際中一般首先需要通過文字檢測定位文字在圖像中的區域，然后提取區域的序列特征，在此基礎上進行專門的字符識別。但是隨著CV發展，也出現很多端到端的End2End OCR。

2022-06-20 14:31:40

1544

基于模板匹配的OCR盲人導讀儀器（STM32+OV5640）

基于模板匹配的OCR盲人導讀儀器（STM32F407+OV5640）

2017-12-11 16:39:53

OCR算法能較好識別水平排布的常規文本

OCR技術發展到今天，對于常規文本的識別已經達到了較高的準確率。

2022-08-08 16:04:51

946

OCR文字識別視覺檢測系統應用程序免費下載

本文檔的主要內容詳細介紹的是OCR文字識別視覺檢測系統應用程序免費下載。

2020-05-28 17:31:00

TH-OCR文字識別系統介紹

TH-OCR文字識別系統的工作原理為通過掃描儀或數碼相機等光學輸入設備獲取紙張上的文字圖片信息，OCR文字識別系統實際上是讓計算機認字，實現文字自動輸入。

2011-12-27 16:04:16

1952

關于開放平臺OCR上線印刷文字識別的介紹

我們為什么用OCR？因為可以快速將文字轉為可在設備上編輯的數字文本。因此能夠得到用戶青睞的OCR小編認為應能夠準確生成文本，所見即所得，同時對不同字體，不同環境，不同顏色形狀的文本準確識別。

2019-09-27 09:51:31

2242

機器視覺運動控制一體機應用例程|OCR字符識別應用

應用背景 OCR字符識別的應用場景非常廣泛，例如在生產型企業領域中，OCR具有多樣性的應用，比如讀取儀表儀器上的文本，進行實時監控、讀取產品上的生產日期、批號，以此來獲得產品的信息和可追溯產品當天

2022-02-24 17:27:33

1063

基于人工智能技術的OCR應用

光學字符識別（Optical Character Recognition，OCR）是將圖像中的文字信息轉化為可供計算機處理的字符信息的技術，發揮著計算機“眼睛”的功能，是機器與現實世界進行視覺交互的重要技術基礎。

2021-04-09 10:54:11

6759

關于OCR 你想了解的可能都在這兒了

導讀 OCR中的研究，工具和挑戰，都在這兒了。介紹我喜歡OCR(光學字符識別)。對我來說，它代表了數據科學，尤其是計算機視覺的真正挑戰。這是一個現實世界的問題，它有很多方法，包括計算機視覺

2021-04-26 13:43:53

5970

PDF執行OCR使用指南（僅適用于萬興PDF專業版）

然后單擊“更改選擇”按鈕，從OCR語言列表中選擇匹配PDF內容的正確語言（萬興PDF支持超過20種OCR語言）。您也可以點擊“自定義頁面”來選擇單個頁面或幾個頁面執行OCR。

2023-06-06 15:54:57

717

TensorRT和Triton助力微信OCR降低耗時和成本

通過使用NVIDIA的TensorRT對微信識物和OCR的模型進行加速，在降低單次推理時延50%以上的同時，節約了多達64%的顯存。

2022-04-13 14:44:26

1272

基于FPGA異構加速的OCR識別技術解析

目前OCR技術在證件識別、快遞單掃描、信息安全審核等領域有著廣泛的應用。架構平臺部FPGA團隊研發的OCR硬件加速解決方案，提供低成本、實時性AI計算加速，將持續助力公司內各業務發展。在云端

2017-12-14 05:32:44

2518

機器視覺中OCR印字檢測的類型有哪些

越來越多企業需要進行殘次品的檢測以來保證產品的質量的。無論的工業產品還是紡織產品在生產中都難免會有瑕疵的出現，用人工檢測會有許多的不足。所以我們就越來越多的選擇機器視覺來代替人工。OCR也是視覺檢測的一種，今天我們就來談談OCR檢測吧。

2021-10-09 17:19:50

472

Tesseract-OCR中如何實現結構化的文檔分析

主要是介紹用它做項目時候需要注意的問題與一些比較重要的函數使用。主要介紹一下Tesseract-OCR中如何實現結構化的文檔分析以及相關區域的定位識別。

2023-01-12 14:05:08

777

觸控面板為什么要用OCA&OCR貼合呢？

在貼合材料部分，目前業界采用的膠材可分為兩大主流，一是固態的OCA光學膠，另一種則是液態的OCR光學膠貼合

2023-01-08 16:39:44

2726

如何讓文本識別更加智能，數據堂獲取這些OCR轉寫數據

近年來，學生黨們擁有了一款新的學習神器拍照搜題。當遇到不會做的題目時，只需要對著題目拍照，手機中就會出現這道題目的詳細解答思路和答案。拍照搜題背后的黑科技就是光學字符識別技術，即OCR。OCR是指

2020-09-17 11:34:07

1838

免費版文字識別系統 TH-OCR SDK11.0

電子發燒友網站提供《免費版文字識別系統 TH-OCR SDK11.0.exe》資料免費下載

2014-07-23 14:10:09

API-Shop-OCR-營業執照識別API接口Python調用示例代碼說明

本文檔的主要內容詳細介紹的是API-Shop-OCR-營業執照識別API接口Python調用示例代碼說明

2019-01-10 11:48:44

通過圖像處理改善OCR識別結果的實例

本文主要介紹一個通過圖像處理改善OCR識別結果的實例，并給出詳細步驟和源碼。 **背景介紹** 在很多情況下，文字識別會遇到困難。比如非單一的背景、雜訊干擾、文字部分缺失等。

2023-02-08 16:54:36

383

如何使用Python開發截圖識別OCR的小工具

　你一定用過那種“OCR神器”，可以把圖片中的文字提取出來，極大的提高工作效率。今天，我們就來做一款實時截圖識別的小工具。顧名思義，運行程序時，可以實時的把你截出來的圖片中的文字識別出來。

2020-01-04 11:27:00

3031

論文小助手【Lal_OCR工具】

gitee倉庫地址： https://gitee.com/lalhan/LAL_OCR 一、產品需求（1）解決痛點 ? PDF文獻翻譯帶換行，無法直接翻譯（2）競品體積大需安裝隨時不可用

2023-06-14 10:41:35

138

賦能AI測試 Testin云測與英特爾合作將OCR模型推理效率提升6倍

OCR 深度學習方案使用的都是 GPU，通過其強大的并行計算能力來提升文本推理能力。

2019-11-22 09:43:00

655

OCR光學字符識別技術原理講解

　OCR （光學字符識別）是指電子設備（例如掃描儀或數碼相機）檢查紙上打印的字符，通過檢測暗、亮的模式確定其形狀，然后用字符識別方法將形狀翻譯成計算機文字的過程；即，針對印刷體字符，采用光學的方式將

2019-03-02 13:49:56

19357

服務器端駕駛證/行駛證OCR拍照識別API

駕駛證/行駛證OCR拍照識別API即服務器版駕駛證/行駛證OCR拍照識別軟件，該軟件可部署在客戶私有服務器中（私有本地服務器或云服務器均可），APP和業務系統可通過web service接口調用該

2018-06-22 17:08:06

244

在線研討會 | 就在明天！NVIDIA TAO Toolkit 5.0 助力 OCR 視覺 AI 模型快速訓練與優化

光學字符識別（OCR）技術是一種將紙質文檔、PDF 文件或圖像中的文本轉換成機器可識別的格式的技術。它在許多領域都有廣泛的應用，例如文檔掃描、自動化數據輸入、圖書館數字化等。然而，盡管 OCR

2023-08-21 21:05:05

143

企業智能化應用場景，華為云文字識別 OCR 值得一試

。想象一下，如果我們能夠快速地提取出圖片中的文本信息，并將其轉化為結構化的數據，那么我們就能夠實現很多智能化的應用場景，提升我們的業務效率和用戶體驗。這就是我為什么推薦華為云文字識別 OCR 的原因。 OCR 是什么？

2023-07-04 14:43:07

149

關于機器視覺OCR字符檢測的應用

OCR字符采集檢測具有非常廣闊的市場需求。如今，機器視覺檢測技術被廣泛應用于工廠品檢，在尺寸測量、外觀缺陷檢測、字符識別、定位等方面，極大地提高了生產自動化程度。接下來，昊天宸小編為大家介紹一下機器視覺檢測技

2022-01-05 18:10:26

508

機器視覺檢測—OCR字符檢測的應用

工作人員的勞動強度，而且檢測質量也難以得到保障。其次，則是效率低下，浪費時間成本。利用機器視覺技術進行OCR字符采集檢測，能快速將該印品的標準圖像（模板）相匹配比較，如果發現差異并超出設定的公差范圍，即判定為

2021-11-18 15:54:38

492

包裝袋噴碼字符OCR視覺檢測，助力食品行業高質量檢測

包裝袋噴碼字符OCR視覺檢測，實現對食品外包裝日期噴碼的漏碼、錯碼、歪碼、打碼位置偏移等準確識別。

2023-03-27 14:54:26

575

OpenHarmony集成OCR三方庫實現文字提取

觀點 1.?簡介 Tesseract(Apache 2.0 License)是一個可以進行圖像OCR識別的C++庫，可以跨平臺運行。本樣例基于Tesseract庫進行適配，使其可以運行

2022-11-14 21:25:21

681

酸奶瓶蓋噴碼OCR字符檢測，高效助力乳制品行業本降本增效

酸奶生產線應用OCR字符檢測系統，企業可以高效地完成對產品的包裝噴碼檢測，還可以正確讀取產品的包裝信息，從而對產品質量嚴格把關。

2022-12-20 10:48:55

帶有OCR的監視攝像機對于車牌識別系統至關重要

我們甚至看到過帶有OCR的監視攝像機，用于監視進出客戶場所的有軌電車和拖車。這對客戶來說是很有價值的，因為貨運公司會在汽車卸貨時在其財產上向客戶收費。如果客戶可以減少卸貨時間，那么他們可以減少運營成本。

2020-09-02 16:55:33

2650

帶帶弟弟OCR通用驗證碼識別SDK免費開源版

在使用爬蟲登錄網站的時候，經常輸入用戶名和密碼后會遇到驗證碼，簡單一點的有字母驗證碼，復雜一點的有滑塊驗證碼，點選文章和點選圖片驗證碼。這些都是爬蟲中的老大難問題，今天介紹一款通用驗證碼識別 SDK 對他們徹底說拜拜，它的名字是 ddddocr 帶帶弟弟 OCR 通用驗證碼識別 SDK 免費開源版。

2022-03-30 17:26:01

3910

已全部加載完成

搜索歷史

什么是OCR

評論