資料介紹
軟件簡介
由 TensorFlow 2 和 PyTorch 提供支持,任何人都可以無縫訪問光學字符識別
獲取預訓練模型
使用兩階段方法在 docTR 中實現端到端 OCR:文本檢測(定位單詞),然后文本識別(識別單詞中的所有字符)。因此,可以從可用實現列表中選擇用于文本檢測的架構和用于文本識別的架構。
from doctr.models import ocr_predictor model = ocr_predictor(det_arch='db_resnet50', reco_arch='crnn_vgg16_bn', pretrained=True)
讀取文件
可以從 PDF 或圖像解釋文檔:
from doctr.io import DocumentFile # PDF pdf_doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Image single_img_doc = DocumentFile.from_images("path/to/your/img.jpg") # Webpage webpage_doc = DocumentFile.from_url("https://www.yoursite.com").as_images() # Multiple page images multi_img_doc = DocumentFile.from_images(["path/to/page1.jpg", "path/to/page2.jpg"])
以默認的預訓練模型為例:
from doctr.io import DocumentFile from doctr.models import ocr_predictor model = ocr_predictor(pretrained=True) # PDF doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Analyze result = model(doc)
安裝
安裝 docTR 需要 Python 3.6(或更高版本)和?pip。
由于使用了?weasyprint,如果沒有運行在 Linux 系統之上,將需要額外的依賴項。
對于 macOS 用戶,可以按如下方式安裝它們:
brew install cairo pango gdk-pixbuf libffi
對于 Windows 用戶,這些依賴項包含在 GTK 中。
最新版本
pip install python-doctr
- 樹洞OCR文字識別跨平臺的OCR小工具
- 基于LSTM的表示學習-文本分類模型 18次下載
- 基于主題分布優化的模糊文本分類方法 5次下載
- 基于殘差連接的改進端到端文本識別網絡結構 6次下載
- 基于LSTM的流式文檔結構識別方法 7次下載
- 膠囊網絡在短文本多種意圖識別的應用及研究 10次下載
- 基于BP神經網絡分類器的垃圾文本過濾模型 43次下載
- 基于神經網絡的中文文本蘊含識別模型 7次下載
- 新型中文旅游文本命名實體識別設計方案 24次下載
- 使用數字識別和AI實現OCR的資料合集 20次下載
- OCR文字識別視覺檢測系統應用程序免費下載 24次下載
- API-Shop-OCR-營業執照識別API接口Python調用示例代碼說明 6次下載
- 基于文本分類計數識別平臺設計(JAVA實現) 11次下載
- 串口屏技術文檔—文本限值提示如何修改為英文 14次下載
- 免費版文字識別系統 TH-OCR SDK11.0 0次下載
- 光學識別字符是自動識別技術嗎 111次閱讀
- 光學識別的過程包含哪些 94次閱讀
- 基于OpenVINO+OpenCV的OCR處理流程化實現 590次閱讀
- 可以提取圖像文本的5大Python庫 2186次閱讀
- Tesseract的進階用法和最佳實踐 1058次閱讀
- OCR實戰教程 859次閱讀
- 如何將PP-OCRv3英文識別模型部署在Corstone-300虛擬硬件平臺上 2214次閱讀
- OCR算法能較好識別水平排布的常規文本 1248次閱讀
- 如何使用Python開發截圖識別OCR的小工具 3404次閱讀
- 如何實現自動識別并提取圖片中的文本內容 1.5w次閱讀
- ocr技術是什么?新能源充電樁應用車牌識別ocr技術 2557次閱讀
- Facebook研究人員提出了一個大規模圖像文本提取和識別系統——Rosetta 3255次閱讀
- 如何使用EAST文本檢測器在自然場景下檢測文本 1.1w次閱讀
- 服務器端發票識別api接口 2625次閱讀
- 基于FPGA異構加速的OCR識別技術解析 2857次閱讀
下載排行
本周
- 1匯川變頻器圖紙
- 0.44 MB | 2次下載 | 免費
- 2英威騰變頻器圖紙
- 1.10 MB | 1次下載 | 免費
- 351單片機pwm和spwm
- 0.19 MB | 1次下載 | 免費
- 4EE-177:SHARC SPI從機引導
- 43.67KB | 次下載 | 免費
- 5AN-1191:使用ADSP-BF527 ADV7182全頻率CMRR測量
- 187.67KB | 次下載 | 免費
- 6AN136-非隔離式開關電源的PCB布局注意事項
- 210.18KB | 次下載 | 免費
- 7AN125-將LTM2881用作隔離式5V電源
- 92.52KB | 次下載 | 免費
- 8AN8-電池功率調節技術
- 691.35KB | 次下載 | 免費
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 137次下載 | 1 積分
- 3基于STM32單片機智能手環心率計步器體溫顯示設計
- 0.10 MB | 128次下載 | 免費
- 4使用單片機實現七人表決器的程序和仿真資料免費下載
- 2.96 MB | 44次下載 | 免費
- 53314A函數發生器維修手冊
- 16.30 MB | 31次下載 | 免費
- 6美的電磁爐維修手冊大全
- 1.56 MB | 22次下載 | 5 積分
- 7如何正確測試電源的紋波
- 0.36 MB | 12次下載 | 免費
- 8使用TL431設計電源
- 0.67 MB | 10次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935119次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191367次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65987次下載 | 10 積分
評論
查看更多