在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

PaddleOCR歷史表現回顧

新機器視覺 ? 來源:CSDN ? 作者:CSDN ? 2021-04-15 14:55 ? 次閱讀

一、導讀

OCR方向的工程師,一定需要知道這個OCR開源項目:PaddleOCR

短短半年時間,累計Star數量已超過11.5K,

頻頻登上Github Trending和Paperswithcode 日榜月榜第一,

在《Github 2020數字洞察報告》中被評為中國Github Top20活躍項目。

稱它為 OCR方向目前最火的repo絕對不為過。

最近,它又帶來兩項全新發布:

AAAI 2021 頂會論文開源:PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network 提出了一種簡單且有效的任意方向端到端文本識別模型,在精度可比的基礎上,與之前大火的ABCNet相比,預測速度快了三倍,達到SOTA效果。

多語言支持種類提升至80+種:基本覆蓋國際主流語言種類,在開源測試集MLT2017評估,中文、韓文、日文、拉丁語系、阿拉伯語系,識別效果均顯著優于EasyOCR,開源SOTA效果。

二、PaddleOCR歷史表現回顧

先看下PaddleOCR自去年6月開源以來,短短幾個月在GitHub上的表現:

2020年6月,8.6M超輕量模型發布,GitHub Trending 全球趨勢榜日榜第一。

2020年8月,開源CVPR2020頂會算法,再上GitHub趨勢榜單!

2020年10月,發布PP-OCR算法,開源3.5M超超輕量模型,再下Paperswithcode 趨勢榜第一

2021年1月,發布Style-Text文本合成算法,PPOCRLabel數據標注工具,star數量突破10000+,截至目前已經達到11.5k,在《Github 2020數字洞察報告》中被評為中國Github Top20活躍項目。

e7b9998a-9cdd-11eb-8b86-12bb97331649.gif


這個含金量,廣大的GitHub開發者們自然懂

超輕量模型的效果:火車票、表格、金屬銘牌、翻轉圖片、外語都是妥妥的,

e7c6ba70-9cdd-11eb-8b86-12bb97331649.gif

動靜統一的開發體驗

動態圖和靜態圖是深度學習框架常用的兩種模式。在動態圖模式下,代碼編寫運行方式符合Python程序員的習慣,易于調試,但在性能方面, Python執行開銷較大,與C++有一定差距。

相比動態圖,靜態圖在部署方面更具有性能的優勢。靜態圖程序在編譯執行時,預先搭建好的神經網絡可以脫離Python依賴,在C++端被重新解析執行,而且擁有整體網絡結構也能進行一些網絡結構的優化。

飛槳動態圖中新增了動態圖轉靜態圖的功能,支持用戶使用動態圖編寫組網代碼。預測部署時,飛槳會對用戶代碼進行分析,自動轉換為靜態圖網絡結構,兼顧了動態圖易用性和靜態圖部署性能兩方面優勢。

文本合成工具Style-Text效果:相比于傳統的數據合成算法,Style-Text可以實現特殊背景下的圖片風格遷移,只需要少許目標場景圖像,就可以合成大量數據,效果展示如下:

e83d58e2-9cdd-11eb-8b86-12bb97331649.png

半自動標注工具PPOCRLabel:通過內置高質量的PPOCR中英文超輕量預訓練模型,可以實現OCR數據的高效標注。CPU機器運行也是完全沒問題的。效果演示如下:

e85051ea-9cdd-11eb-8b86-12bb97331649.gif

用法也是非常的簡單,標注效率提升60%-80%是妥妥的。

傳送門:

Github:https://github.com/PaddlePaddle/PaddleOCR

那么最近的2021年4月份更新,又給大家帶來哪些驚喜呢?

三、AAAI 2021 頂會論文:端到端SOTA算法PGNet開源:

直接先看指標評測表現:PGNet算法在ICDAR2015數據集上的檢測及端到端性能表現,在精度接近的條件下,速度上與之前大火的ABCNet相比翻了三倍,達到了SOTA的效果。

e92bad3a-9cdd-11eb-8b86-12bb97331649.png

圖1:PGNet模型的速度與精度性能對比

詳細數據指標:

e936e65a-9cdd-11eb-8b86-12bb97331649.png

表1:ICDAR2015數據集上的檢測及端到端性能

PGNet提出的方法框架如下圖所示,輸入的圖象經過Backbone網絡得到1/4下采樣特征圖,通過多任務學習,同時回歸四個任務的內容,包括文本邊緣偏移量預測(TBO),文本中心線預測(TCL),文本方向偏移量預測(TDO)以及文本字符分類圖預測(TCC)。其中文本行的檢測結果由TBO以及TCL經過后處理得到,文本行的識別結果由TCL,TDO以及TCC的輸出得到。

e94c2998-9cdd-11eb-8b86-12bb97331649.png

圖2 網絡流程框架

在ICDAR2015以及Total-Text數據集上可以看一下模型效果:

e9572848-9cdd-11eb-8b86-12bb97331649.png

圖3Total-Text及ICDAR2015數據集可視化效果圖

PGNet論文地址:https://www.aaai.org/AAAI21Papers/AAAI-2885.WangP.pdf

【基于頂尖算法,開放拿來即用的成熟印章識別能力】同時,基于PGNet研發的印章識別能力已經在百度AI開放平臺開放,可以有效檢測并識別合同文件或常用票據中的印章,輸出文字內容、印章位置信息以及相關置信度,已支持圓形章、橢圓形章、方形章等常見印章。提供標準化API接口,快速集成,同時支持私有化部署至本地,保障業務數據私密性。

ea1bdd82-9cdd-11eb-8b86-12bb97331649.gif

開放能力地址:https://ai.baidu.com/tech/ocr/seal

注:此處非模型直接開源,但可以申請免費試用。

四、豐富的多語言種類支持,目前已經支持全球80+ 語言模型

簡單對比一下目前主流OCR方向開源repo的核心能力:

中英文模型性能及功能對比

ea4c7a82-9cdd-11eb-8b86-12bb97331649.jpg

其中,部分多語言模型性能及功能(F1-Score)對比(僅EasyOCR提供)

ea5daa0a-9cdd-11eb-8b86-12bb97331649.png

模型效果

ea671720-9cdd-11eb-8b86-12bb97331649.gif


值得一提的是,目前已經有全球開發者通過PR或者issue的方式為PaddleOCR提供多語言的字典和語料,在PaddleOCR上已經完成了全球80+ 主流語言的廣泛覆蓋:包括中文簡體、中文繁體、英文、法文、德文、韓文、日文、意大利文、西班牙文、葡萄牙文、俄羅斯文、阿拉伯文、印地文、維吾爾文、波斯文、烏爾都文、塞爾維亞文(latin)、歐西坦文、馬拉地文、尼泊爾文、塞爾維亞文、保加利亞文、烏克蘭文、白俄羅斯文、泰盧固文、卡納達文、泰米爾文,也歡迎更多開發者可以參與共建。

五、良心出品的中英文文檔教程

ea9e056e-9cdd-11eb-8b86-12bb97331649.png


別的不需要多說了,大家訪問GitHub點過star之后自己體驗吧:https://github.com/PaddlePaddle/PaddleOCR

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語言模型
    +關注

    關注

    0

    文章

    524

    瀏覽量

    10277
  • python
    +關注

    關注

    56

    文章

    4797

    瀏覽量

    84689
  • 開源項目
    +關注

    關注

    0

    文章

    37

    瀏覽量

    7189

原文標題:Github Star 11.5K項目再發版:AAAI 2021 頂會論文開源,80+多語言模型全新升級

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    臺積電股價創歷史新高,年度表現有望25年最佳

    近日,全球領先的芯片代工制造商臺積電在臺北股市的股價再度攀升,一度上漲1.4%,成功突破了11月8日創下的1095臺幣的高點,觸及歷史新高。這一優異表現使得臺積電有望創下25年來最佳的年度股票表現
    的頭像 發表于 12-25 14:26 ?190次閱讀

    機智云歷史數據導出與排查指南

    機智云歷史數據導出與排查指南在使用機智云平臺進行設備管理和數據監控時,歷史數據的導出和排查是常見的需求。機智云提供了開放的API接口,方便用戶通過編程方式導出設備歷史數據,以便進行分析或排查故障
    的頭像 發表于 11-21 01:01 ?152次閱讀
    機智云<b class='flag-5'>歷史</b>數據導出與排查指南

    展會回顧 | 明治傳感德國SPS,與世界共享科技創新的果實

    明治傳感——AKUSENSE德國紐倫堡工業展SPS展會回顧01展會盛況:聚焦智能傳感
    的頭像 發表于 11-20 01:05 ?487次閱讀
    展會<b class='flag-5'>回顧</b> | 明治傳感德國SPS,與世界共享科技創新的果實

    臺積電第三季度業績超預期,股價創歷史新高

    近日,臺積電(TSMC)在美股市場大放異彩,周四收盤時股價大漲超過9.79%,創下歷史新高,市值更是達到了驚人的1.07萬億美元。這一強勢表現主要得益于臺積電剛剛披露的第三季度業績,其表現大幅超出了市場的預期。
    的頭像 發表于 10-18 16:43 ?382次閱讀

    手機芯片的歷史與發展

    手機芯片的歷史和由來
    的頭像 發表于 09-20 08:50 ?3416次閱讀

    簡述微處理器的發展歷史

    微處理器的發展歷史是一部充滿創新與突破的技術演進史,它見證了計算機技術的飛速發展和人類社會的巨大變革。以下是對微處理器發展歷史的詳細回顧,內容將涵蓋其關鍵節點、重要里程碑以及技術演進趨勢。
    的頭像 發表于 08-22 14:22 ?2994次閱讀

    圖像處理器的發展歷史

    圖像處理器(Image Processor)的發展歷史是一段充滿創新與突破的歷程,它伴隨著計算機技術的不斷進步和圖像處理需求的日益增長而逐漸成熟。以下是對圖像處理器發展歷史的詳細回顧,旨在展現其從誕生到如今的演變過程。
    的頭像 發表于 08-14 09:42 ?915次閱讀

    射頻天線的發展歷史

    射頻天線,作為無線通信系統的關鍵組成部分,其發展歷程充滿了探索與創新。從最初的簡單形態到如今的復雜多樣,天線技術不僅見證了無線通信技術的飛速發展,也深刻影響了人類社會的方方面面。以下是對射頻天線發展歷史的詳細回顧
    的頭像 發表于 08-13 10:50 ?603次閱讀

    簡述光通信的發展歷史

    光通信的發展歷史是一段充滿創新與突破的旅程,它極大地推動了現代通信技術的進步,為人類社會帶來了前所未有的便捷與高效。以下是對光通信發展歷史的詳細介紹,分為幾個關鍵階段進行闡述。
    的頭像 發表于 08-09 11:47 ?1693次閱讀

    蘋果股價創歷史新高:iPhone 15與16系列引領市場熱潮

    在7月9日的美國股市收盤中,標普500指數與納斯達克指數雙雙創下歷史新高,而蘋果公司的股價也表現出色,上漲0.65%,總市值逼近3.5萬億美元,成功超越微軟,再次奪回了美股市值第一的寶座。這一亮眼成績的背后,離不開iPhone 15系列與即將發布的iPhone 16系列的
    的頭像 發表于 07-09 14:22 ?576次閱讀

    鴻蒙原生應用元服務開發-Web歷史記錄導航

    /向后瀏覽上一個/下一個歷史記錄。 在下面的示例中,點擊應用的按鈕來觸發前端頁面的后退操作。 // xxx.ets import web_webview from \'@ohos.web.webview
    發表于 05-20 15:14

    2023年光伏行業發展回顧報告

    電子發燒友網站提供《2023年光伏行業發展回顧報告.pdf》資料免費下載
    發表于 04-30 11:32 ?59次下載

    求助,labview數據存儲和歷史數據查詢功能應該如何做課程設計?

    純labview小白,正在做聲卡聲音信號采集的課程設計,要求有數據存儲和歷史數據查詢功能,搞不懂如何歷史數據查詢,都將數據存儲在了文件夾,在文件夾直接看歷史數據不就行了嗎?
    發表于 04-15 09:32

    鴻蒙開發實例:【demo-搜索歷史記錄】

    HarmonyOs-demo-搜索歷史記錄
    的頭像 發表于 03-26 22:40 ?668次閱讀
    鴻蒙開發實例:【demo-搜索<b class='flag-5'>歷史</b>記錄】

    帶您回顧端子壓接的歷史

    自飛行和早期推進系統出現以來,電導體就被用來在整個飛機上傳輸信號。隨著航空旅行的發展,對這些系統中使用的線束和連接器的要求也在不斷提高。隨著汽車、航空航天、醫療設備、工業設備等領域的快速進步,對電氣系統的要求也越來越高。現代設備中集成了越來越多的電氣元件和功能,這導致了線束中電線和電纜的數量和類型大幅增加。這種復雜的布線需要連接器、端子、電線、光纖和其他需要
    的頭像 發表于 03-14 08:25 ?1032次閱讀
    帶您<b class='flag-5'>回顧</b>端子壓接的<b class='flag-5'>歷史</b>
    主站蜘蛛池模板: 老师下面很湿很爽很紧| 天天操天天操天天操香蕉| 播放一级毛片| 久久草在线精品| 免费视频性| 女人张腿让男子桶免费动态图| 一本在线免费视频| 91网址在线播放| 在线天堂中文官网| 女人张开双腿让男人桶完整| 天天综合天天综合| 亚洲春色在线| 亚洲高清免费在线观看| 国产在线97色永久免费视频| 午夜手机视频| 亚洲一区中文字幕在线观看| 人人爱爱| 免费日本黄色网址| 伊人久久99| 成人网18免费下| 国产黄色片在线观看| 日韩色网| 人人人人干| 一级做a爰片久久毛片毛片| 国产四虎| 69xxxx欧美老师| 欧美国产一区二区二区| 免费国产成人午夜私人影视| 一级@片| 国产精品嫩草影院在线播放| 女女色综合影院| 亚洲色妞| 两人性世界| www.黄com| 日本成人黄色网址| 欧美高清老少配性啪啪| 香港日本三级在线播放| 亚洲黄视频| 综合激情六月| 中文在线免费看影视| 美女免费视频一区二区三区|