在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于AX650N芯片部署MiniCPM-V 2.0高效端側多模態大模型

愛芯元智AXERA ? 來源:愛芯元智AXERA ? 2024-07-15 09:34 ? 次閱讀

MiniCPM-V 2.0: 具備領先OCR和理解能力的高效端側多模態大模型

背景

今年4月份,面壁智能&清華大學自然語言處理實驗室推出MiniCPM系列的最新多模態版本MiniCPM-V 2.0。該模型基于MiniCPM 2.4B和SigLip-400M構建,共擁有2.8B參數。MiniCPM-V 2.0具有領先的光學字符識別(OCR)和多模態理解能力。該模型在綜合性OCR能力評測基準OCRBench上達到開源社區的最佳水平,甚至在場景文字理解方面實現接近Gemini Pro的性能。簡單來說,就是能夠實現更好地理解圖片中內容,實現精準的“以圖生文”的能力,所見即所得。

本文將通過走馬觀花的方式,初探MiniCPM-V 2.0的新特性。同時也將分享基于愛芯元智的AX650N芯片適配MiniCPM-V 2.0的最新進展,向業界對端側多模態大模型部署的開發者提供一種新的思路,促進社區對端側多模態大模型的探索。

MiniCPM-V介紹

2.1 MiniCPM-V 2.0特性

領先的OCR和多模態理解能力。MiniCPM-V 2.0顯著提升了OCR和多模態理解能力,場景文字理解能力接近Gemini Pro,在多個主流評測基準上性能超過了更大參數規模(例如17-34B)的主流模型。

可信行為。MiniCPM-V 2.0是第一個通過多模態RLHF對齊的端側多模態大模型。該模型在Object HalBench達到和GPT-4V相仿的性能。

任意長寬比高清圖像高效編碼。MiniCPM-V 2.0可以接受180萬像素的任意長寬比圖像輸入(基于最新的LLaVA-UHD技術),這使得模型可以感知到小物體、密集文字等更加細粒度的視覺信息

高效部署。MiniCPM-V 2.0可以高效部署在大多數消費級顯卡、個人電腦以及移動手機等終端設備。

雙語支持。MiniCPM-V 2.0提供領先的中英雙語多模態能力支持。該能力通過VisCPM[ICLR'24]論文中提出的多模態能力的跨語言泛化技術實現。

2.2 多模態“小鋼炮”

MiniCPM-V 2.0與參數規模更大的多模態大模型相比,也表現出優秀的成績,不愧是業界“小鋼炮”。

3c34e4f6-3dc6-11ef-a4c8-92fbcf53809c.png

芯片介紹

3.1 AX650N

愛芯元智第三代高能效比智能視覺芯片AX650N。集成了八核Cortex-A55 CPU,高能效比NPU,支持8K@30fps的ISP,以及H.264、H.265編解碼的 VPU。接口方面,AX650N支持64bit LPDDR4x,多路MIPI輸入,千兆EthernetUSB、以及HDMI 2.0b輸出,并支持32路1080p@30fps解碼內置高算力和超強編解碼能力,滿足行業對高性能邊緣智能計算的需求。通過內置多種深度學習算法,實現視覺結構化、行為分析、狀態檢測等應用,高效率支持基于Transformer結構的視覺大模型和語言類大模型。提供豐富的開發文檔,方便用戶進行二次開發。

3c814daa-3dc6-11ef-a4c8-92fbcf53809c.jpg

上版部署

我們已實現“命令行”和“UI”兩種示例,其中“命令行”版本已上傳到網盤中,歡迎試用。

4.1 命令行版本

測試圖片:

測試結果:

3d08edfa-3dc6-11ef-a4c8-92fbcf53809c.jpg

4.2 GUI版本

4.3 性能統計

項目 描述
輸入圖片大小 280 x 280
Image Encoder 0.8s
Input Prompt 96 tokens
Prefill Time 0.4s
Decoder 5 tokens/s

結束語

隨著大語言模型小型化的快速發展,越來越多有趣的多模態AI應用將逐漸從云端服務遷移到邊緣側設備和端側設備。我們會緊跟行業最新動態,適配更多的端側大模型,歡迎大家持續關注。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 自然語言處理

    關注

    1

    文章

    618

    瀏覽量

    13561
  • 愛芯元智
    +關注

    關注

    1

    文章

    80

    瀏覽量

    4835
  • 大模型
    +關注

    關注

    2

    文章

    2448

    瀏覽量

    2701

原文標題:愛芯分享 | 基于AX650N部署MiniCPM-V 2.0

文章出處:【微信號:愛芯元智AXERA,微信公眾號:愛芯元智AXERA】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于AX650N/AX630C部署大語言模型Qwen2

    本文將分享如何將最新的大語言模型部署到超高性價比SoC上,向業界對
    的頭像 發表于 07-06 17:43 ?3567次閱讀
    基于<b class='flag-5'>AX650N</b>/<b class='flag-5'>AX</b>630C<b class='flag-5'>部署</b><b class='flag-5'>端</b><b class='flag-5'>側</b>大語言<b class='flag-5'>模型</b>Qwen2

    基于AX650N/AX630C部署模態模型InternVL2-1B

    InternVL2是由上海人工智能實驗室OpenGVLab發布的一款模態模型,中文名稱為“書生·萬象”。該模型在多學科問答(MMMU)等任務上表現出色,并且具備處理多種
    的頭像 發表于 11-18 17:32 ?732次閱讀
    基于<b class='flag-5'>AX650N</b>/<b class='flag-5'>AX</b>630C<b class='flag-5'>部署</b><b class='flag-5'>多</b><b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>InternVL2-1B

    愛芯元智發布第三代智能視覺芯片AX650N,為智慧生活賦能

    中國 上海 2023 年 3 月 6 日 ——人工智能視覺感知芯片研發及基礎算力平臺公司愛芯元智宣布推出第三代高算力、高能效比的SoC芯片——AX650N。這是繼AX620、
    發表于 03-07 10:57 ?1617次閱讀
    愛芯元智發布第三代智能視覺<b class='flag-5'>芯片</b><b class='flag-5'>AX650N</b>,為智慧生活賦能

    【愛芯派 Pro 開發板試用體驗】愛芯元智AX650N部署yolov5s 自定義模型

    愛芯元智AX650N部署yolov5s 自定義模型 本博客將向你展示零基礎一步步的部署好自己的yolov5s模型(博主展示的是安全帽
    發表于 11-16 19:34

    【愛芯派 Pro 開發板試用體驗】愛芯元智AX650N部署yolov8s 自定義模型

    愛芯元智AX650N部署yolov8s 自定義模型 本博客將向你展示零基礎一步步的部署好自己的yolov8s模型(博主展示的是自己訓練的手
    發表于 11-24 20:40

    愛芯元智第三代智能視覺芯片AX650N高能效比SoC芯片

    愛芯元智正式推出第三代高算力、高能效比的SoC芯片——AX650N。這是繼AX620、AX630系列后,愛芯元智推出的又一款高性能智能視覺芯片
    的頭像 發表于 03-10 17:13 ?4092次閱讀

    基于AX650N部署DETR

    目標檢測作為計算機視覺應用的基礎任務,一直備受行業應用重點關注。從最早學術界的Two-Stage方案Faster-RCNN,到首個利于工業界高效率部署的One-Stage方案SSD(Single
    的頭像 發表于 05-15 14:27 ?835次閱讀
    基于<b class='flag-5'>AX650N</b><b class='flag-5'>部署</b>DETR

    基于AX650N部署EfficientViT

    場景通常對模型推理的實時性要求較高,但大部分輕量級的Vision Transformer網絡仍無法在已有邊緣/
    的頭像 發表于 05-26 10:30 ?1037次閱讀

    愛芯元智AX650N、邊緣Transformer最佳落地平臺

    Transformer是當前各種大模型所采用的主要結構,而ChatGPT的火爆讓人們逐漸意識到人工智能有著更高的上限,并可以在計算機視覺領域發揮出巨大潛能。相比于在云端用GPU部署Transformer大模型,在邊緣
    的頭像 發表于 05-30 11:04 ?1012次閱讀
    愛芯元智<b class='flag-5'>AX650N</b>成<b class='flag-5'>端</b><b class='flag-5'>側</b>、邊緣<b class='flag-5'>側</b>Transformer最佳落地平臺

    模態模型產業高峰論壇成功舉辦 ChatImg2.0、軟通天璇2.0 MaaS平臺重磅發布

    5月30日,“模態模型產業高峰論壇”在軟通動力總部舉行。近百位專家學者、行業大咖和產業精英齊聚一堂,共同探討模態
    的頭像 發表于 05-31 10:14 ?637次閱讀
    <b class='flag-5'>多</b><b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>產業高峰論壇成功舉辦 ChatImg<b class='flag-5'>2.0</b>、軟通天璇<b class='flag-5'>2.0</b> MaaS平臺重磅發布

    基于AX650N部署視覺大模型DINOv2

    最近一段時間,基于Transformer網絡結構的視覺大模型呈現出爆發式增長,繼Segment Anything(SAM)之后,Meta AI再次發布重量級開源項目——DINOv2。DINOv2可以抽取到強大的圖像特征,且在下游任務上不需要微調,這使得它適合作為許多不同的應用中新的Backbone。
    的頭像 發表于 06-30 10:07 ?3008次閱讀

    愛芯元智AX620E和AX650系列芯片正式通過PSA Certified安全認證

    萬物互聯的時代,安全性已成為物聯網產品設計及部署的基本要求。近日,愛芯元智AX620E和AX650系列芯片(包含AX630C/
    的頭像 發表于 04-23 15:45 ?818次閱讀
    愛芯元智<b class='flag-5'>AX</b>620E和<b class='flag-5'>AX650</b>系列<b class='flag-5'>芯片</b>正式通過PSA Certified安全認證

    PerfXCloud 重大更新 模態模型 MiniCPM-Llama3-V 2.5 閃亮上架

    近日,PerfXCloud完成重大更新,上架了面壁小鋼炮 MiniCPM 系列的模態模型
    的頭像 發表于 08-27 18:20 ?528次閱讀
    PerfXCloud 重大更新  <b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>多</b><b class='flag-5'>模態</b><b class='flag-5'>模型</b> <b class='flag-5'>MiniCPM-Llama3-V</b> 2.5 閃亮上架

    利用OpenVINO部署Qwen2模態模型

    模態模型的核心思想是將不同媒體數據(如文本、圖像、音頻和視頻等)進行融合,通過學習不同模態之間的關聯,實現更加智能化的信息處理。簡單來說,
    的頭像 發表于 10-18 09:39 ?439次閱讀

    高通與智譜推動模態生成式AI體驗的終端側部署

    此前,驍龍峰會首日,智譜與高通技術公司宣布合作將GLM-4V側視覺大模型,面向驍龍8至尊版進行深度適配和推理優化,支持豐富的模態交互方式
    的頭像 發表于 11-08 09:55 ?181次閱讀
    主站蜘蛛池模板: 狠狠色丁香婷婷综合激情| 狠狠操影院| 99久久精品久久久久久婷婷| 欧美特黄一免在线观看| 特黄特色大片免费播放路01| 福利午夜| 宅男午夜| 久久99精品久久久久久久野外 | 免费看污视频软件| 天天做天天爱夜夜爽| 中文字幕一区二区三| 四虎国产永久免费久久| 色接久久| 亚洲手机看片| 久久久久久天天夜夜天天| 男男gay高h文| 毛片三级在线观看| 一级午夜| 亚洲码在线| 亚洲va国产va天堂va久久| 国产精品毛片在线大全| 1024手机看片欧美日韩| 李丽莎尤物福利视频| 久久手机视频| 国产1024一区二区你懂的| 亚洲国产欧美在线成人aaaa| 你懂的亚洲| 久久天天| 性欧美xxxx视频| 伊在线视频| 男男浪荡性受高hnp肉| 黑人破乌克兰美女处| 视频在线免费观看| 日日噜噜噜夜夜爽爽狠狠视频| 五月天婷婷基地| 午夜影院7cdy| 鸥美三级| 午夜精品久久久| 爱爱帝国亚洲一区二区三区| 国产精品激情综合久久| 看大片全色黄大色黄|