在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英特爾集成顯卡+ChatGLM3大語言模型的企業本地AI知識庫部署

英特爾物聯網 ? 來源:英特爾物聯網 ? 2024-03-29 11:07 ? 次閱讀

前言

在當今的企業環境中,信息的快速獲取和處理對于企業的成功至關重要。為了滿足這一需求,我們可以將RAG技術與企業本地知識庫相結合,以提供實時的、自動生成的信息處理和決策支持。這將有助于企業更好地應對快速變化的市場環境,提高企業的競爭力和創新能力。

企業本地知識庫是一個集中存儲和管理企業內部知識的系統。它包含了企業的歷史數據、經驗教訓、最佳實踐、流程文檔、產品信息等。企業本地知識庫是企業智慧的結晶,對于企業的運營和發展具有重要意義。

將RAG技術與企業本地知識庫相結合,可以為企業帶來以下幾個方面的優勢:

1

實時性

RAG技術可以實時地從企業本地知識庫中提取相關信息,并生成用戶所需的內容。這意味著用戶可以快速地獲取到最新的知識和信息,而不需要花費大量時間去查找和整理。

2

自動化

RAG技術可以自動地處理和生成內容,減少了人工干預的需求。這不僅可以提高企業的效率,還可以減少人為錯誤的發生。

3

個性化和定制化

RAG技術可以根據用戶的需求和偏好,生成個性化的內容。通過與企業本地知識庫的結合,可以提供更加精準和有針對性的信息,滿足不同用戶的需求。

4

知識共享和傳承

企業本地知識庫是一個集中存儲和共享知識的平臺。通過與RAG技術的結合,可以將這些知識快速地傳遞給需要的用戶,促進知識的共享和傳承。

1

RAG簡介

RAG - Retrieval-Augmented Generation(檢索增強生成)是一種先進的自然語言處理(NLP)技術,它結合了信息檢索(Retrieval)和神經網絡生成(Generation)兩種方法,以提升模型在生成文本時的準確性和相關性。在傳統的生成模型中,模型依據自身學習到的知識庫生成文本。然而,這種方法受限于模型訓練時所接觸到的數據范圍,特別是在處理未見的、需要實時查找新信息的場景時,可能無法生成最新或最準確的內容。

RAG模型通過引入一個檢索組件,在接收到輸入問題或任務后,首先從大規模預定義的知識庫(如網頁、文檔集合或其他結構化/非結構化數據源)中檢索與任務相關的信息片段。然后,檢索到的信息作為額外的上下文輸入,與原始輸入一起傳遞給生成模型。生成模型在此基礎上,利用檢索到的信息以及自身的語言模型能力,生成更為精確、詳盡且與現實世界信息保持同步的回答或文本內容。

簡單來說,RAG模型就是在傳統生成模型的基礎上增加了一個動態獲取外部知識的能力,這樣既保留了大模型生成連貫文本的優點,又解決了由于模型記憶限制導致的知識更新和準確性不足的問題,尤其適用于問答系統、對話系統及需要實時更新信息的自然語言處理任務。

504d318a-ece7-11ee-a297-92fbcf53809c.png

2

OpenVINO Notebook簡介

OpenVINO Notebooks是一套以Jupyter Notebook為載體的開源交互式編程教程和示例代碼合集,由英特爾公司開發和維護。這套資源專為使用 OpenVINO 工具套件的開發者設計,旨在幫助他們更快地理解和掌握如何利用 OpenVINO 進行深度學習模型的優化與推理及實際部署AI在各式業務應用場景里面。

50752faa-ece7-11ee-a297-92fbcf53809c.png

3

部署平臺簡介

算力魔方是一款可以DIY的迷你主機,采用了抽屜式設計,后續組裝、升級、維護只需要拔插模塊。通過選擇計算模塊的版本,再搭配不同額 IO 模塊可以組成豐富的配置,適應不同場景。性能不夠時,可以升級計算模塊提升算力, 如需要顯卡可加上顯卡, IO 接口不匹配時,可以更換 IO 模塊調整功能,而無需重構整個系統。本文在帶有英特爾12代酷睿i7-1265U芯片組里的銳炬 Xe集成顯卡+RAM 32GB的算力魔方上完成驗證。

4

在集成顯卡上部署RAG

4.1

搭建OpenVINO Notebooks開發環境

第一步:請使用下面的命令克隆存儲庫創建并激活名為“openvino_env”的虛擬環境

git clone https://github.com/openvinotoolkit/openvino_notebooks.git
cd openvino_notebooks
conda create -n openvino_env python=3.9

50b015a2-ece7-11ee-a297-92fbcf53809c.png

第二步:請使用下面的命令激活虛擬環境并安裝依賴包,并啟動Jupyter Notebooks

conda activate openvino_env
pip install -r requirements.txt

511c6d4c-ece7-11ee-a297-92fbcf53809c.png

jupyter lab notebooks

5143f5f6-ece7-11ee-a297-92fbcf53809c.png

4.2

下載模型到本地

請使用命令將ChatGLM3 6B和text2vec模型下載到本地

git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

51638e98-ece7-11ee-a297-92fbcf53809c.png

git clone https://www.modelscope.cn/Jerry0/text2vec-large-chinese.git

5179773a-ece7-11ee-a297-92fbcf53809c.png

4.3

運行254-rag-chatbot程序

請運行Notebooks里面的代碼模塊, 注意!! 國內用戶請勿運行模塊1,從模塊2開始一步步運行代碼到NNCF模塊,模型壓縮選擇int4并按照下圖一及二圖修改notebooks 254里的代碼引導程序指定對應的模型路徑完成ChatGLM3-6b模型int 4量化及部署

519b22c2-ece7-11ee-a297-92fbcf53809c.png

圖一

51b0f96c-ece7-11ee-a297-92fbcf53809c.png

圖二

text2vec-large-chinese 模型部署

51d88414-ece7-11ee-a297-92fbcf53809c.png

運行結果,如下所示:本地知識庫已成功加入ChatGLM 6B模型里并精確回答問題

51f27da6-ece7-11ee-a297-92fbcf53809c.png

運行視頻.avi

5

總結

將RAG技術與企業本地知識庫相結合,可以為企業提供實時、自動化、個性化和定制化的信息處理和決策支持。這將有助于企業更好地應對快速變化的市場環境,提高企業的競爭力和創新能力。

利用OpenVINO 工具套件簡單易用,僅需三步即可在算力魔方完成開發環境搭建及模型的INT4量化且在英特爾集成顯卡上的部署實現RAG企業本地知識庫部署。




審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    9964

    瀏覽量

    171775
  • 深度學習
    +關注

    關注

    73

    文章

    5503

    瀏覽量

    121162
  • 大模型
    +關注

    關注

    2

    文章

    2450

    瀏覽量

    2707
  • OpenVINO
    +關注

    關注

    0

    文章

    93

    瀏覽量

    202

原文標題:英特爾集成顯卡+ChatGLM3大語言模型的企業本地AI知識庫部署 | 開發者實戰

文章出處:【微信號:英特爾物聯網,微信公眾號:英特爾物聯網】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    英特爾與扣子云平臺合作推出AI PC Bot專區與端側插件商店

    。 Coze-AIPC是扣子云平臺與英特爾聯合發布的增強版智能體開發平臺,它深度整合了英特爾AI PC的端側能力與扣子云平臺的優勢。通過扣子云平臺創新的“端插件”機制,英特爾
    的頭像 發表于 12-27 14:11 ?114次閱讀

    使用英特爾AI PC為YOLO模型訓練加速

    之后,情況有了新的變化,PyTorch2.5正式開始支持英特爾顯卡,也就是說,此后我們能夠借助英特爾 銳炫 顯卡來進行模型訓練了。
    的頭像 發表于 12-09 16:14 ?298次閱讀
    使用<b class='flag-5'>英特爾</b><b class='flag-5'>AI</b> PC為YOLO<b class='flag-5'>模型</b>訓練加速

    使用PyTorch在英特爾獨立顯卡上訓練模型

    《PyTorch 2.5重磅更新:性能優化+新特性》中的一個新特性就是:正式支持在英特爾獨立顯卡上訓練模型
    的頭像 發表于 11-01 14:21 ?444次閱讀
    使用PyTorch在<b class='flag-5'>英特爾</b>獨立<b class='flag-5'>顯卡</b>上訓練<b class='flag-5'>模型</b>

    英特爾聚焦AI座艙

    英特爾推出首款銳炫車載獨立顯卡(dGPU)和第一代英特爾軟件定義車載SoC系列,滿足當前消費者對汽車內部配備更多屏幕、獲得更高清晰度等AI座艙體驗需求。
    的頭像 發表于 10-30 16:26 ?212次閱讀

    【實操文檔】在智能硬件的大模型語音交互流程中接入RAG知識庫

    非常明顯的短板。盡管這些模型在理解和生成自然語言方面有極高的性能,但它們在處理專業領域的問答時,卻往往不能給出明確或者準確的回答。 這時就需要接一個專有知識庫來滿足產品專有和專業知識
    發表于 09-29 17:12

    IBM Cloud將部署英特爾Gaudi 3 AI芯片

    近日,科技巨頭IBM與英特爾宣布了一項重大合作計劃,雙方將共同在IBM Cloud平臺上部署英特爾最新的Gaudi 3 AI芯片,預計該服務
    的頭像 發表于 09-03 15:52 ?391次閱讀

    英特爾攜手星環科技WAIC展現AI Infra

    PC版等。此外,星環主辦的“新質生產力:AI Infra構筑企業新動能”主題論壇同時亮相上海世博中心,邀請了包括英特爾在內的多家業界大咖,展望AI基礎設施建設趨勢,探討如何基于大
    的頭像 發表于 08-16 15:02 ?501次閱讀
    <b class='flag-5'>英特爾</b>攜手星環科技WAIC展現<b class='flag-5'>AI</b> Infra

    【AIBOX】裝在小盒子的AI足夠強嗎?

    Firefly推出大語言模型本地部署的產品:AIBOX-1684X,目前已適配主流的大語言模型
    的頭像 發表于 05-15 08:02 ?442次閱讀
    【AIBOX】裝在小盒子的<b class='flag-5'>AI</b>足夠強嗎?

    華擎推出AI QuickSet軟件,支持英特爾銳炫Arc A系列顯卡

    今日,華擎宣布將AI QuickSet軟件工具擴展至英特爾銳炫Arc A系列顯卡,使其能夠便捷地安裝Stable Diffusion web UI OpenVINO,結合英特爾Open
    的頭像 發表于 05-11 10:58 ?641次閱讀

    英特爾AI產品助力其運行Meta新一代大語言模型Meta Llama 3

    英特爾豐富的AI產品——面向數據中心的至強處理器,邊緣處理器及AI PC等產品為開發者提供最新的優化,助力其運行Meta新一代大語言模型Me
    的頭像 發表于 04-28 11:16 ?639次閱讀

    簡單三步使用OpenVINO?搞定ChatGLM3本地部署

    英特爾 OpenVINO? 工具套件是一款開源 AI 推理優化部署的工具套件,可幫助開發人員和企業加速生成式人工智能 (AIGC)、大語言
    的頭像 發表于 04-03 18:18 ?2078次閱讀
    簡單三步使用OpenVINO?搞定<b class='flag-5'>ChatGLM3</b>的<b class='flag-5'>本地</b><b class='flag-5'>部署</b>

    浪潮信息&quot;源2.0&quot;大模型YuanChat支持英特爾最新商用AI PC

    % 。企業可以在全新的英特爾商用客戶端AI PC上,使用AI PC大模型效率工具"YuanChat"快速
    的頭像 發表于 03-27 22:52 ?503次閱讀
    浪潮信息&quot;源2.0&quot;大<b class='flag-5'>模型</b>YuanChat支持<b class='flag-5'>英特爾</b>最新商用<b class='flag-5'>AI</b> PC

    英特爾CPU部署Qwen 1.8B模型的過程

    本文介紹了在英特爾 13 代酷睿 CPU i5 - 13490F 設備上部署 Qwen 1.8B 模型的過程,你需要至少 16GB 內存的機器來完成這項任務,我們將使用英特爾的大
    的頭像 發表于 01-12 10:28 ?2630次閱讀

    三步完成在英特爾獨立顯卡上量化和部署ChatGLM3-6B模型

    ChatGLM3 是智譜 AI 和清華大學 KEG 實驗室聯合發布的新一代對話預訓練模型ChatGLM3-6B 是 ChatGLM3 系列
    的頭像 發表于 01-11 18:04 ?1634次閱讀
    三步完成在<b class='flag-5'>英特爾</b>獨立<b class='flag-5'>顯卡</b>上量化和<b class='flag-5'>部署</b><b class='flag-5'>ChatGLM3</b>-6B<b class='flag-5'>模型</b>

    ChatGLM3-6B在CPU上的INT4量化和部署

    ChatGLM3 是智譜 AI 和清華大學 KEG 實驗室聯合發布的新一代對話預訓練模型ChatGLM3-6B 是 ChatGLM3 系列
    的頭像 發表于 01-05 09:36 ?920次閱讀
    <b class='flag-5'>ChatGLM3</b>-6B在CPU上的INT4量化和<b class='flag-5'>部署</b>
    主站蜘蛛池模板: 182.t v香蕉人人网站| 一二三区在线观看| 国产精品久久久久免费| 欧美性一区二区三区五区| 在线高清一级欧美精品| 五月激情片| 国产乱码精品一区二区三| 国产精品久久久亚洲| 黄a大片| 老师受不了了好硬好大| 欧美色图在线观看| 天天色天天综合| 久草色香蕉| 在线不卡一区| 精品一区视频| 国产视频分类| 一级特黄色片| 成人网在线视频| 欧美另类丰满69xxxxx| 性人久久久久| 99久久伊人| 91大神免费视频| 麒麟色欧美影院在线播放| 天天看天天操| 国产精品久久久久久久久免费观看| 久久综合婷婷| 99久久久精品免费观看国产| 五月六月激情| 午夜免费伦费影视在线观看| 69日本人xxxxxxxx18| 欧美日一级| 久久是精品| 天堂看动漫| 天天做天天爽爽快快| 欧美日韩性大片| 日本特级淫片免费| 开心色99×xxxx| 午夜激情网站| 天天添| 亚洲香蕉久久一区二区三区四区| 91老色批网站免费看|