在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

搭建一個 AI 問答機器人,需要幾步?

科技訊息 ? 來源:科技訊息 ? 作者:科技訊息 ? 2024-10-21 15:10 ? 次閱讀

搭建一個企業內部AI 問答機器人、知識庫的場景,我們可以選擇大廠的云服務,這相對于大多數用戶來說,是最省事的方案。但很多企業可能會有一些私有化的數據,或者受限于企業內部的安全性要求,只能走模型私有化部署的方式。

很多人想到模型私有化部署,會以為要數據中心的多臺服務器來做,其實不然。

辦公室里搭建 AI 工作站,已經可以完美地支持企業內部知識庫和一些POC場景的需求,比如進行量化的 70B 模型的訓練和推理工作。所以在辦公室環境下,同樣可以搭建一個 AI 問答機器人。

贊奇科技基于 NVIDIA ChatRTX 搭建的企業問答機器人

但搭建一個AI 問答機器人又是一個涉及硬件選擇安裝開發環境部署的綜合過程。

最近贊奇的工程師團隊測試了幾款主流大模型,就采用 AI 工作站搭建一個本地問答機器人提供了一些建議參考,這里抓一些重點給大家:

第一步 確定需求與目標

這一步至關重要,需要確定以下關鍵點:

性能要求:了解所做任務的復雜度,如知識庫所需要采樣的數據庫的大小,未來的用戶并發量等,以此來預估所需的計算資源和存儲空間等,通常我們可以用現有機器跑任務測試的方式來評估。

預算范圍:明確愿意投入的資金等成本范圍。對預算沒有概念的小伙伴可以通過詢問,或者參考公開市場價格等方式來加速了解。

第二步 選擇合適的硬件

根據需求我們來制定硬件配置,AI 工作站比較關鍵的配置有 GPUCPU、內存、機箱等。

GPU

GPU 是 AI 工作站中非常核心的算力,也是 AI 工作站中需要首先考慮的配件。目前適用于專業 AI 工作站的顯卡主要有 NVIDIA RTX? 5880 Ada (48GB)NVIDIA RTX? 5000 Ada (32GB) 等,這兩款顯卡屬于 NVIDIA 專業級顯卡,主動散熱功耗很低而且非常穩定,靜音也適合辦公室使用。

我們可以看看兩款顯卡的參數:

wKgZoWcV_luAbe-1AAKmYmv-U6k722.png

我們需要根據算力需求來配置工作站中的顯卡,包括顯卡型號和數量。AI 工作站可至多支持 4 張高性能專業顯卡,同時一個工作站中需要配置同一型號的顯卡,并且一般采用單卡、雙卡和四卡的配置。

這就需要我們同時要了解不同型號顯卡的性能,才能來匹配任務需求。這是個極大的挑戰。很多人對顯卡性能并不熟悉,而且在不同的任務情況下,顯卡的表現也會有所不同。我們可以參考與我們類似的任務在顯卡上的測評數據來評估。有條件的話,在購買時建議最好提前測試下。

顯卡實測數據

很多企業采用 AI 工作站來做知識庫、智能問答等應用,主要任務是本地的模型微調和推理,模型大小普遍選擇在 7B/8B,13B,32B 和 70B。

NVIDIA 解決方案合作伙伴贊奇科技,分別對 AI 工作站中搭載 NVIDIA RTX 5880 Ada、NVIDIA RTX 5000 Ada 的單卡雙卡四卡配置進行了模型訓練和推理的測試,測試數據供大家在選型時參考。

AI 工作站搭載 NVIDIA RTX 5000 Ada 的實測

NVIDIA RTX 5000 Ada

(圖片源于 NVIDIA)

測試環境:

CPU: Intel(R) Xeon(R) w5-3433

內存:64G DDR5 * 8

GPU: NVIDIA RTX 5000 Ada * 4

操作系統:ubuntu22.04

Driver Version: 550.107.02

CUDA: 12.1

推理框架:vllm

測試數據(以下數據均為多次測試數據的平均值):

wKgZoWcV_l2AA6IIAAJulUCUQF0866.pngwKgaoWcV_l2AMwsuAAHiZvbmz2s629.pngwKgZoWcV_l6ASr9zAAGmT9d4jpk924.png


AI 工作站搭載 NVIDIA RTX 5880 Ada 的實測

NVIDIA RTX 5880 Ada

(圖片源于 NVIDIA)

測試環境:

CPU: Intel(R) Xeon(R) w5-3433

內存:64G DDR5 * 8

GPU: NVIDIA RTX 5880 Ada * 4

操作系統:ubuntu 22.04

Driver Version: 550.107.02

CUDA: 12.1
推理框架:vllm

測試數據(以下數據均為多次測試數據的平均值):

wKgZoWcV_l-AExbqAAN3lME3fKU187.pngwKgaoWcV_l-AXDo2AAI6T-7eMQU419.pngwKgZoWcV_mCAINGKAAGzPFsA528770.png

噪音測試

無論是搭載 4 張 NVIDIA RTX 5880 Ada, 還是 4 張 NVIDIA RTX 5000 Ada 的品牌 AI 工作站,在壓測情況下機器出風口測得的噪音水平控制在 50-60 分貝,基本上接近環境音的水平,辦公室噪音?那是沒有的!

以上測試數據均來源于贊奇科技 。

wKgaoWcV_mCAO9wzAAB5yiXrvSU36.jpeg

其他配置

CPU 要注意考慮和 GPU 的匹配問題。實際使用中,具有較高核心數和主頻的CPU 運行速度更快,更高的緩存也會提升運行效率。4卡工作站環境中內存建議 256GB 以上,存儲也要依據使用需求來確定。

機箱要考慮電源、噪音、兼容性、擴展性等因素,電源的話要計算所有組件的最大功率消耗并留有余量,以應對峰值和未來硬件升級的可能。噪音和散熱情況一定要提前了解,因為這會直接影響辦公環境(還有心情)。

當然也可以更省事一點兒,參考我們本次測試所采用的工作站的配置環境!

第三步

安裝操作系統、配置開發環境+

AI 工作站到位安裝好后,可以根據偏好和軟件兼容性,選擇合適的操作系統、驅動程序、軟件等進行安裝。同時配置開發環境所需的工具、模型、數據集等。

當然,您也可以聯系我們,一站式配置好軟硬件相關的環境,做到開箱即用!

第四步

測試與優化

通過運行一些基本的小型 AI 項目,驗證工作站在實際任務中的運行速度、穩定性、散熱情況、噪音等情況。同時還可以利用 NVIDIA System Management Interface 等工具監控 GPU 使用情況,根據需要調整代碼或資源配置以提高顯卡效率。

實際過程中,大部分靠譜廠商出廠過程中會包含上述步驟。此時我們需要做的工作是在上述環境準備完善的前提下,上傳自己的數據,通過 RAG 或者微調的方式對自己的數據做一次整理。接下來,就迎接自己內部的問答機器人吧!

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28420

    瀏覽量

    207110
  • NVIDIA
    +關注

    關注

    14

    文章

    4986

    瀏覽量

    103067
  • AI
    AI
    +關注

    關注

    87

    文章

    30897

    瀏覽量

    269111
收藏 人收藏

    評論

    相關推薦

    發現機器人,《機器人的中秋祝福》中的機器人有眼部投影功能哦

    `發現了機器人,《機器人的中秋祝福》中的機器人有眼部投影功能哦,雙手還挺靈活的,好像是國內的,就是外觀比較
    發表于 09-13 14:40

    如果有AI機器人,你希望它每天幫你做哪些事?

    完成更多的工作,給人們生活帶來的便利;二來是AI機器人是否會影響人類的行為動作,最終取代人類。這些被討論了千萬遍的話題,暫時還沒有定論。如果你家里有
    發表于 10-23 16:03

    AI語音智能機器人開發實戰

    第四期直播PPT下載:第三期直播PPT+程序下載:第二期直播PPT下載:第期直播PPT下載:主題簡介及亮點:以AI智能語音陪護機器人為載體,徹底講解整個機器人研發的全流程,從開發環境
    發表于 01-04 11:48

    聊天機器人的自動問答技術實現

    【原創】聊天機器人與自動問答技術
    發表于 06-03 08:47

    使用旅游機器人需要注意哪些問題?

    決消費者的咨詢問題,機器人就是很好的載體。機器人甚至可以把客戶基本的需求都解決了。  如今的人臉識別越來越成熟,機器人的人臉識別也會成為
    發表于 06-12 17:04

    AI智能語音機器人 揭秘讓企業電銷輕松拓客神器

    創造普惠全民以及企業的“智”“慧”將來,創建天下最大的AI通訊辦事平臺。作為互聯網項目領導者,智能電話機器人先行者,剛推出百應全自動電
    發表于 07-21 22:54

    【HarmonyOS HiSpark AI Camera】基于HiSpark AI Camera HarmonyOS 智能巡檢機器人開發

    本帖最后由 馬猛 于 2020-11-26 10:17 編輯 項目名稱:基于HiSpark AI Camera HarmonyOS 智能巡檢機器人開發試用計劃:HiSpark AI
    發表于 11-18 18:15

    【HarmonyOS HiSpark AI Camera】廳堂機器人

    項目名稱:廳堂機器人試用計劃:申請理由:機器人項目集成攝像頭實現人臉識別跟隨,熟悉鴻蒙系統。項目名稱:廳堂機器人項目計劃:一個月內實現機器人
    發表于 11-19 20:49

    AI智能電銷外呼機器人-自動撥打電話

    的問題,這點我們是非常自豪的。現在很多市面上的機器人五花八門的、貼牌的大堆,根本沒有保障,甚至有問題都不知道該找誰處理。而我們的AI外呼機器人
    發表于 09-02 10:35

    如何利用樹莓派搭建完整的機器人系統?

    如何利用樹莓派搭建完整的機器人系統?
    發表于 01-18 06:37

    如何搭建實體機器人ros底盤

    目錄介紹、底盤主控板二、嵌入式開發板1. 與上位機pc的關系2. 與STM32主控板的關系介紹自下而上的分析實體機器人(差分輪速機器人搭建中的關鍵過程。
    發表于 01-20 07:36

    機器人是什么?

    機器人是什么?你可能會對這個問題本身感到困惑。.有意思。.但是在實際的機器人技術中,這是廣闊的領域。機器人學這個術語指的是
    發表于 03-31 10:31

    制作教育機器人

    描述K-Bot版本4機器人的設計理念是,任何人都可以使用教育機器人進行組裝、編程和教學活動。主要是為了讓任何教育水平的老師都能在課堂上和學生起使用它。為了做到這點,你只
    發表于 08-19 07:25

    【入群體驗】電子行業首個群聊式AI問答機器人正式上線

    什么?智能機器人工具1、小秋Chat可以做什么2、你可以問報價3、你可以問替代料4、你可以咨詢設計問題5、幫忙寫程序寫代碼6、電子技術知識7、更多功能等你來發掘如何加入群聊和小秋Chat起玩群聊AI
    發表于 04-12 18:02

    如何開發款自己的智能問答機器人

    人工智能時代,開發款自己的智能問答機器人方面提升自己的AI能力,另方面作為轉型
    的頭像 發表于 01-19 10:26 ?7605次閱讀
    如何開發<b class='flag-5'>一</b>款自己的智能<b class='flag-5'>問答</b><b class='flag-5'>機器人</b>
    主站蜘蛛池模板: 999久久精品国产| 日本68xxxxxxxxx59| 天天色天天射天天操| 圆胖肥女人性视频| 午夜dy888理论三级| 一区二区三区网站在线免费线观看| 日本一区二区视频| 日本一区二区三区在线网| 欧美天堂视频| 国产拍拍拍精品视频| 91精品国产91久久久久久青草 | 国内精品久久久久久久久野战| 久久婷婷人人澡人人爱91| 欧美三级在线观看视频| 天天操天天干天天摸| 九九热视频免费在线观看| 免费大秀视频在线播放| www.色午夜| 免费观看视频在线| 日韩欧美国产电影| 国产91丝袜在线播放九色| 手机免费在线视频| 91精品日本久久久久久牛牛| 羞羞爱爱| 日本特级黄色大片| 天天干天天射天天| 狠狠干狠狠色| 欧美成人3d动漫在线播放网站| 天天爱天天干天天操| 国产一区二区在线视频播放| 黄色美女网站免费看| 1024手机看片日韩| 在线播放你懂得| 免费爱爱网址| 国产九九热| 国产一区在线mmai| 国产精品你懂的| 国产女同| 色人久久| 久久影视一区| 真实偷清晰对白在线视频|