來源:21ic,謝謝
華為該產品將主要面向To B/G政企端客戶,普通用戶在前期階段可能難以直觀體驗到該產品。
編輯:感知芯視界
ChatGPT爆火全球的速度讓人又驚又喜,而在AI大模型賽道上,不僅僅是國外大廠打得不可開交,就連國內企業也在瘋狂追趕。比如,今年3月百度發布的大語言模型“文心一言”,可謂是打響了國內ChatGPT第一槍;緊接著,360、阿里、商湯等科技企業也相繼推出了自己的AI大模型工具,徹底點燃了AIGC戰火。
在ChatGPT引發的新一輪技術浪潮之下,華為作為中國科技公司的代表,自然也不會輕易掉隊。近日有消息稱,華為將舉行的HDC.Cloud 2023開發者大會上,推出一款全新的人工智能產品——盤古Chat。
據悉,這是一款與ChatGPT相媲美的多模態千億級大模型,可以實現自然語言理解、對話生成、圖像識別等功能。不過,該產品將主要面向To B/G政企端客戶,普通用戶在前期階段可能難以直觀體驗到該產品。
事實上,華為早在2020年就開始布局盤古大模型了,并于2021年4月正式發布,到2022年聚焦行業應用落地,其進化路徑可分為L0-L1-L2三個階段:
L0階段是指基礎大模型,旨在利用海量數據進行預訓練,從而得到通用基礎模型,包括NLP(自然語言處理)大模型、CV(計算機視覺)大模型、多模態大模型、科學計算大模型,以及Graph(圖網絡)大模型。
L1階段是指行業大模型,是在L0基礎上導入行業數據進行訓練后衍生出的模型,目前已經發布了盤古金融大模型、盤古礦山大模型、盤古電力大模型、盤古制造質檢大模型、盤古藥物分子大模型等。
L2階段是指大模型迭代,是在L1基礎上結合行業細分場景得到的推理模型,比如金融OCR模型、電力巡檢模型等。以電力行業為例,華為云基于盤古電力大模型,針對無人機電力巡檢細分場景,通過一次“預訓練+下游任務”的微調,推出盤古電力巡檢大模型,解決了無人機智能巡檢系統(缺陷檢測)中的小樣本學習、主動學習、增量學習等問題,同時解決了海量數據標注工作量大和缺陷種類繁多的問題。
對于盤古大模型的定位,華為內部團隊確立了三項最關鍵的核心設計原則:一是模型要大,可以吸收海量數據;二是網絡結構要強,能夠真正發揮出模型的性能;三是具有優秀的泛化能力,可以真正落地到各行各業的工作場景。
目前,盤古大模型已在100多個行業場景完成了驗證,包括能源、零售、金融、工業、醫療、環境、物流等,從行業及場景兩個維度能夠管窺盤古大模型的應用情況:
在行業方面,CV大模型可應用于工業質檢、物流倉庫監控、時尚輔助設計等領域。NLP大模型可應用于智能文檔搜索、智能ERP、小語種大模型等領域;科學計算大模型可應用于氣象預報、海浪預測等領域。
在場景方面,盤古礦山大模型實現了綜采場景的全景視頻拼接等功能,保障安全生產;CV大模型實現了貨車故障軌旁圖像檢測系統精度超過人類檢測員;氣象大模型實現了精度超過傳統預報方式。
此前曾有券商披露,在訓練千億參數的盤古大模型時,華為團隊調用了超過2000塊的昇騰910芯片,進行了超過2個月的數據訓練能力。
據官網介紹,昇騰(HUAWEI Ascend)910是業界算力最強的AI處理器,基于自研華為達芬奇架構3D Cube技術,實現了業界最佳AI性能與能效,不僅架構靈活伸縮,還支持云邊端全棧全場景應用。在算力方面,昇騰910完全達到了設計規格,半精度(FP16)算力達到320 TFLOPS,整數精度(INT8)算力達到640 TOPS,功耗310W。
可以預見,華為入局AI大模型賽道,百度、阿里、騰訊等巨頭企業無疑將迎來最強勁對手。正如華為常務董事、華為云CEO張平安在《致全球開發者》的信中表示,AI技術風起云涌,百家爭鳴,激發新一輪百花齊放的應用創新,驅動千行百業的數字化轉型升級,“Al for Industries”將成為人工智能新的爆發點。
*免責聲明:本文版權歸原作者所有,本文所用圖片、文字如涉及作品版權,請第一時間聯系我們刪除。本平臺旨在提供行業資訊,僅代表作者觀點,不代表感知芯視界立場。
審核編輯黃宇
-
華為
+關注
關注
216文章
34438瀏覽量
251757 -
AI
+關注
關注
87文章
30896瀏覽量
269110 -
ChatGPT
+關注
關注
29文章
1561瀏覽量
7674
發布評論請先 登錄
相關推薦
評論