電子發燒友網報道(文/李彎彎)今年4月10日,商湯科技正式首次公布“日日新SenseNova”大模型體系。在日前的2023世界人工智能大會上,商湯科技宣布“商湯日日新SenseNova”大模型體系將多方位全面升級,并宣布在該體系下一系列的大模型產品更新和落地成果。
“日日新SenseNova”全面升級及應用落地
商湯科技發布的“商量”2.0版本,是一個千億級參數的自然語言處理模型,它突破了大語言模型輸入長度的限制,推出不同參數量級的模型版本,可完美適配移動端、云端等不同終端及場景的應用需求,降低部署成本。
商湯還推出小模型商量S版(SenseChat S)等不同參數量級的模型版本,小模型不但性能上有一定突破,在前端的運行上也能夠跑到高通驍龍8 Gen2的終端芯片上,適配移動端等不同終端及場景的應用需求。
另外,商湯全新的秒畫3.0,模型參數從今年4月首發的10億提升至70億量級;如影SenseAvatar 2.0數字人生成平臺,相較1.0版本的語音和口型流暢度提升30%以上,實現4K高清視頻效果,并帶來AIGC生成形象及數字人歌唱功能。
基于神經輻射場技術(NeRF)的大場景3D內容生成平臺商湯瓊宇SenseSpace2.0,在空間重建效率上提升20%,渲染性能提升50%,每100平方公里場景的建圖僅需38小時即可完成(1200 TFLOPS/秒算力支持),同等工作量由人工建圖需要10000人天。
商湯格物SenseThings 2.0對小物體的紋理及材質還原達到毫米級精細度,并突破對高反光和鏡面物體的采集難題。
在應用上,比如格物在線下場景的落地,商湯科技靈境空間事業部總監李宇飛介紹,目前,“格物”支持多種物品品類的復刻,并突破了行業難題——高反光、鏡面物體的復刻,比如珠寶首飾、小家電、金屬物件等。
傳統的重建技術通常難以解決高反光,鏡面物體的采集和復刻。然而,“格物”不僅可以避免傷害和改變物品的情況,還能精確還原物品的外觀和特征。除此之外,“格物”包含一鍵成圖和一鍵成片等再創作服務。通過一鍵成圖功能,用戶可以生成商品與場景融合的海報,或者試穿試戴的真人海報,相比其他AI技術只能部分還原商品細節,一鍵成圖可以100%還原商品的各個視角和效果。
再比如影SenseAvatar 2.0數字人生成平臺,商湯數字人在金融領域,銀行、保險、券商等擔任智能客服、智慧營銷等工作,接入大語言模型能力,還能提供投研分析、研報撰寫等新功能,實現降本增效。掛載金融知識庫后,還能100%基于客戶的產品說明進行內容問答輸出,并實現信息及時更新。此外,商湯如影2.0生成的數字人,正在進入多個頭部企業的直播間、短視頻頻道。
“大模型+大裝置”的AGI戰略布局
2022年,以GPT為代表的預訓練大模型帶來新一波AI應用的爆發,大模型的研發依賴于大規模智能計算基礎設施。商湯科技堅持“大模型+大裝置”的AGI戰略布局。商湯科技打造了人工智能基礎設施AI大裝置SenseCore,打通算力、算法和平臺,并在此基礎上建立商湯“日日新SenseNova”大模型及研發體系。
根據該公司2022年度報告,商湯SenseCore AI大裝置持續擴建,完成2.7萬塊GPU的部署并實現了5.0 exaFLOPS算力輸出能力,以AIaaS的模式面向行業伙伴提供服務,全面賦能商湯自身以及行業伙伴的大模型生產。SenseCore目前可有效支持最多20個千億參數量大模型(以千卡并行)同時訓練,最高可支持萬億參數超大模型的訓練。
目前,SenseCore已支持了超過10個大模型訓練項目,包括語言大模型、文生圖模型、視覺大模型、多模態模型等自研模型和客戶自定義模型。同時商湯面向8家大型客戶支持了7000多張GPU的計算資源,以服務其自定義的大模型訓練任務。
SenseCore提供的AIaaS具體包括了計算基礎設施服務(IaaS)、深度學習平臺服務(PaaS)、模型部署及推理服務(MaaS)三大部分的能力。
1、強大的計算基礎設施(IaaS):SenseCore提供高性能計算資源(例如GPU集群和高速網絡),以支持大型模型訓練所需的強大算力。分布式訓練構架支持千卡級別的大規模分布式訓練,千卡并行效率達91.5%,最高支持4,000塊GPU卡的單任務訓練,有效降低訓練時間,提升計算效率。2022年,位于上海臨港的商湯AIDC開放運營,是由公司自建的大規模、低碳節能的先進計算基礎設施,是目前亞洲最大的人工智能算力中心之一。上海臨港AIDC的開業大大增強了SenseCore的高性能算力供應能力。
2、易用的深度學習平臺、豐富的開發工具、預訓練模型庫和開源體系(PaaS):商湯提供易用的開發工具和深度學習平臺,協助內外部高效構建和優化模型。也提供涵蓋多個領域和場景的預訓練模型庫。用戶可基于這些模型進行二次開發,大幅縮短研發周期,降低研發成本和風險。同時,公司開源了OpenMMLab、OpenGVLab、OpenDILab、OpenXRLab及OpenPPL五大平臺,包含了共計2,500多種預訓練模型及400多種算法,這些開源體系吸引全球AI開發者的參與,在Github上獲得77,000+的星標。
3、靈活的模型部署及推理服務(MaaS):SenseCore支持用戶將訓練好的AI模型一鍵跨平臺部署到云端、邊緣設備或混合環境中。公司針對30款芯片、100多種平臺進行了常規模型的適配和優化,支持大規模的實時推理。提供模型壓縮、模型融合等優化工具和技術,進一步提高模型在部署和推理階段的性能。
小結
過去幾個月時間,國內外已經涌現出大量大模型產品,如今,探索大模型應用落地已經成為當前業界關注的焦點。目前包括商湯科技在內的不少企業已經在多個領域實現應用。此外,無論是大模型的訓練還是推理都離不開算力的支持,而在這方面,商湯科技也早有布局。在算力匱乏的當下,大模型+大裝置的戰略路線對于其后續的發展,也極其有利。
-
商湯
+關注
關注
0文章
56瀏覽量
3964
發布評論請先 登錄
相關推薦
評論