长生界辰东小说,耳根,欢乐颂第二季

“AI 2.0時代，垂直領域的數據會成為重要的生產資料，并帶來新的生產力突破。” 商湯科技董事長兼CEO徐立在“人工智能與數據要素產業生態大會”上說。

作為第七屆數字中國建設峰會的重要組成部分，人工智能與數據要素產業生態大會在福州正式召開。商湯科技董事長兼CEO徐立與中國工程院院士陳純、中國工程院院士鄧中翰、中國科學院院士林圣彩等一同出席，徐立發表主旨演講，分享了商湯科技在探索新質生產力發展過程中，對于大模型產業化路徑的獨特見解與實踐經驗。

會上，商湯與福建實達集團達成戰略合作，雙方將在人工智能算力建設、智慧城市、智慧應急、人工智能教育、城市能源管理等領域展開合作，推動福建人工智能產業創新，助力“數字中國”建設。

遵循尺度定律，

小模型也能具備大模型的能力

Scaling Law(尺度定律)被認為是大模型時代的“牛頓定律”，也是指導人工智能發展的基本法則，即隨著模型參數量、數據量、算力的增加，模型的性能也會勇往直前不斷提升。之所以稱之為“尺度定律”而非“規模定律”，因為它是一個資源調配的“指示器”。具體而言，尺度定律具有兩個特性：

可預測性：可以跨越5~7個數量級尺度依然保持對性能的準確預測;

保序性：可以在小尺度上驗證性能優劣，并在更大尺度上依然保持。

尺度定律可以指導我們在有限的研發資源上，找到最優的模型架構和數據配方，讓較小的模型也能具備大模型的能力。

從以上實驗數據可以看出，小模型在優化數據的情況下，性能上可以逼近甚至超越跨數量級的大模型。這背后，主要源于高質量的數據要素。

用戶體驗是大模型最重要標志，

感知理解和內容生成雙輪循環

最新發布的GPT-4o和谷歌Gemini，為AI行業帶來了啟發——流暢的體驗是決定大模型好壞最重要標志。流暢的體驗來自實測問題上的性能，這與數據強相關，而要獲得強大的數據能力，則需打通“感知理解”與“內容生成”的雙輪循環。回顧過去十年，人工智能主要解決對世界感知理解的問題，今天則進入了生成智能的時代。

如果要提升模型性能，感知理解和內容生成能力兩者需相輔相成，互相協同。理解可以助力生成，而生成又可以反向推動理解能力的提升，進而形成互相循環的飛輪。

商湯「日日新5.0」大模型體系正是通過感知算法和生成算法協同研發，實現了強大的多模態感知理解和生成能力，并帶來了出色的用戶體驗。在感知理解能力方面，不僅可以精準解讀并理解圖像內容，進行問題解答及互動，還能掌握話題及其背后深層含義。如果沒有深層次的多模態感知理解能力，那么大模型的水平只能停留在淺層的知識記憶。

基于深度的多模態理解能力，「日日新5.0」能夠精準理解圖片背后隱藏的中國文化內涵

在生成能力方面，「日日新5.0」建立在深層次的場景和語言理解能力基礎上，由此能夠精準把握畫作中場景氛圍和內容的表達。

人像是評估文生圖能力的關鍵場景之一，「日日新 5.0」生成的人像可以看出非常好皮膚的紋理，而其他幾個大模型在皮膚上都做了磨皮

在很多垂直領域，中國有大量早期發展積累下來的知識，用好這些知識，就能做出差異化的生成效果。在AI 2.0即生成式人工智能時代，垂直領域的數據會成為重要的生產資料，并帶來新的生產力突破。如果模型生產出來之后，又能夠利用好這些數據對外服務，再次數據資產化，就能形成一個不斷迭代的數據飛輪。

高效的響應速度，

是大模型能力產業化的核心

其實，最新的GPT-4o綜合能力略弱于GPT-4，但由于響應速度極快，反而可以帶來更出色的使用體驗。

商湯端側大模型全面對標甚至超過GPT-4。來看一項有趣的評測：將日日新·端側大語言模型SenseChat-Lite和GPT-4都接入到著名街機游戲《街霸》中進行對決。雖然GPT-4能夠輸出連招和復雜的動作，但SenseChat-Lite的出拳速度更快、動作更敏捷，拳拳到位，最終獲得了勝利。

紅色KEN是商湯日日新端側模型操縱，

綠色KEN是GPT-4操縱這項評測并非比較模型性能的強弱，而是展示了在該場景下，小模型的響應速度更快。所以，只要找到合適的模型，產業化落地也會變得非常快。

SenseChat-Lite 1.8B作為商湯今年4月發布的端側大模型，核心指標全面領先所有開源2B同級別模型，甚至在大部分測試中跨級擊敗了一些7B、13B模型。當然，單純的端側模型，性能自然比不過千億參數的云端大模型。但通過端云協同方案，將少數任務交給云端完成，而大部分任務放在端側，可以大大減少推理成本和提升響應速度。比如，在部分特定任務中，只需要調用30%的云端模型能力，就能獲得90%~95%的性能體驗，在不損失精度的同時，降低了70%的推理成本。

在性能方面，商湯的端側大語言模型擁有業內最快的推理速度。比如，人眼睛最快的閱讀數字是每秒20個字，而商湯的端側大語言模型可在旗艦平臺達到78.3字/秒。擴散模型同樣可在端側實現業內最快的推理速度。在某主流平臺上，商湯端側擴散模型的推理速度單張約1.0秒，比友商云端App快10倍，并且支持在端上快速進行等比擴圖、自由擴圖、旋轉擴圖等圖像編輯功能。

由于響應速度更快，覆蓋面更廣，端側應用是生成式大模型落地的重要載體。

比如日常對話、常識問答、文案生成、相冊管理、圖片生成以及圖片擴展等應用，都可以賦能包括手機、平板電腦、VR眼鏡、車載電腦在內的海量終端設備。《時代周刊》曾在1997年、2015年、2018年分別將克隆羊、VR、人工智能作為封面。但這三個都沒有真正成為用來命名那個時代的要素，原因是沒有真正切入到一個應用來驅動。

去年，《時代周刊》又將ChatGPT放在了封面上，和前面三次選擇不同的是，ChatGPT的核心不在于GPT這項技術，而在于將GPT疊加到了Chat這項應用上。GPT是一個2018年就已經形成共識的技術。所有技術真正意義上普及的關鍵，在于應用的疊加。中國發展人工智能的最大機會，正是在各種垂直行業的方向上，有著巨大的應用疊加的空間和潛力。

過去幾年，商湯與福建省各地市保持長期緊密合作，從城市治理到算力基礎設施服務、模型和生態層面進行了多項布局。

商湯希望依托福州新區智算平臺，推動閩港合作及各地的生態協同，共同打造以應用為驅動，以數據資產為要素的核心人工智能生態圈，繁榮AI產業發展。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴