科技云報(bào)道原創(chuàng)。
過去大半年里,很多人對(duì)大模型的前景寄予厚望。主流觀點(diǎn)認(rèn)為,每個(gè)行業(yè)、每款產(chǎn)品都可以通過大模型“重做一遍”。
“重做一遍”聽起來想象空間很大,但實(shí)際上多數(shù)大模型產(chǎn)品需要漫長(zhǎng)的訓(xùn)練周期和海量資源投入,落地也就變得遙遙無期。
今年年初金山辦公宣布All in AI,將LLM能力全面引入產(chǎn)品,發(fā)布基于大語言模型的智能辦公助手WPS AI。
相較于大模型玩家普遍把“重做一遍”視為創(chuàng)新路徑時(shí),WPS AI帶來了另一種大模型創(chuàng)新方法論——與其“重做一遍”,不如去“重新發(fā)現(xiàn)”。
據(jù)悉,金山辦公選擇在大模型應(yīng)用側(cè)下功夫,WPS國(guó)內(nèi)版與WPS海外版同時(shí)推進(jìn)WPS AI研發(fā)落地,讓每個(gè)模型都能充分發(fā)揮自身的優(yōu)勢(shì)。
正因如此,WPS AI甚至比微軟的Microsoft 365 Copilot還快了一步,成了國(guó)內(nèi)第一個(gè)將大語言模型(LLM)應(yīng)用在辦公軟件領(lǐng)域,并真正交付了可用產(chǎn)品的公司。
自今年4月18日首次亮相以來,WPS AI在短短50天里對(duì)多個(gè)核心辦公場(chǎng)景進(jìn)行了賦能,用“金山速度”不斷刷新著生成式AI的應(yīng)用邊界。
如此驚人的進(jìn)化速度,WPS AI是如何實(shí)現(xiàn)的?
生成式AI的背后是大模型服務(wù)的支撐
如果你是WPS的用戶,最近可能會(huì)觀察到一些變化:金山文檔「智能文檔」的新功能已經(jīng)能夠幫你提供新聞稿、廣告文案、教學(xué)教案、工作周報(bào)等種種文件的起草、改寫、總結(jié)、潤(rùn)色、翻譯、續(xù)寫等功能。
除此之外,它還可以幫你一鍵生成幻燈片、一鍵分析Excel數(shù)據(jù)、翻譯總結(jié)文檔,自己寫日?qǐng)?bào)等等。
通過AI大模型,WPS構(gòu)建出一個(gè)更高效、快捷釋放場(chǎng)景能力的智能交互系統(tǒng),去解決用戶多元且碎片化的辦公需求。
不可否認(rèn),生成式AI本身的能力非常驚艷,但是生成式AI遠(yuǎn)遠(yuǎn)不只是以模型和AI這么簡(jiǎn)單。
基礎(chǔ)模型只是在海面上的冰山一角,為了支持好這個(gè)冰山一角,冰川的底部有多個(gè)服務(wù)來支撐,比如說加速芯片、存儲(chǔ)優(yōu)化、數(shù)據(jù)庫(kù)、大數(shù)據(jù)分析、安全服務(wù)等等。
不僅如此,支撐生成式AI的每一種技術(shù)和基礎(chǔ)設(shè)施環(huán)境,都在發(fā)生著快速變化。
以基礎(chǔ)模型為例,其發(fā)展是按照月甚至按照天的速度來迭的。2019年,最大的預(yù)訓(xùn)練模型是3.3億個(gè)參數(shù),但到了2023年,大模型最大的參數(shù)已經(jīng)超過了五千億個(gè),也就是說短短四年,整個(gè)參數(shù)的迭代超過了1600倍。
同時(shí),國(guó)內(nèi)外都掀起了“百模大戰(zhàn)”,從最開始出現(xiàn)的Transformer,到去年的GPT3.5、Stable Diffusion,再到今天GPT4、Llama2、Claude2等模型,還包括國(guó)內(nèi)正在自研的基礎(chǔ)模型如百川、ChatGLM等,每個(gè)模型都具備著他們自己獨(dú)有的場(chǎng)景和優(yōu)勢(shì)。
正如亞馬遜云科技的CEO Adam Selipsky所說,沒有一個(gè)基礎(chǔ)模型可以適用于所有的業(yè)務(wù)場(chǎng)景,用戶會(huì)根據(jù)自己的場(chǎng)景去選擇最適合自己的基礎(chǔ)模型。
這一點(diǎn)放在金山辦公身上同樣適用。
金山辦公AI研發(fā)總監(jiān)劉強(qiáng)在采訪中表示,幾乎很少有一個(gè)模型能涵蓋全部的能力,通常一個(gè)功能需要多個(gè)模型協(xié)作,需要考慮不同模型之間的調(diào)用方式不一樣。
但Amazon Bedrock的模型管理,能把不同大模型底層的API做成透明統(tǒng)一的,這減輕了很大的工作量。
金山辦公AI研發(fā)總監(jiān) 劉強(qiáng)
劉強(qiáng)提到的Amazon Bedrock,是亞馬遜云科技今年4月發(fā)布的一項(xiàng)生成式AI重要產(chǎn)品。
它支持來自AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和Amazon等領(lǐng)先人工智能公司的高性能基礎(chǔ)模型,并可以輕松安全地進(jìn)行自定義模型訓(xùn)練。
作為國(guó)內(nèi)第一批Amazon Bedrock的預(yù)覽版用戶,金山辦公可以在輕松使用這些高性能基礎(chǔ)模型的同時(shí),也能夠使用自己的數(shù)據(jù)構(gòu)建差異化的應(yīng)用程序。
與此同時(shí),金山辦公通過使用機(jī)器學(xué)習(xí)平臺(tái)Amazon SageMaker,正在幫助算法科學(xué)家快速進(jìn)行場(chǎng)景實(shí)驗(yàn)和算法迭代。
Amazon SageMaker不僅可以避免算法科學(xué)家從頭搭建模型,還可以通過Amazon SageMaker JumpStart功能幫助客戶快速構(gòu)建和部署模型,從而嘗試多種開源模型。
可以說,有了這類大模型管理作為基礎(chǔ)服務(wù)作為支撐,生成式AI的應(yīng)用創(chuàng)新事倍功半。
生成式AI要效率也要安全合規(guī)
隨著大模型的發(fā)展,數(shù)據(jù)的合規(guī)性和安全性成為亟待解決的問題。
在生成式AI領(lǐng)域中,數(shù)據(jù)的獲取、加工及利用的方式?jīng)Q定了模型的性能和準(zhǔn)確性。數(shù)據(jù)的非法泄漏、被惡意篡改,可能導(dǎo)致訓(xùn)練出的模型有誤導(dǎo)性;非法獲取或使用未經(jīng)授權(quán)的數(shù)據(jù),不僅違法,還可能使得模型偏離了其原本的目的。
前段時(shí)間,OpenAI被指控訓(xùn)練ChatGPT時(shí)使用從互聯(lián)網(wǎng)上抓取的數(shù)據(jù),大規(guī)模侵犯了無數(shù)人的版權(quán)和隱私。目前全球各國(guó)對(duì)于企業(yè)使用大模型的數(shù)據(jù)安全要求已日益提升。
不少企業(yè)在構(gòu)建大模型時(shí)也普遍要求私有化部署,即在加密環(huán)境中使用私有數(shù)據(jù)訓(xùn)練模型,以控制相關(guān)數(shù)據(jù)和模型的安全風(fēng)險(xiǎn)。
金山辦公AI研發(fā)總監(jiān)劉強(qiáng)表示,WPS非常重視數(shù)據(jù)安全,有專業(yè)的團(tuán)隊(duì)及合作伙伴共同打造完善的數(shù)據(jù)安全體系,在各個(gè)國(guó)家和地區(qū)可以有效的保障用戶隱私。
正因?qū)Π踩弦?guī)的重視,金山辦公作為一家中國(guó)企業(yè)得以順利走向全球。截至2022年底,WPS在海外已擁有超過1億活躍用戶,WPS Office累計(jì)獲得近4億次安裝。
從與金山辦公合作的亞馬遜云科技大模型服務(wù)來看,Amazon Bedrock在安全合規(guī)方面也助力頗多。
據(jù)亞馬遜云科技解決方案架構(gòu)師介紹,在開發(fā)之初就考慮到安全性和隱私保護(hù),幫助客戶保護(hù)敏感數(shù)據(jù):
首先,Amazon Bedrock從服務(wù)設(shè)計(jì)層面就確保了客戶的數(shù)據(jù)以及客戶相關(guān)的信息不會(huì)被用于進(jìn)一步訓(xùn)練模型。所有的客戶數(shù)據(jù)都是經(jīng)過加密的,且只有客戶能夠訪問。
其次,客戶可以使用Amazon PrivateLink,在Amazon Bedrock與虛擬私有網(wǎng)絡(luò)(VPC)之間建立專門的安全連接,確保任何數(shù)據(jù)傳輸都不會(huì)暴露在公共網(wǎng)絡(luò)。
最后,對(duì)于存在高度監(jiān)管需求的客戶,Amazon Bedrock符合 HIPAA(《健康保險(xiǎn)流通與責(zé)任法案》)要求,并且可以在 GDPR(歐盟《通用數(shù)據(jù)保護(hù)條例》)合規(guī)標(biāo)準(zhǔn)下使用,讓更多的客戶從生成式AI中獲益。
不難發(fā)現(xiàn),金山辦公也可以利用它有效提升安全合規(guī)工作的效率,并確保客戶數(shù)據(jù)的安全性,讓金山辦公的實(shí)力得以在海外充分釋放。
構(gòu)建生成式AI需要高性價(jià)比的基礎(chǔ)設(shè)施
正如前文所說,開發(fā)生成式AI應(yīng)用是一個(gè)充滿挑戰(zhàn)的系統(tǒng)工程,并不是單純的產(chǎn)品和服務(wù)拼接,需要各種技術(shù)和工具來解決挑戰(zhàn),而高性價(jià)比的基礎(chǔ)設(shè)施正是其強(qiáng)有力的支撐。
早在生成式AI創(chuàng)新之前,金山辦公就在積極探尋如何利用AI/ML技術(shù)為業(yè)務(wù)賦能。在數(shù)據(jù)存儲(chǔ)、現(xiàn)代化應(yīng)用開發(fā)、AI/ML、芯片等層面,金山辦公與亞馬遜云科技都有深度合作。
例如,WPS Office通過使用Amazon S3高效低成本地實(shí)現(xiàn)了PB級(jí)海量數(shù)據(jù)存儲(chǔ)。
通過Amazon S3的智能分層功能,在存儲(chǔ)方面獲得了40%以上的成本優(yōu)化效果;利用亞馬遜云科技在美國(guó)、日本和印度的節(jié)點(diǎn),將終端用戶的響應(yīng)延遲從日常大于1秒減少穩(wěn)定至500毫秒以下。
在構(gòu)建精細(xì)化運(yùn)營(yíng)方面,金山辦公基于機(jī)器學(xué)習(xí)平臺(tái)Amazon SageMaker服務(wù)構(gòu)建了從用戶識(shí)別、用戶轉(zhuǎn)換到流失用戶挽回的一整套用戶精細(xì)化運(yùn)營(yíng)路徑,通過人工智能預(yù)測(cè)用戶購(gòu)買,增強(qiáng)用戶轉(zhuǎn)化率。
除此之外,金山辦公還在嘗試?yán)脕嗰R遜提供的GPU機(jī)型和為生成式AI而打造的專門構(gòu)建的加速芯片(Amazon Inferentia和Amazon Trainium),為海外業(yè)務(wù)部署開源模型方案,并且嘗試?yán)眉铀傩酒瑏斫档统杀尽?/p>
總的來說,避免重復(fù)開發(fā)大模型,專注于模型的開發(fā)效率、調(diào)優(yōu)以及對(duì)底層基礎(chǔ)設(shè)施的高效利用,金山辦公為AI應(yīng)用帶來了新的研發(fā)方式,也為AI應(yīng)用開發(fā)者值得借鑒的思路。
未來,金山辦公還將以AIGC(內(nèi)容創(chuàng)作)、Copilot(智慧助理)和Insight(知識(shí)洞察)三個(gè)戰(zhàn)略方向?yàn)楹诵模破疝k公交互方式的新一輪變革。
【關(guān)于科技云報(bào)道】
專注于原創(chuàng)的企業(yè)級(jí)內(nèi)容行家——科技云報(bào)道。成立于2015年,是前沿企業(yè)級(jí)IT領(lǐng)域Top10媒體。獲工信部權(quán)威認(rèn)可,可信云、全球云計(jì)算大會(huì)官方指定傳播媒體之一。深入原創(chuàng)報(bào)道云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
87文章
31097瀏覽量
269429 -
大模型
+關(guān)注
關(guān)注
2文章
2482瀏覽量
2849
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論