辰东,辰东全部小说,盗墓笔记txt全集下载

作者：小巖

編輯：小迪

如果把時(shí)間回?fù)?年，我們會(huì)發(fā)現(xiàn)，全世界范圍內(nèi)能夠進(jìn)行AI大模型研發(fā)的團(tuán)體，屈指可數(shù)。要知道，能夠訓(xùn)練大模型的算力設(shè)備基本是近3年發(fā)布的，而現(xiàn)象級(jí)產(chǎn)品ChatGPT的誕生，不過是最近一年的事情。

畢竟，大模型的發(fā)展需要極高的門檻，不僅需要強(qiáng)大的算力資源，更需要豐富的數(shù)據(jù)資源給予支持。大模型時(shí)代，離不開大算力，也離不開大數(shù)據(jù)。

但也就在一年的時(shí)間，各式各樣，專供大模型的公司和機(jī)構(gòu)如雨后春筍般冒出頭。大家開始角力，繼而陷入白熱化的競(jìng)爭(zhēng)狀態(tài)。就連著名AI科學(xué)家李開復(fù)都表示，未來中美的大模型公司中，能存活下去的只有5、6家。

我們不禁感嘆，大模型賽道從“高處不勝寒”到擠兌嚴(yán)重，竟然只需要如此短的時(shí)間。

“除了大廠，中美加起來應(yīng)該可以支撐5、 6家左右”。

12月14日，在一場(chǎng)與AI相關(guān)的對(duì)話中，零一萬物的CEO李開復(fù)被問到了一個(gè)問題：大模型賽道最終能有幾家活下來？對(duì)此，李開復(fù)也算是知無不言，他認(rèn)為，除了大廠，中美加起來應(yīng)該可以支撐五六家左右。

李開復(fù)表示，如今來看，做巨大預(yù)訓(xùn)練模型的機(jī)會(huì)正在變少。這個(gè)通道不能說是完全關(guān)閉了，但勢(shì)必會(huì)越來越難。未來只有在需要新技術(shù)的時(shí)候，才會(huì)出現(xiàn)更多的機(jī)會(huì)。與此同時(shí)，李開復(fù)還給出了AI未來的發(fā)展方向：AI Infra（人工智能基礎(chǔ)框架技術(shù)）和AI應(yīng)用等方面。

李開復(fù)解釋，“做AI應(yīng)用的機(jī)會(huì)就是現(xiàn)在，正如10多年前移動(dòng)互聯(lián)網(wǎng)所面臨的時(shí)代一樣。較早抓到機(jī)會(huì)的微信就成功了。當(dāng)然，后續(xù)也有抖音，拼多多等陸續(xù)崛起。但一定是越早入局，機(jī)會(huì)越大。真正有夢(mèng)想有野心的開發(fā)者，應(yīng)該是要做AI-First（AI優(yōu)先），AI-Native（AI原生）的應(yīng)用，這些應(yīng)用才可能成為AI 2.0時(shí)代最偉大或是最賺錢的應(yīng)用”。

事實(shí)的確如此。專業(yè)性大模型AI的開發(fā)競(jìng)爭(zhēng)激烈，各大公司在訓(xùn)練自家大模型時(shí)，還不得不面臨巨大的挑戰(zhàn)和限制。一方面，大模型的訓(xùn)練需要龐大的計(jì)算資源和時(shí)間，如果不是大廠或者擁有雄厚的資本支持獨(dú)角獸，這勢(shì)必會(huì)成為一個(gè)難以逾越的壁壘。另一方面，大模型的訓(xùn)練數(shù)據(jù)需要大量的人工標(biāo)注和清洗，這個(gè)過程專業(yè)性極高，復(fù)雜而耗時(shí)。更重要的是，大模型的應(yīng)用面臨著數(shù)據(jù)隱私和安全方面的挑戰(zhàn)，“如何保護(hù)用戶數(shù)據(jù)和防止濫用”是每個(gè)大模型開發(fā)者都需要考慮清楚，亟待解決的問題。稍有不慎，就會(huì)陷入泥潭。

李開復(fù)領(lǐng)銜零一萬物，發(fā)布首款開源中英雙語大模型“Yi”。

雖然強(qiáng)調(diào)AI大模型即將發(fā)展成“紅海賽道”，但李開復(fù)本人卻是賽道里卷的最兇的那個(gè)。

作為創(chuàng)新工場(chǎng)的董事長兼CEO，他成立了自己的AI公司“零一萬物”。就在上個(gè)月，零一萬物發(fā)布了首款開源中英雙語大模型“Yi”。

此次開源發(fā)布的Yi系列模型，包含34B和6B兩個(gè)版本，11月2日，零一萬物在Hugging Face上傳了這兩個(gè)參數(shù)。據(jù)悉，Hugging Face是全球最受歡迎的大模型，數(shù)據(jù)集開源社區(qū)，被認(rèn)為是大模型領(lǐng)域的GitHub，在大模型英文能力測(cè)試中具有相當(dāng)權(quán)威性。

根據(jù)Hugging Face英文開源社區(qū)平臺(tái)和C-Eval中文評(píng)測(cè)所提供的最新榜單，Yi-34B分別在預(yù)訓(xùn)練大語言模型和中文大模型榜單C-Eval排行榜爬升到第1位。這也是迄今為止唯一成功登頂 Hugging Face全球開源模型排行榜的國產(chǎn)模型。

與此同時(shí)，零一萬物新一輪的融資十分順利，由阿里云領(lǐng)投。目前，零一萬物估值已超10億美元，躋身獨(dú)角獸行列。李開復(fù)在2023年3月創(chuàng)建了零一萬物團(tuán)隊(duì)，6月開始運(yùn)營。也就是說，在短短8個(gè)月的時(shí)間里，零一萬物不僅推出了核心產(chǎn)品，更躋身成為估值超10億美元的“獨(dú)角獸”。

行業(yè)內(nèi)盡是大廠和“獨(dú)角獸”，也難怪李開復(fù)要感嘆大模型賽道競(jìng)爭(zhēng)激烈了。

大模型Yi全球領(lǐng)跑，旨在打造打造更多的To C Super App。

據(jù)了解，Yi-6B和Yi-3B分別代表數(shù)據(jù)參數(shù)量為60億和340億，按照李開復(fù)的說法，“34B是一個(gè)黃金尺寸”。

34B的最大優(yōu)勢(shì)在于一方面它不會(huì)小到?jīng)]有涌現(xiàn)或者涌現(xiàn)不夠，甚至已經(jīng)完全達(dá)到了涌現(xiàn)的門檻；另一方面，它又沒有太大，允許高效率的單卡推理。Yi-34B模型在多項(xiàng)評(píng)測(cè)基準(zhǔn)中全球領(lǐng)跑，基于超強(qiáng)Infra下模型訓(xùn)練成本實(shí)測(cè)下降40%，模擬千億規(guī)模訓(xùn)練成本則可以下降多達(dá)50%。

所謂AI Infra，全稱為AI Infrastructure ，即人工智能基礎(chǔ)架構(gòu)技術(shù)，主要涵蓋大模型訓(xùn)練和部署提供各種底層技術(shù)設(shè)施，包括處理器，操作系統(tǒng)，存儲(chǔ)系統(tǒng)，網(wǎng)絡(luò)基礎(chǔ)設(shè)施，云計(jì)算平臺(tái)等，是模型訓(xùn)練背后極其關(guān)鍵的“保障技術(shù)”。

?AI Infra是大模型行業(yè)發(fā)展至今較少被關(guān)注到的硬技術(shù)領(lǐng)域，但也是十分關(guān)鍵的領(lǐng)域。用李開復(fù)的話說，“做過大模型Infra的人比做算法的人才更稀缺”。

對(duì)于零一萬物而言，因?yàn)橛辛薡i做基礎(chǔ)，更多To C端的超級(jí)應(yīng)用才有可能出現(xiàn)。Yi的定位是通用底座，已在 Hugging Face，ModelScope，GitHub 3大全球開源社區(qū)平臺(tái)正式上線。與此同時(shí)，Yi系列量化版本，對(duì)話模型，數(shù)學(xué)模型，代碼模型，多模態(tài)模型等都將很快亮相。

按照李開復(fù)的邏輯，AI的技術(shù)壁壘終將會(huì)被一個(gè)個(gè)的攻破，對(duì)于AI公司來說，可持續(xù)，可增長的盈利才是要緊事，無法商業(yè)化的公司終將被淘汰。在AI 2.0時(shí)代，最大的商機(jī)一定是來自超級(jí)應(yīng)用，而且是消費(fèi)者級(jí)別的，諸如抖音，微信一樣的超級(jí)應(yīng)用。

目前，零一萬物已經(jīng)啟動(dòng)100B以上參數(shù)規(guī)模的模型訓(xùn)練，而多模態(tài)大模型團(tuán)隊(duì)也已經(jīng)集結(jié)了10多個(gè)人，說明零一萬物將朝著“消費(fèi)級(jí)應(yīng)用”的方向努力。而這些，恰恰與李開復(fù)所說的“AI Infra和AI應(yīng)用才是未來”的理念，不謀而合。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴