在AI產(chǎn)業(yè)鏈中,算法、算力和數(shù)據(jù)共同構(gòu)成技術(shù)發(fā)展的三大核心要素。在當(dāng)前人工智能行業(yè)發(fā)展進(jìn)程中,有監(jiān)督的深度學(xué)習(xí)算法,是推動人工智能技術(shù)取得突破性發(fā)展的關(guān)鍵技術(shù)理論,而大量訓(xùn)練數(shù)據(jù)的支撐則是有監(jiān)督的深度學(xué)習(xí)算法實(shí)現(xiàn)的基礎(chǔ),訓(xùn)練數(shù)據(jù)早已成為算法模型發(fā)展和演進(jìn)的燃料。
AI基礎(chǔ)數(shù)據(jù)服務(wù)市場快速增長
當(dāng)前,全球基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)正處于快速成長期,市場規(guī)模具有較大的增長空間。從AI產(chǎn)業(yè)鏈的發(fā)展情況和未來發(fā)展趨勢來看,中國基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)的市場規(guī)模也將不斷擴(kuò)大。
一方面,隨著算法模型、技術(shù)理論和應(yīng)用場景的優(yōu)化和創(chuàng)新,AI產(chǎn)業(yè)對訓(xùn)練數(shù)據(jù)的拓展性需求和前瞻性需求均快速增長;另一方面,隨著行業(yè)內(nèi)對訓(xùn)練數(shù)據(jù)需求類型的增加以及對服務(wù)標(biāo)準(zhǔn)要求的提高,產(chǎn)業(yè)鏈的專業(yè)化分工將愈加清晰,專業(yè)化的訓(xùn)練數(shù)據(jù)服務(wù)提供商將扮演更加重要的角色。
根據(jù)IDC預(yù)測,2025年中國人工智能市場規(guī)模有望達(dá)到184.3億美元(約1200億人民幣)。其中,關(guān)于基礎(chǔ)數(shù)據(jù)部分,預(yù)計(jì)中國AI基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模近5年來的復(fù)合年增長率達(dá)到47%,預(yù)期2025年將突破120億元,達(dá)到中國人工智能市場支出總額的約10%。
在當(dāng)前技術(shù)發(fā)展進(jìn)程中,深度學(xué)習(xí)算法是推動人工智能技術(shù)取得突破性發(fā)展的關(guān)鍵技術(shù)理論,而大量訓(xùn)練數(shù)據(jù)的訓(xùn)練支撐則是深度學(xué)習(xí)算法實(shí)現(xiàn)的基礎(chǔ)。訓(xùn)練數(shù)據(jù)越多、越完整、質(zhì)量越高,模型推斷的結(jié)論越可靠。因此,要使算法模型實(shí)現(xiàn)從技術(shù)理論到應(yīng)用實(shí)踐的落地過程,就需要提供大量的訓(xùn)練數(shù)據(jù),對算法模型加以訓(xùn)練。
2021年,全球人工智能和機(jī)器學(xué)習(xí)領(lǐng)域最權(quán)威的學(xué)者之一吳恩達(dá)教授提出二八定律:AI研究80%的工作應(yīng)該放在數(shù)據(jù)準(zhǔn)備上,確保數(shù)據(jù)質(zhì)量是最重要的工作。
然而,從自然數(shù)據(jù)源簡單收集取得的原料數(shù)據(jù)并不能直接用于有監(jiān)督的深度學(xué)習(xí)算法訓(xùn)練, 必須經(jīng)過專業(yè)化的采集、加工,形成相應(yīng)的工程化訓(xùn)練數(shù)據(jù)集后才能供深度學(xué)習(xí)算法等訓(xùn)練使用。目前,應(yīng)用有監(jiān)督學(xué)習(xí)的算法對于訓(xùn)練數(shù)據(jù)的需求遠(yuǎn)大于現(xiàn)有的標(biāo)注效率和投入預(yù)算,基礎(chǔ)數(shù)據(jù)服務(wù)將持續(xù)釋放其對于算法模型的基礎(chǔ)支撐價(jià)值。
海天瑞聲為全球科技企業(yè)提供數(shù)據(jù)服務(wù)
海天瑞聲主要從事AI訓(xùn)練數(shù)據(jù)的研發(fā)設(shè)計(jì)、生產(chǎn)及銷售業(yè)務(wù)。公司通過設(shè)計(jì)數(shù)據(jù)集結(jié)構(gòu)、組織數(shù)據(jù)采集、對取得的原料數(shù)據(jù)進(jìn)行加工,最終形成可供AI算法模型訓(xùn)練使用的專業(yè)數(shù)據(jù)集,通過軟件形式向客戶交付。
自2005年成立以來,該公司始終致力于為AI產(chǎn)業(yè)鏈上的各類機(jī)構(gòu)提供算法模型開發(fā)訓(xùn)練所需的專業(yè)數(shù)據(jù)集。經(jīng)過多年發(fā)展,公司已成為人工智能基礎(chǔ)數(shù)據(jù)服務(wù)領(lǐng)域具有較強(qiáng)國際競爭力的國內(nèi)頭部企業(yè),并實(shí)現(xiàn)了標(biāo)準(zhǔn)化產(chǎn)品、定制化服務(wù)、相關(guān)應(yīng)用服務(wù)全覆蓋。
海天瑞聲所提供的訓(xùn)練數(shù)據(jù)涵蓋智能語音(語音識別、語音合成等)、計(jì)算機(jī)視覺、自然語言等多個核心領(lǐng)域,全面服務(wù)于人機(jī)交互、智能家居、智能駕駛、智慧金融、智能安防等多種創(chuàng)新應(yīng)用場景。
其產(chǎn)品和服務(wù)已獲得字節(jié)跳動、阿里巴巴、騰訊、百度、科大訊飛、海康威視、微軟、 亞馬遜、三星、中國科學(xué)院、清華大學(xué)等國內(nèi)外客戶的認(rèn)可,應(yīng)用于其研發(fā)的個人助手、智能音箱、語音導(dǎo)航、搜索服務(wù)、短視頻、虛擬人、智能駕駛、機(jī)器翻譯等多種產(chǎn)品相關(guān)的算法模型訓(xùn)練過程中。
目前公司客戶累計(jì)數(shù)量 740 家,覆蓋了科技互聯(lián)網(wǎng)、社交、IoT、智能駕駛、智慧金融等領(lǐng)域的主流企業(yè),教育科研機(jī)構(gòu)以及部分政企機(jī)構(gòu)。
最近由OpenAI推出的ChatGPT大火,微軟也宣布將ChatGPT功能集成到公司的產(chǎn)品中,包括必應(yīng)。海天瑞聲日前表示,微軟是公司的重要客戶之一,公司向微軟提供智能語音-訓(xùn)練數(shù)據(jù)定制服務(wù)及訓(xùn)練數(shù)據(jù)產(chǎn)品、自然語言-訓(xùn)練數(shù)據(jù)定制服務(wù)及訓(xùn)練數(shù)據(jù)產(chǎn)品、計(jì)算機(jī)視覺-訓(xùn)練數(shù)據(jù)定制服務(wù)及訓(xùn)練數(shù)據(jù)產(chǎn)品、訓(xùn)練數(shù)據(jù)相關(guān)的應(yīng)用服務(wù)。
可以看到海天瑞聲的業(yè)務(wù)已經(jīng)遍布國內(nèi)外,除了國內(nèi)字節(jié)跳動、阿里巴巴、騰訊、百度等之外,海天瑞聲也與多家海外知名科技企業(yè)合作,包括Microsoft、Meta、Samsung、Google等。
海天瑞聲表示,相比于境內(nèi),海外市場空間更加廣闊。根據(jù)IDC數(shù)據(jù),全球AI投入約為中國AI投入的10倍以上,廣闊的市場空間意味著更多的市場參與者與更加激烈的競爭環(huán)境,過往多年公司憑借在語音方面的深厚積累,尤其是多語種方面的積累和能力,獲得眾多境外客戶認(rèn)可,公司的多語種、以及OCR數(shù)據(jù)集幫助眾多海外公司進(jìn)行其全球化擴(kuò)張。
截至目前,公司已覆蓋超過190種語種/方言,不僅包括含英、法、德、意、西、日、韓等常見語種,還包括東南亞、一帶一路等國家地區(qū)的罕見多語種,尤其在亞洲多語種的服務(wù)上具備獨(dú)特的競爭優(yōu)勢。
小結(jié)
隨著ChatGPT大火,預(yù)計(jì)大模型的訓(xùn)練和部署將會加速,而數(shù)據(jù)作為AI產(chǎn)業(yè)鏈中的一環(huán),重要作用不可忽視。在這個領(lǐng)域,國內(nèi)已經(jīng)有一批早早入局的企業(yè),在技術(shù)上已經(jīng)具備深厚積累,這對于國內(nèi)在發(fā)展大模型技術(shù)方面來說,無疑是很好的基礎(chǔ)。
審核編輯 :李倩
-
算法
+關(guān)注
關(guān)注
23文章
4612瀏覽量
92901 -
AI
+關(guān)注
關(guān)注
87文章
30896瀏覽量
269108 -
人工智能
+關(guān)注
關(guān)注
1791文章
47279瀏覽量
238511
原文標(biāo)題:算法模型發(fā)展的燃料,AI基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模快速增長!
文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論