算法、算力和數(shù)據(jù)共同構(gòu)成了AI產(chǎn)業(yè)鏈技術(shù)發(fā)展的三大核心要素。在人工智能行業(yè)發(fā)展進(jìn)程中,有監(jiān)督的深度學(xué)習(xí)算法是推動人工智能技術(shù)取得突破性發(fā)展的關(guān)鍵技術(shù)理論,而大量訓(xùn)練數(shù)據(jù)的支撐則是有監(jiān)督的深度學(xué)習(xí)算法實現(xiàn)的基礎(chǔ)。算法模型從技術(shù)理論到應(yīng)用實踐的落地過程皆依賴于大量的訓(xùn)練數(shù)據(jù),訓(xùn)練數(shù)據(jù)可以說是人工智能技術(shù)發(fā)展和進(jìn)步的基礎(chǔ)“燃料”。標(biāo)貝科技是我國早期進(jìn)入基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)的企業(yè)之一,對于未來訓(xùn)練數(shù)據(jù)發(fā)展趨勢看法如下:
AI產(chǎn)業(yè)對訓(xùn)練數(shù)據(jù)的持續(xù)性需求一直存在
基于成熟算法模型的拓展性需求和新生算法模型的前瞻性需求,AI產(chǎn)業(yè)對訓(xùn)練數(shù)據(jù)的需求將會一直存在。在成熟的拓展性需求方面,標(biāo)貝科技的研究報告表明:深度學(xué)習(xí)模型對訓(xùn)練數(shù)據(jù)的數(shù)據(jù)量、多樣性和更新速度方面都有著較高要求,為充分發(fā)揮技術(shù)潛能,深度學(xué)習(xí)模型需要海量且涵蓋圖像、視頻及語音在內(nèi)等多種類型的訓(xùn)練數(shù)據(jù)進(jìn)行模型訓(xùn)練。
此外,人工智能技術(shù)要求算法模型根據(jù)潛在的應(yīng)用場景變化而持續(xù)更新,因此,算法模型所使用的訓(xùn)練數(shù)據(jù)亦需要定期更新。具體而言,大部分算法模型的訓(xùn)練數(shù)據(jù)需要每月至少更新一次,部分算法模型的訓(xùn)練數(shù)據(jù)需要每日至少更新一次,算法模型持續(xù)更新的特點(diǎn)將進(jìn)一步拓展各領(lǐng)域AI數(shù)據(jù)服務(wù)的需求空間。
而在新生的前瞻性需求方面,隨著人工智能商業(yè)化進(jìn)程的演進(jìn),新興應(yīng)用場景如智聯(lián)網(wǎng)AIoT、AIPaaS、產(chǎn)業(yè)互聯(lián)網(wǎng)等將展現(xiàn)出巨大的發(fā)展?jié)摿?,并逐步促進(jìn)AI技術(shù)和算法模型的優(yōu)化和創(chuàng)新。因此,在創(chuàng)新應(yīng)用場景和新型算法的帶動下,具有前瞻性的訓(xùn)練數(shù)據(jù)產(chǎn)品和高定制化的AI數(shù)據(jù)服務(wù)需求也成為需求方越來越重視的數(shù)據(jù)要求之一。
定制化、精細(xì)化、場景化AI訓(xùn)練數(shù)據(jù)將將成為基礎(chǔ)數(shù)據(jù)服務(wù)市場主流
在行業(yè)發(fā)展前期,基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)的門檻較低,行業(yè)標(biāo)準(zhǔn)模糊,服務(wù)質(zhì)量也參差不齊。隨著AI產(chǎn)業(yè)落地成為主流,基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)整體競爭也愈發(fā)激烈,需求方對訓(xùn)練數(shù)據(jù)質(zhì)量的要求不斷提高,垂直場景的定制化訓(xùn)練數(shù)據(jù)需求成為主流,需求方市場對訓(xùn)練數(shù)據(jù)的要求逐漸向精細(xì)化轉(zhuǎn)型。需求方對訓(xùn)練數(shù)據(jù)的精細(xì)化需求主要體現(xiàn)在兩方面:
一方面,人工智能算法應(yīng)用要經(jīng)歷研發(fā)、訓(xùn)練和落地三個階段,需求方根據(jù)算法應(yīng)用的不同階段對訓(xùn)練數(shù)據(jù)提出差異化需求:
研發(fā)階段:需求方的數(shù)據(jù)需求是對新拓展領(lǐng)域或新建算法的訓(xùn)練,對訓(xùn)練數(shù)據(jù)的數(shù)據(jù)量要求較高,但數(shù)據(jù)標(biāo)注內(nèi)容傾向于標(biāo)準(zhǔn)化標(biāo)注;
訓(xùn)練階段:需求方的數(shù)據(jù)需求一般是對算法的準(zhǔn)確性和健壯性進(jìn)行優(yōu)化,對數(shù)據(jù)標(biāo)注的內(nèi)容需求較為豐富,對數(shù)據(jù)準(zhǔn)確性要求較高;
落地階段:需求方的數(shù)據(jù)需求一般為算法較成熟的核心場景,對訓(xùn)練數(shù)據(jù)的內(nèi)容有特定指向,采標(biāo)難度較大。
同時,數(shù)據(jù)需求方對基礎(chǔ)數(shù)據(jù)服務(wù)商的技術(shù)能力、服務(wù)意識、穩(wěn)定性和效率有較高要求。隨著人工智能技術(shù)的發(fā)展及與應(yīng)用場景的深入結(jié)合,訓(xùn)練需求和落地需求逐漸成為主流。
另一方面,需求方對基礎(chǔ)數(shù)據(jù)服務(wù)商的數(shù)據(jù)安全、采標(biāo)能力、數(shù)據(jù)質(zhì)量、管理能力、服務(wù)能力等核心能力提出了更高的要求。標(biāo)貝科技是較早進(jìn)行進(jìn)入基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)的企業(yè)之一,積極鉆研數(shù)據(jù)訓(xùn)練核心技術(shù),在基礎(chǔ)數(shù)據(jù)服務(wù)市場積累了大量的落地實施案例,擁有自研數(shù)據(jù)采集以及數(shù)據(jù)標(biāo)注平臺。
在數(shù)據(jù)安全方面,標(biāo)貝可滿足需求方對數(shù)據(jù)授權(quán)、數(shù)據(jù)傳輸、存儲及結(jié)項后的數(shù)據(jù)銷毀數(shù)據(jù)安全技術(shù);在采標(biāo)能力方面,標(biāo)貝可滿足需求方在某些特定領(lǐng)域或垂直場景的采集能力、定制研發(fā)標(biāo)注工具的能力;在數(shù)據(jù)質(zhì)量方面,標(biāo)貝科技可做到100%的數(shù)據(jù)準(zhǔn)確率的交付;此外,標(biāo)貝以出色的項目管理能力、服務(wù)效率以及執(zhí)行團(tuán)隊的素養(yǎng)與信譽(yù)在基礎(chǔ)數(shù)據(jù)行業(yè)具有較大的競爭優(yōu)勢;標(biāo)貝科技可快速響應(yīng)客戶需求,積極主動為客戶提供多種樣式的基礎(chǔ)數(shù)據(jù)服務(wù)解決方案,滿足用戶定制化、精細(xì)化、場景化數(shù)據(jù)需求。
-
數(shù)據(jù)采集
+關(guān)注
關(guān)注
39文章
6114瀏覽量
113681 -
AI
+關(guān)注
關(guān)注
87文章
30919瀏覽量
269171 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1208瀏覽量
24710
發(fā)布評論請先 登錄
相關(guān)推薦
評論