過去四十年,經濟發展主要來自于土地、勞動力、農業技術、工業技術等要素的充分釋放。面向數字經濟時代,無論是大模型、自動駕駛還是具身智能、人形機器人,數據已然成為繼土地、勞動、資本和技術之后的又一種戰略資產和新型生產要素,其打破了傳統生產要素的質態,促進各類要素融合創新,成為發展新質生產力的優質生產要素。
隨著數據要素的深入應用,各領域對海量數據的挖掘和運用無疑正預示著新一波生產力的增長和智能化浪潮的到來。然而,由于標準缺失、系統壁壘、安全擔憂等原因,限制了數據共享與價值釋放。
為此,數據治理的重要性日益凸顯,成為激活數據價值、實現數據價值轉化的關鍵議題之一。
數據要素市場亟待開發
隨著新一代信息技術與數字技術不斷發展,數據正成為基礎性生產要素,關鍵價值愈發凸顯。根據國家數據局發布的《數字中國發展報告(2023年)》顯示,2023年我國數據生產總量達32.85ZB,同比增長22.44%,這標志著數據資源的豐富性和多樣性正在不斷提升。
盡管當前仍有海量的數據沉淀在各大系統中,但數據要素已成為數據時代的新引擎,其崛起之勢已不可阻擋。隨著以生成式AI、大數據、區塊鏈、Web3.0等新技術作為基礎性和驅動性的技術力量,與制造、醫療、教育、交通、農業等領域深度融合,可以充分釋放數據要素價值。
在數據要素流通的過程中,既要解決數據供給側的“最初一公里”,又要解決數據釋放價值的“最后一公里”。目前,數據要素市場尚存兩大難題,既要讓高質量數據“供得出”,也要讓各類數據要素“流得動”。
對于數據本身而言,數據的準確性是保證其價值的關鍵。然而,在實際應用中,由于數據采集、存儲、處理等環節存在不規范操作,導致數據出現錯誤、遺漏、重復等問題,嚴重影響了數據的準確性。其次,數據的完整性對于數據分析和決策至關重要。如果數據不完整,可能會導致分析結果出現偏差,從而影響決策的科學性。第三,數據的時效性直接關系到決策的及時性和有效性。如果數據過時,可能會導致決策失誤,給企業和社會帶來不必要的損失。如果企業在制定營銷策略時,使用了過時的市場數據,就會導致營銷策略與市場實際需求脫節,影響了企業的市場競爭力。
要想讓數據要素發揮最大價值,其中一個關鍵方向便是推動數據要素的流通。數據要素的流通就如同為產業注入新的活力源泉,它能夠打破數據孤島,讓數據在不同的環節、不同的企業之間高效流動起來。當數據不再被局限于某一特定領域或企業內部,而是在更大的范圍內實現共享與交互時,其價值將得到進一步的釋放。
為了更快培育數據要素市場,不久前國家數據局等17部門印發《“數據要素×”三年行動計劃(2024—2026年)》進一步細化了數據要素發展的路徑和目標,強調了數據要素在未來經濟發展中的戰略地位和重要作用。
《行動計劃》提出,到2026年底,數據要素應用廣度和深度大幅拓展,在經濟發展領域數據要素乘數效應得到顯現,打造300個以上示范性強、顯示度高、帶動性廣的典型應用場景,涌現出一批成效明顯的數據要素應用示范地區。
數據本身是抽象的,只有將其應用于具體的業務場景,才能發揮價值。例如,在零售行業,通過分析消費者的購買行為數據,企業可以更好地了解消費者需求,從而優化產品組合和營銷策略;在醫療領域,利用患者的健康數據,可以為患者提供個性化的治療方案。因此,構建多樣化的應用場景,是實現數據價值化的基礎。
加快場景化建設步伐,對于推動中國數據要素價值化具有重要意義。通過構建豐富的應用場景,不僅可以充分發揮數據的潛在價值,還可以促進數據的交易和流通,帶動相關技術和產業的發展,為經濟高質量發展注入新的動力。
數據要素的三次價值釋放
數據的生產、應用、流通形成了“價值三角”,三角彼此互為支撐、互相影響。
公開數據顯示,中國數據量規模從2022年的23.88ZB,將增長至2027年的76.6ZB,年均增長速度CAGR達到26.3%,登頂全球第一,其中企業數據量占比達到76%。而最新調研顯示,企業認為有60%的業務數據是有價值的,但這些數據中僅有56%被實際分析,這意味著仍有更多的數據價值有待挖掘釋放。
隨著數據要素在產業的應用程度加深,數據要素投入生產的途徑可分為三次價值釋放過程,即:數據支撐業務貫通、數據推動數智決策、數據流通對外賦能。
數據的一次價值釋放體現在支撐政府、企業等組織的業務系統運轉,實現業務間的貫通。首先,數據經由各個業務系統的設計產生,經過業務系統的規范,在特定范圍內實現標準化數據的不斷積累,逐漸匯聚成可利用的資源。其次,這些數據支撐著業務系統的正常運轉,通過系統對數據的讀寫,實現業務初步的標準化、自動化管理和運營。最后,一定程度標準化的數據具備了通用性,數據得以打破線下與線上的界限,打破業務流程間的界限,甚至有打破組織內部業務領域間界限的能力。總之,業務系統搭建起來、數據在系統中運轉起來時,數據就已經在生產活動中釋放出價值。
在第二階段中,通過數據的加工、分析、建模,揭示出更深層次的關系和規律,使生產、經營、服務、治理等環節的決策更智慧、更智能、更精準。一方面,通過對大量數據的管理和分析,組織內部的決策者可以實現“用數據說話、用數據決策”,運用數據呈現出的關鍵指標與信息評估發展態勢,即時有效防范、化解風險,創新行動方略;另一方面,數據分析也直接嵌入系統,與業務緊密融合,即時的數據挖掘、分類、預測、聚類等直接向業務賦予智能化的價值。
第三階段使不同來源的優質數據在新的業務需求和場景中匯聚融合,流通賦能是數據要素價值飛躍的一個關鍵。一方面,數據具有規模報酬遞增效應,越大規模、越多維度的數據融合匯聚創造的價值越大,企業自有數據與外部數據的充分融合可以實現數據應用價值的最大化。另一方面,數據具有的低成本復制性可以改變要素投入生產的結構,更大規模、更廣范圍的數據要素利用不會增加過多額外成本,但可以產生超額利潤。這個階段數據變成更加像資產一樣可以流動起來,這個階段特點是流通和賦能,是數據更好流動是讓數據價值逐步更大發揮的關鍵。
如何做好讓數據更好流動?螞蟻數科首席技術官王維認為,在整個流動過程中要解決三個關鍵環節的問題和挑戰,他把三個關鍵環節歸納為“源、建、流”。
“源”指數據源。為了獲取數據,很多企業和行業會采購、引入、導入或與更多合作伙伴一起共享數據。但在人工智能時代,數據除了對物理世界描述以外,更多的合成數據也層出不窮,數據的形態也多種多樣,因此數據源環節更多挑戰也撲面而來。
“建”是把原始數據如何更好地加工成可用數據。這個過程中系統、組織、標準、流程需要緊密協同,海量數據和豐富場景為數據平臺的安全性、智能性和可靠性帶來前所未有的挑戰。
“流”指數據流通環節,這個過程需要構建共享平臺和機制,不僅促進企業內數據共享內循環,也要激勵企業間數據相互交互和融合,實現外循環。同時,還需要依托人工智能、隱私計算、區塊鏈等相關技術,保證全鏈路的安全可信、智能,進而讓數據流動起來,其價值才能夠發揮到最大化。
激活數據要素價值潛能
對于如何激活數據要素潛能,王維在近日舉行的2024 Inclusion外灘大會上也給出自己的觀點。他表示,融合技術創新是數據要素價值釋放的基石。作為螞蟻集團的科技商業化板塊,螞蟻數科將在數據治理、數據安全、數據流通、數據應用等領域持續深耕,將技術與場景結合,提供更多扎實有效的技術產品與服務,促進數據安全高效流通,加速數據要素價值賦能千行百業。
大會期間,螞蟻數科正式對外發布一站式智能數據開發與治理平臺DataFab,助力企業高效管理數據資產。據了解,DataFab平臺基于螞蟻集團在數據中臺領域的最佳實踐打造,提供從數據引入、架構規范、研發及數據資產管理的一站式服務,助力企業打造標準化、資產化、服務化及智能化的大數據體系與數據中臺,高效實現數據資產的生產、治理與價值釋放,驅動業務數智化轉型與創新發展。
王維介紹,DataFab是匯集了螞蟻集團整個大數據治理體系的“集大成者”,其數據量級已經超過2000PB。在整個過程中,DataFab已經錘煉出平臺高性能、高可用的能力。同時,DataFab平臺可以依托于螞蟻大數據、大模型的基礎能力,能夠推出更多智能化的能力,讓取數、用數變得更加方便、快捷,大大降低企業用數的門檻,節約數據獲取、使用和管理成本。
目前,DataFab已經全面支撐了螞蟻集團旗下數十個業務主體、超過2000PB級的數據。通過海量數據及復雜場景下的實踐錘煉,DataFab平臺在支撐數據量、系統高可用行及智能化能力方面取得了業務領先的成果。近日,在中國信通院舉辦的數據中臺解決方案測試中,DataFab通過全部283項評測項,達到優秀級標準。
除了DataFab,螞蟻數科還發布了新一代AI數據標注產品。隨著生成式人工智能爆發,高質量數據集成為大模型落地產業的關鍵瓶頸,圍繞大模型的數據供給已然成為一塊充滿潛力的市場。
今年5月,AI數據標注初創企業Scale AI完成10億美元F輪融資,其估值更是達到138億美元。但不同于ScaleAI的是,螞蟻數科提供的不僅是AI數據標注服務,產品線還包含數據加工與合成服務。
眾所周知,數據標注在AI模型訓練中扮演著極為重要的角色,是構建高效智能系統的第一步。然而,傳統數據標注方式往往依賴人工操作,面臨成本高、效率低等問題。隨著大模型時代的到來,數據量呈指數級增長,企業和組織在非結構化數據的處理上頻頻遭遇瓶頸。如何在保證標注質量的前提下提升標注效率,已經成為一個亟待解決的行業難題。
螞蟻數科此次發布的新一代數據標注產品采用了先進的AI算法,具備模塊化服務和算法調度能力,能夠對“人和任務”進行高效匹配,以降低標注的復雜性。這款產品讓企業能夠更加靈活地應對多模態大模型和行業定制大模型在數據標注上的需求,以及文本、圖像、音頻、視頻等多種類型的標注需求。根據實測數據顯示,使用該AI標注工具后,標注效率提升超過40%。
為了提升產品的專業性,螞蟻數科還配備了一支近萬人的人工標注團隊,其中90%以上為垂直專業領域的高階標注人才。這一策略不但提升了數據服務的質量,也為AI算法的優化提供了現場把控和反饋保障,進一步助力企業在數據使用上取得實質性進展。
數據的力量磅礴蒼勁,創新的道路永無止境。數據作為新型生產要素,與云計算、人工智能等技術的共同驅動下,正日益走向成熟應用,從物質生產到終端消費,從城市發展到鄉村振興,數據加速推動了生產生活、經濟發展和社會治理方式深刻變革。但即便是前沿如大模型技術,也很難成為激活數據要素潛能的唯一解。為此,螞蟻數科將持續投入區塊鏈、物聯網、隱私計算、AI等多種數字技術創新,以技術為引擎,激發數據要素價值加速釋放。
結語
展望未來,隨著技術的迭代和應用場景的拓展,數據要素市場將迎來更廣闊的前景。但企業要想在未來的市場競爭中脫穎而出,就必須緊跟行業發展趨勢,加大相關技術投入,挖掘數據價值,只有這樣才能在數據要素市場中搶占先機,實現可持續發展。
【關于科技云報到】
企業級IT領域Top10新媒體,又名科技云報道。聚焦云計算、人工智能、大模型、網絡安全、大數據、區塊鏈等企業級科技領域。原創文章和視頻獲工信部權威認可,是世界人工智能大會、數博會、國家網安周、可信云大會與全球云計算等大型活動的官方指定傳播媒體之一。
審核編輯 黃宇
-
大數據
+關注
關注
64文章
8893瀏覽量
137471
發布評論請先 登錄
相關推薦
評論