大數據(big data),是指需要通過快速獲取、處理、分析以從中提取價值的海量、多樣化的交易數據、交互數據與傳感數據,其規模往往達到了PB(1024TB)級。不同機構對大數據也有不同的定義。
Gartner對大數據的定義:大數據是需要新處理模式才能具有更強決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。
麥肯錫對大數據的定義:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。
移動信息化研究中心對大數據的定義:大數據是幫助企業利用海量數據資產,實時、精確地洞察未知邏輯領域的動態變化,并快速重塑業務流程、組織和行業的新興數據管理技術。
大數據產業鏈簡介
大數據產業:是指一切與大數據的產生與集聚、組織與管理、分析與發現、應用與服務相關的所有活動的集合。主要包括大數據硬件、大數據軟件和大數據應用三大塊。
◆ 大數據提供者
擁有數據的公司、個人、社會團體以及政府機構等,此類角色屬于大數據產業鏈上的基礎環節,包括數據源提供者、數據流通平臺提供者和數據API提供者。目前我國大數據提供者包括政府管理部門、企業數據源提供商、互聯網數據源提供商、物聯網數據源提供商、移動通訊數據源提供商、提供數據流通平臺服務和數據API服務的第三方數據服務企業、社會團體或者個人等。
◆ 大數據產品提供者
提供直接應用于大數據產品的企業,包括提供大數據應用軟件、大數據基礎軟件、大數據相關硬件產品的企業。
大數據應用軟件產品提供者,包括提供整體解決方案的綜合技術服務商,也包括大數據計算基礎設施上(與云結合),從簡單的文件存儲的空間租售模式,逐步擴展到提供數據聚合平臺,進而擴展到為客戶提供分析業務的服務上。
大數據基礎軟件提供商,此類企業搭建大數據平臺、提供相關大數據技術支持、云存儲、數據安全等,此類公司在某些垂直行業或者區域掌握大數據入口與出口,并能對一些數據進行采集、整合和匯集。這樣的企業包括傳統的IT企業、設備商以及新興的云服務相關企業。
大數據相關硬件產品提供商,此類企業提供大數據采集、接入、存儲、傳輸、安全等硬件產品和設備。
◆ 大數據服務提供者
以大數據為核心資源,以大數據應用為主業開展商業經營的企業。包括大數據應用服務提供者、大數據分析服務提供者、大數據基礎設施服務提供者。這類企業挖掘數據價值,處于大數據產業鏈的下游,它們通過發掘隱藏在大數據中的價值,不斷推動大數據產業鏈中各個環節的發展和成熟。從某種角度上說正是此類公司創造了大數據的真正價值,具體包括:
1)應用服務提供者,基于大數據技術,對外提供大數據服務。
2)分析服務提供者,提供技術服務支持、技術(方法、商業等)咨詢,或者為企業提供類似數據科學家的咨詢服務。
3)大數據基礎設施服務提供者,提供面向大數據技術和服務提供者的培訓、咨詢、推廣等的基礎類通用類的服務提供者。
數據爆炸式增長,大數據行業市場規模持續擴大
當前網民增長進入了一個相對平穩的階段,互聯網在易轉化人群和發達地區居民中的普及率已經達到較高水平,下一階段中國互聯網的普及將轉向受教育程度較低的人群以及發展相對落后地區的居民。目前,隨著移動互聯網的繁榮發展,移動終端設備價格更低廉、接入互聯網更方便等特性,為部分落后地區和難轉化人群中的互聯網推廣工作提供了契機。
截至2020年6月,我國網民規模達9.4億,較2019年底增長4000萬,互聯網普及率達67.0%,較2019年底提升3.7個百分點。其中手機網民規模達9.32億,網民中使用手機上網的比例為99.2%,較2020年3月基本持平。
2020年上半年,我國互聯網產業展現出巨大的發展活力和韌性,克服了新冠肺炎疫情帶來的沖擊和困難,在數字基建、數字經濟、數字惠民和數字治理等方面取得了顯著進展,成為我國應對新挑戰、建設新經濟的重要力量。
當前,我國正在加速從數據大國向著數據強國邁進。國際數據公司IDC和數據存儲公司希捷的一份報告顯示,到2025年,隨著中國物聯網等新技術的持續推進,其產生的數據將超過美國。我國產生的數據量將從2019年的約9.4ZB增至2025年的48.6ZB,數據交易迎來戰略機遇期。1zettabyte大約是1萬億gigabyte,這是當今常用的測量方法。與此同時,美國2019年的數據量約為8.6ZB。到2025年,這個數字預計將達到30.6ZB。
在產業層面,我國大數據產業繼續保持高速發展,大數據將深入滲透到各行各業。對于我國大數據產業的規模,目前各個研究機構均采取簡介方法估算。根據國家工業信息安全發展研究中心通過對全國3000多家大數據相關企業的問卷調查和座談形成的《2019中國大數據產業發展報告》,截至2019年,大數據產業規模超過8000億元,預計到2020年底將超過萬億。目前,17個省市建立了大數據局,大數據安全維護機制日益完善。283所高校獲批數據與大數據技術專業。全國有100多個大數據相關產業聯盟成立,對大數據的發展起到推動作用。另外,大數據研發人員2019年超過8萬人,研發投入超過550億人民幣。
注:此處大數據統計口徑:指以數據生產、采集、存儲、加工、分析、服務為主的相關經濟活動,包括數據資源建設、大數據軟硬件產品的開發、銷售和租賃活動,以及相關信息技術服務。
大數據應用層將占據市場最大份額
大數據產業包括一切與大數據的產生與集聚(數據源)、組織與管理(存儲)、分析與發現(技術)、交易、應用與衍生產業相關的所有活動。大數據產業按照數據價值實現流程,包括數據源、大數據硬件支撐層、大數據技術層、大數據交易層、大數據應用層與大數據衍生層等六大層級,每一層都包含相應的IT硬件設施、軟件技術與信息服務等。
從發展趨勢來看,隨著大數據相關產品及應用的不斷普及,未來應用層規模將逐步增長。在技術層、數據源層以及衍生層的共同支撐下,2020年中國大數據應用市場規模份額將達到40%。其中,交易市場規模雖然占比最少,但是正是由于它的存在,使得數據的交易從法律上實現數據的合法化問題,以及實現了數據價值兌現。
大數據產業園區迅速發展助力數字經濟發展
國內大數據產業園是集聚大數據產業資源的重要載體。當前,不僅八個國家級大數據綜合試驗區(貴州、京津冀、遼寧、內蒙古、上海、河南、重慶、珠三角)的大數據產業園/基地快速發展,與這些試驗區毗鄰的省份,如安徽、湖北、四川、陜西、浙江、山東和江蘇,也都加快推進“大數據產業園區/基地”建設,增強數字經濟發展實力,加速產業轉型升級。
多數大數據產業園的發展思路:“基礎設施建設-數匯集整合開放共享,企業上云-大數據融合應用-大數據產業鏈延伸”,即首先聚集數據資源,而后通過落地開放共享,協同效應帶動開發,最終實現產業鏈的拓展和完善。
中國的大數據產業園可以分為三類:北京、上海、廣州和深圳的大數據產業園多脫胎于原先的各類軟件園,具有良好的發展基礎和優勢;河南、重慶、大連、沈陽、內蒙古、貴州等國家大數據綜合試驗區,加速推進轄區內大數據產業園建設;部分東南和中部省份,順應產業發展趨勢,也積極布局大數據產業園,力促產業轉型升級。
政策推動產業細化,產業價值鏈向上下游延伸
2015年,國家印發《關于促進大數據發展的行動綱要》,第一次將大數據上升到國家戰略高度,提出了我國大數據的頂層設計。此后,隨著大數據底層設施逐漸成熟,大數據分析開始結合具體行業,向下游垂直行業應用延伸。大數據開始由主題概念向業績兌現轉換。包括房地產、商貿零售、金融、汽車等傳統行業開始深入布局大數據的行業應用。大數據源的戰略性資源屬性越來越普遍地得到各方認同,擁有數據源的企業在補齊分析和應用的技術,有望憑借數據鏈上游核心資源迎來快速發展。
密集出臺的大數據政策表明國家大力推動的意愿,環保部、國務院辦公廳、國土資源部、國家林業局、煤工委、交通運輸部、農業部的細則側重指引垂直行業的落地。在政策的推動下,大數據加快了向各行業中的普及,并已全面從理論研究邁向實際應用,通過實際的經濟效益實現,帶動更多的行業開啟大數據應用探索。
具體從產業來看,互聯網、金融、通信、安防等產業目前與大數據融合情況較好,交通、能源、工業等也在快速應用大數據。以工業為例,工業大數據產業規模到2019年有600多億,到2020年,復合增長將達到50%以上,研發設計、生產、供應鏈、銷售、運維等領域數據量越來越大。而醫療行業大數據在某些點上用得不錯,但是要真正替代人,路徑還比較長。
數據外包將成為產業新機遇點
數據外包是指大數據企業將價值鏈中原本由自身提提供的具有基礎性的、共性的、非核心的IT業務和基于IT業務的流程剝離出來后,外包給專業服務提供商來完成,通過重組價值鏈、優化資源配置,降低成本,增強核心競爭力。
數據外包有效地解決了數據孤島以及清理和標記機器學習培訓數據需要花費大量的時間和費用這兩個問題,促成了“三贏”
數據安全防護需求驅動制度和技術變革
數據安全防護是通過采用各種技術和管理措施,使與數據采集、存儲、分析處理等各類系統正常運行,從而確保各類數據的可用性、完整性和保密性。通過采用全面的數據發現能力、快速的安全事件響應,以及有效地云和大數據安全保護,來為用戶提供合規的、彈性的、智能的、一站式數據安全解決方案。
數據泄露事件持續不斷。根據安全情報供應商Risk Based Security發布數據泄露情況顯示,2018年公開披露的數據泄露事件達到6500起,涉及50億條數據記錄。其中三分之二來自商業組織,政府占13.9%,醫療行業占13.4%,教育業占6.5%。2019年全球數據泄露持續增長,超過100億條,2020年前三季度更是達到360億條,遠超2019年全年。
數據泄露給企業和用戶等各方造成了高昂的成本,IBM Security 發布《2020年數據泄露成本報告》顯示,揭示了數據泄露事件給企業造成的平均成本為386萬美元,而其中員工賬戶遭受攻擊是最昂貴的原因。超過5000萬條記錄被泄露的數據泄露事件的成本,從2019年的3.88億美元躍升至3.92億美元。泄露記錄條數從40到5000萬條不等的數據泄露事件的平均成本達到3.64億美元,與2019年相比,該項成本增加了1900萬美元。
國內數據泄露方面,2020上半年重大數據泄露事件有:5億新浪微博用戶數據遭泄露、青島市膠州中心醫院6000余人個人信息被泄露、江蘇南通5000多萬條個人信息在“暗網”倒賣、建設銀行員工販賣5萬多條客戶信息等,具體如下:
目前國內的數據安全市場也正處于成長期,隨著數據泄露事件數量激增、性質不斷惡化,以及企業數字化轉型加速、業務上云,物聯網、區塊鏈等新技術的落地,國內對于數據安全相關領域和應用的重視程度正在不斷增加。
線下場景營銷成為大數據應用新機遇
隨著“互聯網流量紅利”達到飽和,線上營銷服務逐步由增量競爭轉變為存量競爭。在此背景下,以新零售為代表的“線下場景營銷”成為破局關鍵。
根據新零售理論,線上銷售將會與線下銷售結合,同時會結合現代物流、大數據、云計算等技術。未來可能會有60%-80%的零售屬于新零售。數據驅動是新零售的內核之一。
數字營銷供應商,通過收集線下場景數據,制作“人物畫像”,精準刻畫線下客戶群體。進一步,通過與各類“廣告主”合作,協助其將品牌精準推送給目標客戶。
責任編輯:gt
-
存儲
+關注
關注
13文章
4341瀏覽量
86030 -
數據采集
+關注
關注
39文章
6215瀏覽量
113865 -
大數據
+關注
關注
64文章
8903瀏覽量
137606
發布評論請先 登錄
相關推薦
評論