在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度挖掘大數據現狀分析

454398 ? 來源:ST社區 ? 作者:ST社區 ? 2022-12-13 11:39 ? 次閱讀

來源:ST社區

技術型的高科技創業公司都喜歡閃閃發光的新東西,而“大數據”跟3年前火熱程度相比反而有些凄慘。雖然Hadoop創建于2006年,在“大數據”的概念興起到達白熱化是在2011年至2014年期間,當時在媒體和行業面前,大數據就是“黑金石油”。2015年數據世界中時尚年輕人喜歡轉移到AI的相關概念,他們口味變成:機器智能深度學習等。

企業級技術 = 艱苦的工作

其實大數據有趣的是它不是直接可以炒作的東西。

能夠獲得廣泛興趣的產品和服務往往是那些人們可以觸摸和感受到的,比如:移動應用,社交網絡,可穿戴設備,虛擬現實等。

但大數據,從根本上說是“管道”。當然,大數據支持許多消費者或企業用戶體驗,但其核心是企業的技術:數據庫,分析等:而這后面幾乎沒人能看到東西運行。

而且如果大家真正工作過的都知道,在企業中改造新技術并不大可能在一夜之間發生。

早年的大數據是在大型互聯網公司中(特別是谷歌,雅虎,Facebook,Twitter,LinkedIn等),它們重度使用和推動大數據技術。這些公司突然面臨著前所未有的數據量,沒有以前的基礎設施,并能招到一些最好的工程師,所以他們基本上是從零開始搭建他們所需要的技術。開源的風氣迅速蔓延,大量的新技術與更廣闊的世界共享。隨著時間推移,其中一些工程師離開了大型網絡公司,開始自己的大數據初創公司。其他的“數字原生”的公司,其中包括許多獨角獸,開始面臨跟大型互聯網公司同樣需求,無論有沒有基礎設施,它們都是這些大數據技術的早期采用者。而早期的成功導致更多的創業和風險投資。

現在一晃幾年了,我們現在是有大得多而棘手的機會:數據技術通過更廣泛從中型企業到非常大的跨國公司。不同的是“數字原生”的公司,不必從頭開始做。他們也有很多損失:在絕大多數的公司,現有的技術基礎設施“夠用”。這些組織也明白,宜早不宜遲需要進化,但他們不會一夜之間淘汰并更換關鍵任務的系統。任何發展都需要過程,預算,項目管理,導航,部門部署,全面的安全審計等。大型企業會小心謹慎地讓年輕的創業公司處理他們的基礎設施的關鍵部分。而且,一些(大多數?)企業家壓根不想把他們的數據遷移到云中,至少不是公有云。

大數據分析的基本流程

從另一個關鍵點大家就明白了:大數據的成功是不是實現一小片技術(如Hadoop的或其他任何東西),而是需要放在一起的技術,人員,流程的流水線。你需要采集數據,存儲數據,清理數據,查詢數據,分析數據,可視化數據。這將由產品來完成,有些由人力來完成。一切都需要無縫集成。歸根結底,對于這一切工作,整個公司,從高級管理人員開始,需要致力于建立一個數據驅動的文化,大數據不是小事,而是全局的事。

換句話說:這是大量艱苦的工作。

部署階段

以上解釋了為什么幾年后,雖然很多高調的創業公司上線也拿到引人注目的風險投資,但只是到達大數據部署和早期成熟階段。

更有遠見的大公司(稱他們為“嘗鮮者”在傳統的技術采用周期),在2011 - 2013年開始早期實驗大數據技術,推出Hadoop系統,或嘗試單點解決方案。他們招聘了形形色色的人,可能工作頭銜以前不存在(如“數據科學家”或“首席數據官”)。他們通過各種努力,包括在一個中央儲存庫或“數據湖”傾倒所有的數據,有時希望魔術隨之而來(通常沒有)。他們逐步建立內部競爭力,與不同廠商嘗試,部署到線上,討論在企業范圍內實施推廣。在許多情況下,他們不知道下一個重要的拐點在哪里,經過幾年建設大數據基礎架構,從他們公司業務用戶的角度來看,也沒有那么多東西去顯示它。但很多吃力不討好的工作已經完成,而部署在核心架構之上的應用程序又要開始做了。

下一組的大公司(稱他們為“早期大眾”在傳統的技術采用周期)一直呆在場邊,還在迷惑的望著這整個大數據這玩意。直到最近,他們希望大供應商(例如IBM)提供一個一站式的解決方案,但它們知道不會很快出現。他們看大數據全局圖很恐怖,就真的想知道是否要跟那些經常發音相同,也就湊齊解決方案的創業公司一起做。他們試圖弄清楚他們是否應該按順序并逐步工作,首先構建基礎設施,然后再分析應用層,或在同一時間做所有的,還是等到更容易做的東西出現。

生態系統正在走向成熟

同時,創業公司/供應商方面,大數據公司整體第一波(那些成立于2009年至2013)現在已經融資多輪,擴大他們的規模,積累了早期部署的成功與失敗教訓,也提供更成熟,久經考驗的產品。現在有少數是上市公司(包括HortonWorks和New Relic 它們的IPO在2014年12月),而其他(Cloudera,MongoDB的,等等)都融了數億美元。

VC投資仍然充滿活力,2016年前幾個星期看到一些巨額融資的晚期大數據初創公司:DataDog(9400萬),BloomReach(5600萬),Qubole(3000萬), PlaceIQ( 2500萬)這些大數據初創公司在2015年收到的$ 66.4億創業投資,占高科技投資總額的11%。

并購活動仍然不高(35次)。

隨創業活動和資金的持續涌入,有些不錯的資本退出,日益活躍的高科技巨頭(亞馬遜,谷歌和IBM),公司數量不斷增加

很顯然這里密密麻麻很多公司,從基本走勢方面,動態的(創新,推出新的產品和公司)已逐漸從左向右移動,從基礎設施層(開發人員/工程師)到分析層(數據科學家和分析師的世界)到應用層(商業用戶和消費者),其中“大數據的本地應用程序”已經迅速崛起- 這是我們預計的格局。

大數據基礎架構:創新仍然有很多

正是因為谷歌十年前的MapReduce和BigTable的論文,Doug Cutting, Mike Cafarella開發 創建Hadoop的,所以大數據的基礎架構層成熟了,也解決了一些關鍵問題。

而基礎設施領域的不斷創新蓬勃發展還是通過大量的開源活動。

Spark帶著Hadoop飛

2015年毫無疑問是Apache Spark最火的一年,這是一個開源框架,利用內存中做處理。這開始得到了不少爭論,從我們發布了前一版本以來,Spark被各個對手采納,從IBM到Cloudera都給它相當的支持。 Spark的意義在于它有效地解決了一些使用Hadoop很慢的關鍵問題:它的速度要快得多(基準測試表明:Spark比Hadoop的MapReduce的快10到100倍),更容易編寫,并非常適用于機器學習

其他令人興奮的框架的不斷涌現,并獲得新的動力,如Flink,Ignite,Samza,Kudu等。一些思想領袖認為Mesos的出現(一個框架以“對你的數據中心編程就像是單一的資源池”),不需要完全的Hadoop。即使是在數據庫的世界,這似乎已經看到了更多的新興的玩家讓市場持續,大量令人興奮的事情正在發生,從圖形數據庫的成熟(Neo4j),此次推出的專業數據庫(時間序列數據庫InfluxDB),CockroachDB,(受到谷歌Spanner啟發出現,號稱提供二者最好的SQL和NoSQL),數據倉庫演變(Snowflake)。

大數據分析:現在的AI

在過去幾個月的大趨勢上,大數據分析已經越來越注重人工智能(各種形式和接口),去幫助分析海量數據,得出預測的見解。

最近AI的復活就好比大數據生的一個孩子。深度學習(獲取了最多的人工智能關注的領域)背后的算法大部分在幾十年前,但直到他們可以應用于代價便宜而速度夠快的大量數據來充分發揮其潛力(Yann LeCun, Facebook深度學習研究員主管)。 AI和大數據之間的關系是如此密切,一些業內專家現在認為,AI已經遺憾地“愛上了大數據”(Geometric Intelligence)。

反過來,AI現在正在幫助大數據實現承諾。AI /機器學習的分析重點變成大數據進化邏輯的下一步:現在我有這些數據,我該怎么從中提取哪些洞察?當然,這其中的數據科學家們 - 從一開始他們的作用就是實現機器學習和做出有意義的數據模型。但漸漸地機器智能正在通過獲得數據去協助數據科學家。新興產品可以提取數學公式(Context Relevant)或自動構建和建議數據的科學模式,有可能產生最好的結果(DataRobot)。新的AI公司提供自動完成復雜的實體的標識(MetaMind,Clarifai,Dextro),或者提供強大預測分析(HyperScience)。

由于無監督學習的產品傳播和提升,我們有趣的想知道AI與數據科學家的關系如何演變 - 朋友還是敵人? AI是肯定不會在短期內很快取代數據科學家,而是希望看到數據科學家通常執行的簡單任務日益自動化,最后生產率大幅提高。

通過一切手段,AI /機器學習不是大數據分析的唯一趨勢。令人興奮的趨勢是大數據BI平臺的成熟及其日益增強的實時能力(SiSense,Arcadia)。

大數據應用:一個真正的加速度

由于一些核心基礎架構難題都已解決,大數據的應用層迅速建立。

在企業內部,各種工具已經出現,以幫助企業用戶操作核心功能。例如,大數據通過大量的內部和外部的數據,實時更新數據,可以幫助銷售和市場營銷弄清楚哪些客戶最有可能購買。客戶服務應用可以幫助個性化服務; HR應用程序可幫助找出如何吸引和留住最優秀的員工;等

專業大數據應用已經在幾乎任何垂直領域都很出色,從醫療保健(特別是在基因組學和藥物研究),到財經到時尚到司法(Mark43)。

兩個趨勢值得關注。

首先,很多這些應用都是“大數據同鄉”,因為他們本身就是建立在最新的大數據技術,并代表客戶能夠充分利用大數據的有效方式,無需部署底層的大數據技術,因為這些已“在一個盒子“,至少是對于那些特定功能 - 例如,ActionIQ是建立在Spark上,因此它的客戶可以充分利用他們的營銷部門Spark的權力,而無需實際部署Spark自己 - 在這種情況下,沒有“流水線”。

第二,人工智能同樣在應用程序級別有強大吸引力。例如,在貓捉老鼠的游戲,安全上,AI被廣泛利用,它可以識別黑客和打擊網絡攻擊。 “人工智能”對沖基金也開始出現。全部由AI驅動數字助理行業已經去年出現,從自動安排會議(x.ai)任務,到購物為您帶來一切。這些解決方案依賴人工智能的程度差別很大,從接近100%的自動化,到個人的能力被AI增強 - 但是,趨勢是明確的。

在許多方面,我們仍處于大數據的早期。盡管它發展了幾年,建設存儲和數據的過程只是第一階段的基礎設施。 AI /機器學習出現在大數據的應用層的趨勢。大數據和AI的結合將推動幾乎每一個行業的創新,這令人難以置信。從這個角度來看,大數據機會甚至可能比人們認為的還大。

審核編輯黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 大數據
    +關注

    關注

    64

    文章

    8889

    瀏覽量

    137446
收藏 人收藏

    評論

    相關推薦

    緩存對大數據處理的影響分析

    緩存對大數據處理的影響顯著且重要,主要體現在以下幾個方面: 一、提高數據訪問速度 在大數據環境中,數據存儲通常采用分布式存儲系統,數據量龐大
    的頭像 發表于 12-18 09:45 ?135次閱讀

    bds 行業發展趨勢分析 bds在大數據中的應用

    BDS(大數據分析技術)作為一種通過收集、處理和分析大量數據以提取有價值信息和洞察力的技術,在當前數字化時代發揮著至關重要的作用。 一、BDS行業發展趨勢分析 技術創新與融合 : 隨著
    的頭像 發表于 11-22 15:47 ?385次閱讀

    raid 在大數據分析中的應用

    RAID(Redundant Array of Independent Disks,獨立磁盤冗余陣列)在大數據分析中的應用主要體現在提高存儲系統的性能、可靠性和容量上。以下是RAID在大數據分析
    的頭像 發表于 11-12 09:44 ?251次閱讀

    emc技術在大數據分析中的角色

    在當今這個數據驅動的世界中,大數據分析已經成為企業獲取洞察力、優化業務流程和提高競爭力的關鍵工具。隨著數據量的爆炸性增長,企業面臨著如何有效存儲、處理和分析這些
    的頭像 發表于 11-01 15:22 ?284次閱讀

    智慧城市與大數據的關系

    的建設需要對海量的數據資源進行收集、整合、存儲與分析大數據技術的應用,如智能感知、分布式存儲等,使得這些數據能夠被高效地處理和利用。 決策支持 : 在智慧城市的建設和運行過程中,
    的頭像 發表于 10-24 15:27 ?667次閱讀

    云計算在大數據分析中的應用

    云計算在大數據分析中的應用廣泛且深入,它為用戶提供了存儲、計算、分析和預測的強大能力。以下是對云計算在大數據分析中應用的介紹: 一、存儲和處理海量數據 云計算提供了強大的存儲和計算能力
    的頭像 發表于 10-24 09:18 ?457次閱讀

    IP 地址大數據分析如何進行網絡優化?

    一、大數據分析在網絡優化中的作用 1.流量分析 大數據分析可以對網絡中的流量進行實時監測和分析,了解網絡的使用情況和流量趨勢。通過對流量數據
    的頭像 發表于 10-09 15:32 ?235次閱讀
    IP 地址<b class='flag-5'>大數據分析</b>如何進行網絡優化?

    基于Kepware的Hadoop大數據應用構建-提升數據價值利用效能

    處理超大數據集。 Hadoop的生態系統非常豐富,包括許多相關工具和技術,如Hive、Pig、HBase等,這些工具可以方便地構建復雜的大數據應用。Hadoop廣泛應用于各種場景,包括數據處理和
    的頭像 發表于 10-08 15:12 ?161次閱讀
    基于Kepware的Hadoop<b class='flag-5'>大數據</b>應用構建-提升<b class='flag-5'>數據</b>價值利用效能

    基于大數據深度學習的穿戴式運動心率算法

    性能的關鍵手段。然而,在復雜多變的運動環境中,準確測量心率數據對于傳統算法而言具有較大的技術瓶頂。本文將探討如何運用大數據深度學習技術來開發創新的穿戴式運動心率算
    的頭像 發表于 09-10 08:03 ?268次閱讀
    基于<b class='flag-5'>大數據</b>與<b class='flag-5'>深度</b>學習的穿戴式運動心率算法

    深度分析智慧樓宇管理平臺

    智慧樓宇管理平臺是一項專業性強、邏輯性強的解決方案,融合了物聯網、大數據和人工智能等前沿技術,為建筑物運營提供全面的管理和優化。以下是對智慧樓宇管理平臺的深度分析: 1.設備互聯與遠程監控: 通過
    的頭像 發表于 07-08 14:52 ?265次閱讀

    大數據分析平臺網站

    大數據分析平臺是一種用于處理和分析大規模數據集的系統,旨在從海量數據中提取有價值的信息和洞察。以下是大數據分析平臺的主要功能和應用場景: 主
    的頭像 發表于 06-28 15:46 ?668次閱讀

    大數據在軍事方面的應用有哪些

    大數據技術為戰爭決策提供了全新的思路和工具。軍事機關指揮系統通過搜集和分析大量的戰場數據,可以建立復雜的決策模型,快速分析敵我態勢,評估作戰可行性,并推薦最優的戰術方案。 利用
    的頭像 發表于 06-23 10:34 ?1029次閱讀

    廣告投放公司運用大數據分析,實現精準投放

    廣告投放公司運用大數據分析,實現精準投放 隨著大數據技術的不斷發展,廣告投放行業正經歷著一場深刻的變革。傳統的廣告投放方式已經難以滿足市場需求,而大數據分析則為廣告投放帶來了精準、高效的解決方案
    的頭像 發表于 04-11 11:23 ?960次閱讀

    數據挖掘的應用領域,并舉例說明

    數據挖掘(Data Mining)是一種從大量數據中提取出有意義的信息和模式的技術。它結合了數據庫、統計學、機器學習和人工智能等領域的理論和方法,通過高效的算法和工具,對
    的頭像 發表于 02-03 14:19 ?3114次閱讀

    大數據技術是干嘛的 大數據核心技術有哪些

    的核心技術,包括數據采集、存儲與管理、處理與分析等方面。 一、大數據技術背景和概念 1.1 背景 隨著互聯網技術的迅猛發展,人們可以通過各種途徑產生、獲取和傳輸數據,使
    的頭像 發表于 01-31 11:07 ?3474次閱讀
    主站蜘蛛池模板: 天天操天天操天天操天天操| 国产特黄一级一片免费| 国产午夜精品理论片久久影视| 性做久久久久久久| 日韩三级在线免费观看| 999av视频| 欧美人与zoxxxx另类9| 亚州一级| 高清人人天天夜夜曰狠狠狠狠| 国产精品露脸脏话对白| 办公室桌震娇喘视频大全在线| 在线观看h网站| 亚洲国产精品第一区二区| 极品美女洗澡后露粉嫩木耳视频| 青草久操| 曰韩毛片| 国产成人三级| 视频在线高清完整免费观看| 天堂bt资源新版在线| 在线播放91灌醉迷j高跟美女| 黄视频网站在线| 日本三级视频在线| 天天做天天爱天天爽天天综合| 日本一区免费在线观看| 欧美日韩国产乱了伦| 免费一级特黄特色大片| 亚洲综合一| 1000部啪啪未满十八勿入中国| 在线观看免费av网站| 女人的天堂网站| 国内精品久久久久影院免费| 性孕妇洗澡video国产| 真实的国产乱xxxx在线| 亚洲欧洲第一页| 久久久精品免费国产四虎| 国产理论视频| 日韩一级在线观看| 欧美性猛片xxxxⅹ免费| 天堂在线中文字幕| 天天插夜夜| 性欧美护士18xxxxhd视频|