在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

數據科學家和數據工程師能合二為一嗎?

倩倩 ? 來源:IT168 ? 2020-07-25 10:17 ? 次閱讀

越來越多的企業關注AI,企業組織也意識到擁有相關人才和技能非常重要。特別是最近對AI、機器學習(ML)、非ML預測分析和“大數據”的應用,使得數據科學家的需求有了顯著的增長,未來還將繼續。事實上,對數據科學家的巨大需求導致許多企業和組織出現了人才短缺,然而,80%的AI項目與數據準備和數據工程有關,也許企業組織應該尋找更多的數據工程師而不是數據科學家?

許多企業、供應商和初創企業常常混淆數據科學家和數據工程師,雖然二者有相似之處,但是其工作內容有很大不同,其中包含兩個迥異的技能,魚與熊掌不易兼得。

數據科學家vs數據工程師

在2000年代中期,數據科學家職位開始出現,O’Reilly在文章中提到:“對數據科學家需求的增長是由大型互聯網公司驅動的。谷歌、Facebook、LinkedIn和亞馬遜都以創造性地使用數據而聞名:不僅僅是儲存數據,還將其轉化為價值。毫無疑問,任何希望從數據中獲得價值的企業組織都在關注數據科學和數據科學家。

數據科學家起源于統計建模和數據分析的發展,具有高級數學和統計、高級分析以及越來越多的機器學習/人工智能的背景。毫無疑問,數據科學家的重點是數據科學,也就是說,如何從海量數據中提取有用的信息,以及如何將業務和科學信息需求轉化為信息和數學語言。為了能從海量信息中獲得見解,數據科學家需要掌握統計學、概率、數學和算法知識。這些數據科學家通常只是為了運行程序、對數據進行高級分析這類特定需要而學習編程,因此,數據科學家通常只寫最少最簡易的代碼,能完成數據科學任務以及提供干凈的數據進行分析即可。數據科學家創建假設,對數據進行測試和分析,然后將其結果以便于查看和理解的形式呈現給組織中的其他人。

但是如果沒有大量的干凈數據,數據科學家就無法完成自身工作。提取、清理和移動數據實際上并不是數據科學家的職責,而是數據工程師的職責。數據工程師擁有編程、技術方面的專業知識,以前曾參與過數據集成、中間件、分析、業務數據門戶和ETL操作。數據工程師的重心和技能集中在大數據和分布式系統上,可以使用JavaPython、Scala等編程語言腳本工具,擁有技術經驗。數據工程師面臨的挑戰是如何從各種各樣的系統中獲取結構化和非結構化的數據,解決不“干凈”的數據例如字段缺失、數據類型不匹配等與數據相關的問題。數據工程師要使用編程、集成、體系結構和系統技能來清理所有數據,并將其放入一種格式和系統中,然后數據科學家就可以使用該格式和系統來分析、建立數據模型并為組織提供價值。數據工程師的角色就是設計、構建和安排數據的工程師。

數據科學家和數據工程師能合二為一嗎?

雖然數據科學家和數據工程師的角色似乎截然不同,但數據科學家和數據工程師有許多共同的特點和共技能。這些重疊的技能包括處理和操作大數據集、應用數據的編程技能、數據分析技能以及對系統操作的總體熟練程度。

盡管有很多共性重疊的部分,但是數據科學家和數據工程師的工作重點仍有差異,因此不太可能兩個角色合二為一。更重要的是,在招聘數據科學家和數據工程師時,要確保問對了問題,從候選人身上找到正確的技能。

更重要的是,隨著數據科學興起的代碼學院、研討會和培訓班引出了新問題:這些培訓和代碼學院的重點是數據科學背后的科學,還是數據工程背后的工程、編程,更糟的是,這些活動是否只是泛泛研究了一點囫圇吞棗地教學而混淆了細分的需求,比如應該關注大數據和ML分析的哪些領域?

雖然看起來您可以在科學角色中做一點工程工作,或者在工程角色中做一點科學工作,但是混合角色可能會不利于企業組織在ML或數據科學的成功。那些被迫從事數據工程工作而沒有相關背景、技能或資質的數據科學家很容易錯誤配置、誤用技術,或者編寫效率低、成本高、浪費時間的程序。同樣地,要求從根本上具有工程背景的人學習復雜的數據科學數學,可能會導致組織對其信息得出錯誤的結論,產生災難性結果。專業化是很重要的,好比醫生要做檢查,抽血師負責抽血。醫生可以為你抽血,抽血師可以了解化驗結果,但你為什么要拿自己的舒適和健康去冒險呢?

數據科學家在企業組織中處于什么位置?

為了從數據中獲得價值,大多數企業組織都需要數據科學和數據工程,由于相關技能有很大差異,二者合體也不太現實。企業組織可能需要多個數據科學家和數據工程師,但兩者之間的比例很少是1:1。對于大多數企業組織來說,擁有更多的數據工程師比數據科學家更有意義。因為數據科學家已經學會處理大量的干凈數據,但是從許多不同系統獲得大量的干凈數據更難也更具挑戰。與抽象數據模型和對數據集運行分析相比,移動和清理數據的工作量更大。

此外,數據科學家在企業組織應該向誰報告可能是錯的,有的數據科學家向技術團隊報告,這是沒有意義的。數據科學家通常不會詢問特定技術的實施和數據分析,其所面臨的挑戰特定的業務線。因此,數據科學家應該向業務戰略決策相關人員報告。

有以業務為中心的工具嗎?

如果數據科學和數據工程確實是組織中獨立的角色,那么將它們所需的工具應該是分開的。許多進入數據科學/機器學習領域的供應商正在混淆視聽,使事情變得更加混亂。他們聲稱工具是為數據科學家準備的,但是其一切主要功能和特性都是為數據工程師準備的,在上面點綴一些數據科學的特性是沒有意義的。對于數據科學家來說,需要一個分析的、面向數據的、以模型為中心的工具,而不是在數據清理、移動數據和將數據從私有環境遷移到云環境等方面的工具。這就像給一個駕駛教練一輛車的零件,然后說:“自己造這輛車,然后教別人如何駕駛它。”

數據科學家需要的是以數據科學為中心的工具,而不是以工程和編程為中心的工具。現在,這些工具越來越多,讓數據科學家可以進行數據挖掘或預測分析。然而,隨著數據科學家越來越深入業務領域,以業務為中心的工具是更合適的,例如,幾十年前,如果您希望以類似電子表格的格式操作大量數據,這就涉及到編程,但是像Excel這樣的工具引入了數據透視表這樣的東西,現在業務經理能夠執行各種分析。Excel等工具將數據科學功能或以業務為中心的數據挖掘和分析工具嵌入到產品中只是時間問題。

隨著數據科學家的人才缺口繼續擴大,新的工具將會出現,這些工具是為了允許非技術人員(即業務人員)運行、測試和分析數據而創建的,戰略業務經理將開始學習數據科學,數據科學家仍然需要運行非常復雜的數據分析工具。然而,隨著越來越多易用工具的出現,大多數情況下基本分析將更多地轉移到業務方。企業中ML和數據科學相關工具和技術也越來越大有可為。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 工程師
    +關注

    關注

    59

    文章

    1571

    瀏覽量

    68536
  • 數據科學
    +關注

    關注

    0

    文章

    165

    瀏覽量

    10064
收藏 人收藏

    評論

    相關推薦

    西湖大學:科學家+AI,科研新范式的樣本

    研究,創新科研新范式。這點在西湖大學的科研項目中已得到體現。 成立于2018年的西湖大學是由施公院士領銜創辦的、聚焦前沿科學研究的研究型大學,該校鼓勵科學家們探索AI與各學科交叉融
    的頭像 發表于 12-12 15:59 ?170次閱讀
    西湖大學:<b class='flag-5'>科學家</b>+AI,科研新范式的樣本

    硬件工程師入門的基礎元器件知識

    概述了IGBT在電力轉換中的重要角色及其發展。 硬件工程師入門基礎知識 ()基礎元器件認識() tips:學習資料和數據來自《硬件工程師
    的頭像 發表于 12-10 10:19 ?643次閱讀
    硬件<b class='flag-5'>工程師</b>入門的基礎元器件知識

    使用MATLAB培養醫療人工智能領導者和增強工程課程

    全球各地的高校都在使用 MATLAB 和 Simulink 開展教學與科研,幫助未來的工程師科學家掌握未來世界工程項目與科學研究所要求的重要能力。讓我們
    的頭像 發表于 10-31 16:37 ?288次閱讀

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    了傳統學科界限,使得科學家們能夠從更加全面和深入的角度理解生命的奧秘。同時,AI技術的引入也催生了種全新的科學研究范式,即數據驅動的研究范式,這種范式強調從大量
    發表于 10-14 09:21

    《AI for Science:人工智能驅動科學創新》第章AI for Science的技術支撐學習心得

    和數量直接影響到模型的準確性和可靠性。因此,數據獲取、處理、分析和質量控制在AI for Science中至關重要。此外,數據驅動的研究范式也促使科學家從傳統的假設驅動轉向更加靈活和開
    發表于 10-14 09:16

    《AI for Science:人工智能驅動科學創新》第章人工智能驅動的科學創新學習心得

    如何激發科學家的創新思維。AI不僅僅是工具,更是種思維方式,它鼓勵我們跳出傳統框架,以數據驅動,探索未知。這種思維方式的轉變,不僅促進了科學
    發表于 10-14 09:12

    小米手機部工程師榮獲國家技術發明獎等獎

    日前,全國科技大會、國家科學技術獎勵大會、兩院院士大會在北京召開。大批貢獻卓越的科學家和標志性成果獲得了國家科技獎勵。其中,我們也有位小米人帶著作品參與到了其中,并獲得了國家級獎項
    的頭像 發表于 08-16 10:39 ?745次閱讀

    創,1:1復刻工程師的職場現狀

    工程師
    揚興科技
    發布于 :2024年07月19日 18:30:07

    新華社:突破性成果!祝賀我國科學家成功研發這傳感器!

    6月25日,新華社以《突破性成果!祝賀我國科學家標題,報道了由我國科學家研發的傳感器成果。 我國科學家研發高通道神經探針實現獼猴全腦尺度神經活動監測 神經探針是
    的頭像 發表于 06-27 18:03 ?506次閱讀
    新華社:突破性成果!祝賀我國<b class='flag-5'>科學家</b>成功研發這<b class='flag-5'>一</b>傳感器!

    前OpenAI首席科學家創辦新的AI公司

    消息在業界引起了廣泛關注,因為蘇茨克維曾是OpenAI的聯合創始人及首席科學家,并在去年在OpenAI董事會上扮演了重要角色。
    的頭像 發表于 06-21 10:42 ?527次閱讀

    嵌入式軟件工程師和硬件工程師的區別?

    嵌入式軟件工程師和硬件工程師的區別? 嵌入式軟件工程師 嵌入式軟件工程師是軟件開發領域中的種專業工程師
    發表于 05-16 11:00

    谷歌DeepMind科學家欲建AI初創公司

    據知情人士透露,谷歌人工智能部門DeepMind的兩名杰出科學家Laurent Sifre和Karl Tuyls正在與投資者商討在巴黎成立家新的人工智能初創公司的事宜。
    的頭像 發表于 01-22 14:41 ?502次閱讀

    飛騰首席科學家竇強榮獲 “國家卓越工程師” 稱號

    ? ? ?飛騰首席科學家竇強榮獲 “國家卓越工程師” 稱號 1月19日上午,首屆 “國家工程師獎” 表彰大會在北京人民大會堂隆重舉行。81 名個人被授予 “國家卓越工程師” 稱號,50
    的頭像 發表于 01-19 19:22 ?1757次閱讀
    飛騰首席<b class='flag-5'>科學家</b>竇強榮獲 “國家卓越<b class='flag-5'>工程師</b>” 稱號
    主站蜘蛛池模板: 2345成人高清毛片| 免费播放欧美毛片欧美aaaaa| 天天看天天爽天天摸天天添| 在线天堂bt种子| jlzzjlzz欧美大全| 国产女同在线观看| 在线黄色网| 九色视频在线看| 成人黄色一级片| 中文字幕一二三四区| 中国同志chinese小彬tv| 日一日操一操| 又黄又爽又猛午夜性色播在线播放 | 久久精品亚瑟全部免费观看| 色综合久久久久久久久五月| 高h污快穿文汁水四溅| 欧美com| 日本不卡高清视频| 亚洲小视频在线播放| 99久久精品费精品国产一区二区| 一级一级毛片免费播放| 嘿嘿嘿视频在线观看| 欧美性xxxxxbbbbbb精品| 淫性视频| 欧美一级片网址| 日本黄视频在线观看| 久久精品人| 一级大片免费看| 女bbbbxxxx毛片视频| 免费一级片在线观看| 手机在线看片国产日韩生活片| 亚洲成人午夜影院| 久久天天躁狠狠躁夜夜| 欧美777| 国产在线观看黄| 一区二区三区国模大胆| 日本aaaa视频| 成人mv高清在线| 夜夜嗷| 国产狂喷冒白浆免费视频| 唐人社电亚洲一区二区三区|