在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Kaggle機器學習/數據科學現狀調查

OaXG_jingzhengl ? 來源:未知 ? 作者:胡薇 ? 2018-06-29 09:11 ? 次閱讀

Kaggle是互聯網上最著名的數據科學競賽平臺之一,今年3月8日,這家機構被谷歌收購,6月6日又宣布用戶數量超過了100萬人。最近,這一社區首次進行了機器學習/數據科學現狀調查。在超過16,000名從業者的詳盡答卷中,我們可以一窺目前業內的發展趨勢。有趣的是,Kaggle也將調查結果封裝成了匿名數據集以供大家自行分析。

有史以來第一次,Kaggle對人工智能領域進行了全行業深度調查,試圖全面了解數據科學和機器學習概況。本次調查收到了超過16,000份回復,眾多受調查者的數據向我們提供了有關從業者人群、業界最新動態以及如何進入該行業的洞見。以下報告包括本次調查的所有主要結果,其中包含的主要內容有:

雖然Python很可能是機器學習最常用的編程語言,但統計學家更多地使用R語言。

平均而言,數據科學家的年齡在30歲左右,但是這個數字在不同的國家有所不同。例如,印度的受訪者要比澳大利亞的平均年輕9歲。

有關被調查者教育程度,最普遍的學位是碩士,但是工資最高的($150k+)人群中,擁有博士學位的人稍稍多一點。

Kaggle已經公開了該調查的匿名數據集,以供大家進行探究:https://www.kaggle.com/kaggle/kaggle-survey-2017。

如何定義數據工作者?

觀察數據從業者的方式有很多,但本文將從有關數據科學從業者的工作和背景的人口統計學信息開始。

調查對象的年齡

如圖可見,本次調查對象的平均年齡大約30歲,但這個值在各個國家之間有變動。例如印度的調查對象的平均年齡就比澳大利亞的小了9歲。

你目前的就業狀況如何?

受調查者中,有65.7%表示自己有全職工作。

你的職位是什么?

盡管我們把數據科學家定義為使用代碼分析數據的人,我們發現數據科學領域可涵蓋的工作非常多。比如在伊朗和馬來西亞,數據科學從業者最流行的工作頭銜是「科學家或者研究者」。

你的全職年薪是多少?

中位數$55,441,不過由于很多人沒有全職工作(收入為0),所以這一數字不甚準確。盡管在我們的調查中「補償和福利」的重要性排序稍微比「職業發展機遇」的低一點,不過知道什么是合理的補償依然不錯。在美國,一般機器學習工程師帶回家最多的是培根。

131個回復由于超出最大值而沒有顯示出來,但它們被算進了中位數。

你的最高學歷是什么?

因此,你需要再獲得一個學位嗎?通常來講,數據科學從業者中最普遍的學歷是碩士,但是獲取最高薪水($150K-$200K和$200k+)的那些人多是有著博士學位。

被調查者的平均水平是數據科學家職稱,30歲左右,碩士學歷,年薪$55,000左右。但實際情況并不如此平均。這些最初的幾個人口統計學問題只是展示了復雜的Kaggle數據科學社區在年齡、性別、國籍、工作職稱、薪水、經驗和學歷方面的表層差異。

數據科學家的工作內容是什么?

我們把數據科學家定義為寫代碼以分析數據的一群人。他們的日常工作內容是什么?以下是我們的調查結果。

工作中使用什么數據科學方法?

Logistic回歸是工作之中最為常用的數據科學方法,不過神經網絡使用更為頻繁的國家安全領域除外。總的來說,數據科學中更常見的還是使用經典的機器學習算法,簡單的線性與非線性分類器是數據科學中最常見的算法,而功能強大的集成方法也十分受歡迎。我們看到目前神經網絡模型的使用頻率要高于支持向量機,這可能是近來多層感知機要比使用帶核函數的SVM更加廣泛的表現。

工作中使用最多的語言是什么?

Python是數據科學家最常用的語言,也是最常用的數據分析工具。不過,還有很多數據科學家仍然保持著對R語言的忠誠。

以上僅展示了15個回答,還有38個回答被隱藏。

在工作中常用的數據類型是什么?

關系型數據是開發者在工作中最常用的數據類型,因為大多數產業工程師都十分關注于這種關系型數據。而學術研究者和國防安全產業則更注重于文本與圖像。

如何分享工作中的代碼?

盡管很多受訪者(58.4%)使用Git在工作分享他們的代碼。但大公司中的開發者更傾向于將代碼保留在本地,并通過像Email那樣的文件共享軟件來分享他們的代碼。而初創公司可能需要在云中共享以保持更加敏捷的反應。

工作中遇到的障礙主要是什么?

臟數據(dirtydata)顯然是排在了第一位,也就是說數據科學家一般最常見的困擾就是需要對數據進行大量的預處理工程。除了數據預處理工程以外,還有很多問題困擾著數據科學家,比如說眾多的機器學習算法各有各的擅長領域,所以理解它們的性能也會有一些困難。不過我們注意到向其他人解釋數據科學是什么也會困擾著數據科學家,解決辦法可以是推薦機器之心呀。

上圖僅展示了前面的15個回答,還有7個回答沒有展示。

此外,如果你們點擊選擇條件,那么就能按照條件過濾回答。很多行業的受訪者表示他們缺少數據科學相關的人才,所以數據科學家目前是十分幸運的。

數據科學家新手如何入行?

當開始一個新的職業生涯的時候,看看別人的成功秘訣是很有幫助的。我們調查了在數據科學行業工作的人們,詢問他們是如何做到的。以下是我們最喜歡的幾條建議:

你們會推薦數據科學家新手最先學哪門語言?

每一位數據科學家都有自己的對選擇第一門語言的想法。事實證明,那些僅使用Python或R語言的人們做出了正確的選擇。不過如果你問一下使用過R和Python的人們,他們有兩倍的可能會推薦Python給你。

你們使用哪些數據科學學習資源?

數據科學是一個快速變化的領域,有很多有價值的資源可以幫助你學習并保持業內的頂尖位置,從而不斷提升你的競爭力。已經在數據科學領域中工作的人們會更多使用StackOverflowQ&A,Conferences和Podcasts,以對不斷涌入這個領域的人們保持自己的優勢。如果想要發布內容或開源軟件,請時刻記住剛進入這個領域的人們通常更多使用官方的文檔和觀看Youtube視頻

你們在哪里獲取開源數據?

沒有數據,就沒有數據科學。當需要學習數據科學技巧的時候,知道如何找到干凈的開源數據集用于練習和開發項目相當重要。很高興得知我們的數據集聚合器(datasetaggregators,https://www.kaggle.com/datasets)正發展為數據科學社區成員中最頻繁使用的工具。

你們怎么找工作,怎么找到的?

找工作的時候,可能到公司網站上,或在指定技術方向的招聘信息上,但是根據已經在數據科學領域工作的人們的經驗,這些方式是最差的選擇。而直接聯系招聘者或建立自己的網絡以進入這個領域才是他們的首選。

Note:少于50名受訪者的組別被合并進了「Other」類中。其中一些柱狀圖為了美觀而做了縮放處理,希望查看所有問題和結果的原始數據可訪問:https://www.kaggle.com/amberthomas/kaggle-2017-survey-results。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8422

    瀏覽量

    132736
  • python
    +關注

    關注

    56

    文章

    4797

    瀏覽量

    84773

原文標題:Kaggle首份機器學習大調查:最常用的算法、語言竟然是......

文章出處:【微信號:jingzhenglizixun,微信公眾號:機器人博覽】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    傳統機器學習方法和應用指導

    用于開發生物學數據機器學習方法。盡管深度學習(一般指神經網絡算法)是一個強大的工具,目前也非常流行,但它的應用領域仍然有限。與深度學習相比
    的頭像 發表于 12-30 09:16 ?214次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統自身的性能”。事實上,由于“經驗”在計算機系統中主要以數據的形式存在,因此機器學習需要設法對數據進行分析學習,這就使得它逐漸成為智
    的頭像 發表于 11-16 01:07 ?436次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習
    的頭像 發表于 11-15 09:19 ?496次閱讀

    eda在機器學習中的應用

    值和噪聲數據。通過繪制箱線圖、直方圖和散點圖,我們可以直觀地看到數據中的異常值和分布情況。例如,如果一個數據集中的某個特征值遠高于其他值,這可能是一個異常值,需要進一步調查。 2. 特
    的頭像 發表于 11-13 10:42 ?324次閱讀

    《AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

    人工智能在科學研究中的核心技術,包括機器學習、深度學習、神經網絡等。這些技術構成了AI for Science的基石,使得AI能夠處理和分析復雜的
    發表于 10-14 09:16

    《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術,AI能夠處理和分析海量
    發表于 10-14 09:12

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的分析和預測任務,可以
    發表于 08-14 18:00

    機器學習中的數據分割方法

    機器學習中,數據分割是一項至關重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習
    的頭像 發表于 07-10 16:10 ?1876次閱讀

    機器學習中的數據預處理與特征工程

    機器學習的整個流程中,數據預處理與特征工程是兩個至關重要的步驟。它們直接決定了模型的輸入質量,進而影響模型的訓練效果和泛化能力。本文將從數據預處理和特征工程的基本概念出發,詳細探討這
    的頭像 發表于 07-09 15:57 ?456次閱讀

    機器學習數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從
    的頭像 發表于 07-02 11:22 ?646次閱讀

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據中尋找一種相應的關系。Iris鳶尾花數據集是一個經典數據
    的頭像 發表于 06-27 08:27 ?1675次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典算法與應用

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    設備的運行狀況,生成各種維度的報告。 同時,通過大數據分析和機器學習技術,可以對業務進行預測和預警,從而協助社會和企業進行科學決策、降低成本并創造新的價值。 當今時代,
    發表于 06-25 15:00

    國內機器人實際場景使用抽樣調查數據分析報告

    國內機器人實際場景使用抽樣調查數據分析報告1背景我們通過為時3個月(2024年2月1日-2024年4月30日),針對國內機器人實際使用者發出的1000份報告(收到實際反饋有效報告736
    的頭像 發表于 05-28 08:14 ?572次閱讀
    國內<b class='flag-5'>機器</b>人實際場景使用抽樣<b class='flag-5'>調查</b><b class='flag-5'>數據</b>分析報告

    機器學習怎么進入人工智能

    ,人工智能已成為一個熱門領域,涉及到多個行業和領域,例如語音識別、機器翻譯、圖像識別等。 在編程中進行人工智能的關鍵是使用機器學習算法,這是一類基于樣本數據和模型訓練來進行預測和判斷的
    的頭像 發表于 04-04 08:41 ?340次閱讀

    【Rust AI】01. 使用Jupyter學習Rust

    根據 Bing 的說法:“泰坦尼克號數據集是用于數據科學機器學習的流行數據集。它包含有關泰坦尼
    的頭像 發表于 01-14 11:16 ?1800次閱讀
    【Rust AI】01. 使用Jupyter<b class='flag-5'>學習</b>Rust
    主站蜘蛛池模板: 正在播放久久| 在线色网站| 国产肥女bbwbbw| 天天操夜夜艹| 亚洲国产美女精品久久| 国产精品一一在线观看| 你懂的福利网站| 免看一级a一片成人123 | 久久99精品久久久久久久不卡 | 美女免费毛片| 男人的天堂天堂网| 韩国三级日本三级在线观看| 久久久综合视频| 国产欧美精品一区二区色综合| 国内在线观看精品免费视频| 精品美女在线观看| 狠狠五月婷婷| 永久看片| 久久久精品免费观看| 成人丁香乱小说| 亚洲网站免费| 直接在线观看的三级网址| 五月婷婷丁香| 欧美色图888| 国产亚洲第一伦理第一区 | 国产精品成人免费观看| 一级毛片a| 人人干人人草| 国产一级片免费| 天天做天天爱天天一爽一毛片 | 日本中文在线三级在线播放| 色偷偷狠狠色综合网| 久久精品亚瑟全部免费观看| 成 人 免费 网站| 精品久草| 97色噜噜| 麻豆国产一区二区在线观看| 777人体粉嫩u美图| 日韩操穴| 天堂电影免费在线资源| 国模大胆一区二区三区|