0x00 前言
問題
數據分析和數據挖掘的區別是什么?是否只能選一個方向深耕?
話題整理者:橘子,本科學的是金融和商業分析,目前是數據和運籌優化方向研究生,定位有點迷茫,日常在業務和技術的邊緣反復橫跳,希望能和大家共同學習和進步,一起用數據創造更多的價值。
問題描述
數據分析和數據挖掘是數據從業者非常關注的兩個崗位。這兩個崗位到底有哪些區別?常聽人說數據分析偏業務、偏前臺,而數據挖掘偏技術,偏后臺。所以要早點選定一個方向進行深耕才行?
希望大家從這崗位設定的目的、高端人才的核心競爭力、技能樹、職業發展路徑和天花板、未來的趨勢等角度談一談這兩個崗位的區別。
0x01 討論內容
討論1
我覺得偏業務方向的數據分析師最好,數據挖掘做出來的成果期望不會很高的,在職業晉升方面懂業務的優勢更大。
討論2
其實都是大數據的分析工作,我們這邊數據分析偏運營或者數據庫的搭建清洗和業務分析,挖掘偏向于數據倉儲 架構,長期業務分析,不知道和各位老哥的理解有什么不一樣的。
討論3
廣義的數據分析本身就是包涵數據挖掘。
數據分析:注重分析過程,
數據挖掘:關注挖掘結果。
兩者目標不一致,前者是基礎,后者是升華。
討論4
我以前以為數據分析只是業務excel sql boy,但是現在看在北京上海等地從事數分的,他們的工作也需要應用數據挖掘里面的模型,也會涉及特征提取,機器學習的內容;總之感覺從事數挖的偏技術更靠譜,數分這個崗位魚龍混雜 感覺現在培訓班把數分炒火了啥崗位都往數分轉,但是這個崗位后面的深坑誰都說不準。
0x02 居士的解答
首先整體說一下兩個崗位的現狀,在大部分公司里面,數據挖掘和數據分析并沒有特別明顯的差別,甚至很多公司壓根就沒有數據挖掘這個通道。一般大家討論數據挖掘和數據分析的區別的時候,更傾向于將數據挖掘定位為會用很多機器學習算法的崗位,數據分析定位為大部分時候都在寫sql和玩excel,最多了解一些統計學的崗位,因此很多小伙伴在聊這個問題的時候也會認為:數據挖掘的技術含量更高,更有錢途。
然后,在各個廠子里面是怎么劃分數據分析和數據挖掘呢,舉幾個例子給大家做參考:
廠A:數據挖掘和數據分析做同樣的事情,沒什么區別,寫Sql,開發報表,跑數據~
廠B:數據挖掘做推薦、廣告這類偏算法相關的崗位,數據分析做報表、數據周報、數據清洗的工作
廠C:沒有數據挖掘崗位,只有數據分析崗和算法工程師崗,算法工程師偏向于算法的工程實現,比如推薦算法和廣告算法的線上工程化。其他不管用不用得到機器學習算法,都是數據分析。
最后,居士從幾個角度分享一下對這個問題的理解:
從技能要求的角度
數據分析:一般這些技能就夠完成工作:Excel、Sql、Python。
數據挖掘:在數據分析的基礎上,可能會要求Java or C++這類語言來做線上工程化化的工作
從知識要求的角度
數據分析:統計學+少量的機器學習
數據分析:統計學+大量的機器學習
從實際工作的角度
再次說明一點,大部分公司的數據挖掘挖掘崗和數據分析崗可能沒什么區別,下面只是一種劃分方式。簡單來講,如果是理想一些的情況,數據挖掘是不需要做報表之類的工作的,然后會做更多線上工程化的工作。
數據分析:
初級:報表、提數、周報月報
中級:描述現象類數據分析報告
高級:解釋現象類、預測類數據分析報告
再高一些:上限很高
數據挖掘:
初級:數據分析報告 or 線上數據流的開發
中級:線上算法工程化
高級:感覺方向稍微有點廣,有的是深度學習領域做的很深,有的是廣告或者推薦方向做的很深。
0xFF 附一組統計數據對比
上面的內容從道與術上分析了數據分析與數據挖掘的區別,現在我們通過近日北京地區兩個崗位的招聘信息統計做一個驗證。
數據來源:國內知名互聯網招聘網站,分別搜索北京地區“數據分析”、“數據挖掘”所得的招聘信息結果,得到數據分析與數據挖掘招聘信息各400+條。
崗位名稱
1
搜索“數據分析“相關崗位,絕大部分都是叫做“數據分析師”,38.16%直接叫做數據分析師,20%左右的“高級數據分析師”(或“資深數據分析師”、“數據分析專家“),其余還有大數據分析師、BI數據工程師、金融數據分析師等頭銜。
而搜索“數據挖掘”相關崗位,絕大部分是”算法工程師“,21.41%直接叫做算法工程師,其余絕大部分也都是各個領域的算法工程師,數量排名靠前的有:4.47%機器學習算法工程師,3.29%NLP算法工程師,2.82%深度學習算法工程師,以及圖像、推薦、計算機視覺等類別等?!睌祿诰蚬こ處煛邦^銜只占2.12%
公司規模
2
比較兩個崗位所在公司的公司規模,發現兩個崗位當前在中型公司中的需求量無明顯差異,但在小型和大型公司中的需求有較大的差異。
數據分析崗當前在大公司的招聘需求較大,有42.75%的招聘信息來自2000人以上的大型公司;只有約13%等招聘信息來自于50人以下的小公司。
而數據挖掘相關崗位相反,在招的崗位中,來自于2000人以上大型公司的只有26.12%,而來自50人以下小型公司的卻占了33%。
崗位技能要求
3
比較兩個崗位的技能要求,可以發現兩者所需的能力有比較大的區別:
數據分析相關崗位:業務、SQL、統計學、用戶理解、數學、R、溝通、行業、Python、數據處理、增長思維等;
數據挖掘相關崗位:算法、機器學習、推薦、計算機、數學、模型、自然語言、開發、技術、數據挖掘等。
學歷要求
4
85.51%的崗位對于數據分析的學歷要求是本科,而數據挖掘的相關崗位中,55.04%的崗位要求本科,近40%要求碩士學歷。數據挖掘比數據分析的學歷要求更高。
不同工作年限的薪資下限
5
最后我們來比較一下兩個崗位的薪資水平。為減少招聘信息中可能存在的薪資注水的影響,我們采用薪酬預估的下限進行計算,并用中位數表示各個工作年限月薪的平均水平。
可以看出,隨著工作年限的積累,兩個崗位的薪資都穩步提升,但數據挖掘相關崗位的薪酬普遍還是高于數據分析。
這個差距在不同年限也有區別,總體上數挖相關崗比數分薪酬高35%左右,但在應屆畢業生和3-5年工作經驗兩個年限上拉開了56%的差距;在要求5-10年工作經驗資深員工的崗位上,兩崗薪資差距又明顯縮小,體現了高端人才的價值。
10年以上工作年限的由于樣本中缺乏數挖在這個年限下的招聘數據,暫時無法比較,但從數據分析最后一飛沖天的數據來看,數分崗位的上限真的很高。
-
數據挖掘
+關注
關注
1文章
406瀏覽量
24277 -
數據分析
+關注
關注
2文章
1455瀏覽量
34090
原文標題:數據分析和數據挖掘的區別是什么? (附真實招聘數據對比報告)
文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數據技術】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論