兩年前在艾瑞期間寫成并發(fā)表于知乎“拉勾”話題精華的文章,當時拉勾是我認識數(shù)據(jù)分析世界的一個窗口,腦中一直縈繞兩個問題:
企業(yè)愿意為數(shù)據(jù)分析人付多少錢?
數(shù)據(jù)分析人要學到什么才會拿到這個錢?
為了解決問題而上拉勾來看JD(Job Description)熟悉工作職能和技能要求,經(jīng)常是看幾小時后而腦袋暈脹(因為不懂的實在太多了)。突然某天我問自己”為什么不把lagou的信息爬下來并做個統(tǒng)計?一個做數(shù)據(jù)分析的人竟然這樣原始地(手動)統(tǒng)計數(shù)據(jù)?”一周內搞定從爬取、解析分詞、分析出圖,從自己關心的細分維度回答問題:
就自身發(fā)展上看:
數(shù)據(jù)分析師一般幾年會遇到瓶頸?(看工資在哪些年限上會有明顯階躍)
在不同的階段應該學哪些工具?
從公司平臺上看:
融資到什么階段的公司會愿意付相對高的價格來聘請數(shù)據(jù)分析師?
公司規(guī)模/人數(shù)會不會產生影響?
北上廣深的數(shù)據(jù)分析師相同資質下會不會有收入差異?
文章是以201510數(shù)據(jù)為基礎搭建,數(shù)據(jù)會過時,思考問題的方法不會。
如何學習思考問題方法:聰明人是“別人生病,自己吃藥” (不需要跟我一樣去經(jīng)歷這個階段,而獲得這份經(jīng)驗)。把自己代入到場景,你會如何做?把做法整理并復盤得失;現(xiàn)實遇到困難,把自己想象成master去解決。就像我在看《窮查理寶典》的時候會代入書中的場景,假如我是查理芒格,我做的演講是出于什么心情、背后代表什么心態(tài)?(盡可能理解透徹)在現(xiàn)實投資過程中,我遇到問題時會想象成查理芒格來做思考。
這篇文章對我的反思:為了消除對未知的恐懼,通過拉勾平臺以公司付費的角度來評價數(shù)據(jù)分析師的價值,e.g. 當知道1-3年互聯(lián)網(wǎng)金融公司の會python數(shù)據(jù)分析師每月2W的薪資,我就像從亂麻中牽扯出線頭那樣開心。整個過程中最重要的是求知若渴的心,而智慧與否只是會加速或減緩這個學習的過程。
為什么我一直在談錢,因為公司拿出真金白銀來雇用你,大概率情況下,說明公司愿意付費來購買你的價值,間接證明你的價值所在。
附上爬蟲python源碼(https://github.com/lichald),感興趣的童鞋可以自己嘗試。
/ 01 /
數(shù)據(jù)分析在哪個城市需求更加旺盛?
北京領先全國:從總值上看,北京在數(shù)據(jù)挖掘崗位open的職位數(shù)量和公司數(shù)量上占據(jù)絕對優(yōu)勢,甚至超過后面4個城市的數(shù)值加和;僅就北京和上海相比,公司數(shù)量是3倍,職位數(shù)量是4倍。從公司平均招聘人數(shù)上看,北京也領先于其他城市。即使排除拉勾網(wǎng)base在北京中關村地利優(yōu)勢和3W咖啡的線下優(yōu)勢,北京的數(shù)值依然是遙遙領先。
/ 02 /
公司如何定價員工的工作資歷?
主流1-5年在21-25K:工作經(jīng)歷在1-5年的現(xiàn)在需求最旺盛,且大多數(shù)公司均會給到11-25K的價位。且對于11-15K、16-20K、21-25K三個細分檔次的價位,用人單位對于1-3年工作經(jīng)驗的人11-15K是主流價碼,優(yōu)秀的人可以提升至16-20K,更優(yōu)秀的再提升至21-25K;用人單位對于3-5年工作經(jīng)驗的人21-25K是主流價碼,有經(jīng)驗但能力欠缺的降至16-20K,再弱一些的就降至11-15K。
“經(jīng)驗不限”注重能力導向:有相當一部分企業(yè)對于“經(jīng)驗不限”的情況大多數(shù)也愿意給出11-15K和21-25K的價位,說明在互聯(lián)網(wǎng)領域仍有企業(yè)是看重能力而不是資歷,對于經(jīng)驗有相當?shù)淖杂啥取?/p>
亂世出英雄:另外對于5-10年的人員數(shù)量非常低,排除專業(yè)獵頭分的蛋糕之外,也可能說明這個行業(yè)的專家非常少,或者是企業(yè)的數(shù)據(jù)挖掘需求還遠沒有達到需要專家的級別。這兩點結合來看,專家權威效應不明顯,企業(yè)看重能力而非資歷,對于這個行業(yè)的新人是利好的消息。
新人打好基本功:企業(yè)對于1年以下經(jīng)驗的人招聘數(shù)量和薪資認可方面都是非常低的,說明新人前1-2年先不著急跳槽,好好打好基本功,迎接之后的量質轉換!
/ 03 /
高薪資都存在哪些高大上的行業(yè)?
數(shù)據(jù)聲明:在拉勾網(wǎng)上發(fā)布職位的公司一般都會貼上兩個以上的標簽,本文將對這些標簽重復計算。例如宜信公司標簽是<移動互聯(lián)網(wǎng)·金融>,則在這兩個領域分別會計數(shù)。圖中移動互聯(lián)網(wǎng)的絕對值非常高,說明移動互聯(lián)網(wǎng)是一種主流的趨勢。
移動互聯(lián)網(wǎng)11-25K主流:移動互聯(lián)網(wǎng)的主流薪資認可是11-25K范圍,且能夠容納的人員數(shù)量非常多,說明該行業(yè)不差錢。數(shù)據(jù)服務是這行里面的默默無聞的耕耘者,有很多新興企業(yè),提供數(shù)據(jù)服務,也是通過高新來吸引人才。電商、O2O、文化(主要是視頻)、廣告、金融幾個行業(yè)對數(shù)據(jù)挖掘人才需求的數(shù)量和質量相差無幾。如果希望從事一份體面的數(shù)據(jù)挖掘工作,可以考慮從這些行業(yè)中來找。
/ 04 /
何種融資階段公司會需要數(shù)據(jù)分析?
AB輪找11-15K,20K到處缺:融到錢的公司(途徑包括各種輪和上市)對于數(shù)據(jù)挖掘的需求明顯高于其他,早在天使輪就有體現(xiàn)。就成功融資的這些企業(yè)來講,11-15K的人在AB輪時達到頂峰,說明這階段應該是數(shù)據(jù)挖掘部門急劇膨脹的階段,需要比較多的初級數(shù)據(jù)挖掘人員;21-25K的人員在ABCD和上市之后的需求保持持平,說明對于有能力的資深人士,需求是一直存在的,而且可能滿足要求的人員較少,公司之間的流動性比較高,招聘需求一直穩(wěn)定存在。
融資程度與工資正相關:平均收入是根據(jù)人數(shù)加權得出,從中可以看出,“成功融資”、“未融資”、“不需要融資”呈依次遞減的水平,在融資領域內,平均收入水平依據(jù)成熟度而顯示逐步上升。
期權還是現(xiàn)金:如果你是希望通過跳槽來獲取更高的收入11-20K,不考慮期權的因素下,成熟度高的已成功融資、如CD輪或者上市的公司是最理想的選擇,這些公司總體平均收入比較高,未來有進一步上升的潛力;如果覺得競爭太激烈,可以退而求其次,將目標放在AB輪,這些公司對此檔人員的需求最高,但平均收入不一定高。(但事情一體兩面,如果你選擇時機得當,AB輪獲得股權期權,將來成功套現(xiàn),也將是一筆不小的收入)
/ 05 /
何種規(guī)模企業(yè)需要數(shù)據(jù)分析?
500人規(guī)模對應15K分析師:對于11-15K的等級,在企業(yè)發(fā)展階段呈現(xiàn)先上升后下降的趨勢,其中150-500人是需求的頂峰;對于16-25K的人員,企業(yè)發(fā)展階段是持續(xù)上升的需求,其中在50-500人階段呈現(xiàn)出一個小高峰。可以理解企業(yè)在發(fā)展到150-500人之前,15K以下的數(shù)據(jù)挖掘即可滿足需要,但在之后數(shù)據(jù)量的膨脹導致數(shù)據(jù)的價值陡增,對于21K以上的中高級人才產生巨大的渴求。
大公司易發(fā)揮分析價值:從人員加權平均收入來看,隨著規(guī)模的增長是在不斷上升的,企業(yè)的發(fā)展越大,數(shù)據(jù)挖掘越容易產生價值。如果你熱衷于數(shù)據(jù)分析領域創(chuàng)造價值,大公司將是不錯的歷練平臺;但如果可以接受11-15K水平的初級人員,150-500人的公司將會是一個不錯的跳板。
/ 06 /
數(shù)據(jù)分析工具與收入之間的關系?
從每個網(wǎng)頁中抓取JD說明,根據(jù)python中jieba庫進行文本分詞,并計算出現(xiàn)頻次,并建立自己的分詞標簽字典。
詞頻占比=該詞詞頻/所有詞詞頻。平均每個JD中出現(xiàn)次數(shù)=詞頻/JD數(shù)。
在JD中,非關系型數(shù)據(jù)庫、腳本語言和關系型數(shù)據(jù)庫是三種主要被提及的工具,平均每個job中均會提及一次以上。說明這些是必備技能。具體取了排名前30的原始詞做成云圖如下。
以Hadoop為代表的關系型數(shù)據(jù)庫,以python和java為代表的語言,以SQL為代表的關系型數(shù)據(jù)庫構成工具的主流。
數(shù)據(jù)說明:面積圖為對應詞出現(xiàn)的頻次總數(shù),折線圖為詞頻/job數(shù)量的比例、代表平均每個職位描述中出現(xiàn)某詞的頻次。
25K是工具和軟技能分割點:從折線圖上看,在6-15K、16-25K、26-100K三個階段內,絕大多數(shù)工具需求都呈現(xiàn)正三角形的結構,即“小大小”的情況,可以理解為在25K以前,薪資隨著工具的提升而不斷提升,26K以后需要有其他非軟件工具技能來獲得職業(yè)生涯的突破。
從工作數(shù)量上看,hadoop、python、java的數(shù)值很高,說明獲得絕大多數(shù)公司的認可,所以這三門工具是在數(shù)據(jù)挖掘領域走向人生巔峰的必備良藥。
-
互聯(lián)網(wǎng)
+關注
關注
54文章
11177瀏覽量
103548 -
數(shù)據(jù)分析
+關注
關注
2文章
1455瀏覽量
34090
原文標題:從拉勾網(wǎng)看數(shù)據(jù)分析師怎么變得值錢?
文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區(qū)】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論