在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)挖掘工程師是干什么的

工程師人生 ? 來源:工程師吳畏 ? 2019-03-13 14:44 ? 次閱讀

數(shù)據(jù)挖掘,從字面上理解,就是在數(shù)據(jù)中找到有用的東西,哪些東西有用就要看具體的業(yè)務(wù)目標(biāo)了。最簡單的就是統(tǒng)計應(yīng)用了,比如電商數(shù)據(jù),如淘寶統(tǒng)計過哪個省購買泳衣最多、哪個省的女生胸罩最大等,進(jìn)一步,可以基于用戶的瀏覽、點(diǎn)擊、收藏、購買等行為推斷用戶的年齡、性別、購買能力、愛好等能表示一個人的畫像,就相當(dāng)于用這些挖掘出來的屬性來刻畫一個人,這些還是最簡單的東西,更深層次的比如預(yù)測(股票預(yù)測),但是比較難。

說到數(shù)據(jù)挖掘。往往與機(jī)器學(xué)習(xí)離不開。比如分類、聚類、關(guān)聯(lián)規(guī)則挖掘、個性化推薦、預(yù)測、神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)等。很多年前說人工智能AI(比如產(chǎn)生式系統(tǒng)、專家系統(tǒng)等,好像現(xiàn)在提得比較少了),90年代AI到了瓶頸階段,機(jī)器學(xué)習(xí)是一個突破口,現(xiàn)在機(jī)器學(xué)習(xí)又遇到了瓶頸階段,深度學(xué)習(xí)又是一個突破口(其實神經(jīng)網(wǎng)絡(luò)出來了很久,但是為什么中間一段時間沉寂了,在70年代左右出現(xiàn)了低潮(根據(jù)評論修改),我歸結(jié)是兩點(diǎn),第一神經(jīng)網(wǎng)絡(luò)就像一個黑夾子一樣,很多東西不透明,模型的解釋性不強(qiáng),以及當(dāng)時沒辦法處理非線性分類問題(后面多層感知器便可以對非線性問題進(jìn)行擬合,如解決XOR問題),參數(shù)過多,訓(xùn)練復(fù)雜,容易出錯,容易過擬合,無法保證全局最優(yōu),加上很多問題無法用數(shù)學(xué)方法證明(個人理解)等等,科學(xué)家和工程師還是有區(qū)別的,科學(xué)家都想把一個問題歸結(jié)為數(shù)學(xué)問題,然后證明出來,他們就會認(rèn)為是有意義的,數(shù)學(xué)上證明其有效往往比做千百個實驗說明其有效要好些吧,工程師往往更在乎效果與結(jié)果),直到后來出現(xiàn)了BP算法。第二,得益于現(xiàn)在的大規(guī)模計算工具,能夠處理PB級別的數(shù)據(jù)了??傊F(xiàn)在人工智能還遠(yuǎn)沒達(dá)到人類的水平,最后結(jié)果會怎樣,這個暫時不設(shè)想。

目前正處于大數(shù)據(jù)時代,很多企業(yè)擁有巨大的數(shù)據(jù),比如阿里擁有消費(fèi)數(shù)據(jù)、百度擁有搜索數(shù)據(jù),騰訊擁有社交數(shù)據(jù),消費(fèi)數(shù)據(jù)與搜索數(shù)據(jù)都可以直接變現(xiàn)形成商業(yè)模式,而社交數(shù)據(jù)暫時還無法直接變現(xiàn),至少企鵝現(xiàn)在還在探尋中,舉個例子,你的朋友圈,qq空間到處是廣告,你是不是很討厭,差評,呵呵。數(shù)據(jù)有了,還有個重要的方面,處理數(shù)據(jù)的能力,也就是數(shù)據(jù)處理工具,能夠處理這么大的數(shù)據(jù)量,二者不可或缺,缺一談什么大數(shù)據(jù)都是耍流氓。

對于數(shù)據(jù)挖掘工程師:

首先你數(shù)學(xué)知識肯定要扎實吧,統(tǒng)計與概率論是最基本(也有人說現(xiàn)在的機(jī)器學(xué)習(xí)是統(tǒng)計學(xué)習(xí),確實有道理)、微分與積分肯定要知道、數(shù)學(xué)公式要看的懂吧,進(jìn)階階段最優(yōu)化,隨機(jī)過程等。建議去看看機(jī)器學(xué)習(xí)十大算法與一些深度學(xué)習(xí)的東西,多看大牛的博客。

對于語言,搞科研知道matlab就永不怕了,但是對于工程師嘛,肯定要知道寫代碼吧,不懂寫代碼的工程師都是扯淡,不要寫代碼的數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí),那是研究員,懂得一門高級語言與一門腳本語言就差不多了(如JAVAC++,Python或R,個人推薦Java與Python,因為像Hadoop、Spark、Hive、MPI之類的都對Java提供了很方便的接口,Python寫腳本很爽),還需要懂得Linux、Shell、SQL,這都是個人意見,至少在阿里,用java+sql+python+shell,阿里有個很牛逼的東西叫做ODPS,現(xiàn)在叫MaxCoupute,可以去阿里云官網(wǎng)查查相關(guān)資料

對于你所說的excel、SAS、SPSS,數(shù)據(jù)分析人員專用,因為工程師嘛,編程語言還是必須的。對于是否需要學(xué)習(xí)hadoop、hive之類的,個人意見是只要知道用,然后怎么用,怎么在上面實現(xiàn)一些算法,怎么去優(yōu)化自己寫的程序就差不多了,它們只是工具,而且更新得很快,就說hadoop吧,我還沒完全搞明白,就逐漸被spark取代了,記住,這些只是工具而已。推薦個加深你數(shù)據(jù)挖掘功力的東西weka(單機(jī)版的)與mahout(分布式的,有基于hadoop與spark),都是開源的。

對于工作是否需要設(shè)計新算法,我覺得在企業(yè)還是沒有要求這么高,除非你覺得自己很牛逼,想向google看齊,但是設(shè)計一個好的算法并能解決實際問題的算法,不是一朝一夕的,個人觀點(diǎn),很多算法可以想出來,最大的問題就是怎樣去證明其正確,其有效。想到企業(yè)中去,多看看google與ms工程性的文章,想研究就多看看學(xué)術(shù)大牛的文章,比如ICML,IJCAI,KDD,NIPS,CVPR等。大部分工作是,將已有的機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘算法應(yīng)用到具體的實踐中,根據(jù)業(yè)務(wù)場景與數(shù)據(jù)特點(diǎn)對算法進(jìn)行改造或者調(diào)整等。

最后舉個例子,你在淘寶上買一件衣服,系統(tǒng)怎樣向你推薦你感興趣的并且和這件衣服搭配的褲子或者飾品,這就是數(shù)據(jù)挖掘工程師的一方面工作。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 工程師
    +關(guān)注

    關(guān)注

    59

    文章

    1571

    瀏覽量

    68587
收藏 人收藏

    評論

    相關(guān)推薦

    LM318 COMP管腳是什么引腳,干什么用的?

    LM318 COMP 管腳是什么引腳,干什么用的,PSPICEFORTI 里面沒有318的COMP管腳在怎么應(yīng)用
    發(fā)表于 07-31 07:45

    正是拼的年紀(jì)|65歲電子工程師上班VLOG #65歲退休 #電子工程師 #搞笑 #上班vlog

    電子工程師
    安泰小課堂
    發(fā)布于 :2024年07月25日 11:31:02

    嵌入式軟件工程師和硬件工程師的區(qū)別?

    嵌入式軟件工程師和硬件工程師的區(qū)別? 嵌入式軟件工程師 嵌入式軟件工程師是軟件開發(fā)領(lǐng)域中的一種專業(yè)工程師,他們主要負(fù)責(zé)設(shè)計和開發(fā)嵌入式軟件,
    發(fā)表于 05-16 11:00

    大廠電子工程師常見面試題#電子工程師 #硬件工程師 #電路知識 #面試題

    電子工程師電路
    安泰小課堂
    發(fā)布于 :2024年04月30日 17:33:15

    美國云服務(wù)器是干什么的

    美國云服務(wù)器主要用于提供計算資源、托管網(wǎng)站、應(yīng)用程序以及存儲數(shù)據(jù)等。很多用戶想要了解美國云服務(wù)器具體是干什么的,rak部落小編為您整理發(fā)布美國云服務(wù)器是干什么的。 美國云服務(wù)器是一種**基于云
    的頭像 發(fā)表于 04-10 10:16 ?462次閱讀

    美國云服務(wù)器是干什么的

    對于美國服務(wù)器是干什么的,相信很多小白用戶不是非常了解,接下來小編就為您整理發(fā)布美國云服務(wù)器是干什么的相關(guān)資訊,希望對您有幫助。
    的頭像 發(fā)表于 02-19 09:53 ?468次閱讀

    云服務(wù)器是干什么的

     云服務(wù)器是干什么的?很多小白用戶會有疑惑,今天小編為您整理云服務(wù)器是干什么的相關(guān)資料,希望對您了解云服務(wù)器是干什么的有幫助。
    的頭像 發(fā)表于 02-18 09:58 ?1527次閱讀

    電磁爐工作原理 電磁爐板上有個可調(diào)電位器的作用是干什么的?

    電磁爐工作原理 電磁爐板上有個可調(diào)電位器的作用是干什么的? 電磁爐是一種利用電磁感應(yīng)原理來加熱食物的廚房電器。其工作原理是通過電路中的電感線圈產(chǎn)生高頻交變電磁場,使鐵制的鑲嵌在爐板下方的發(fā)熱盤產(chǎn)生
    的頭像 發(fā)表于 02-05 10:29 ?2597次閱讀

    什么是溫補(bǔ)晶振?溫補(bǔ)晶振是干什么的

    什么是溫補(bǔ)晶振?溫補(bǔ)晶振是干什么的?? 溫補(bǔ)晶振是指對晶體振蕩器進(jìn)行溫度補(bǔ)償?shù)囊环N技術(shù)。晶體振蕩器是一種電子設(shè)備,通過驅(qū)動晶體諧振頻率上的機(jī)械振動來產(chǎn)生穩(wěn)定的電信號。它在現(xiàn)代電子設(shè)備中廣泛應(yīng)用,如
    的頭像 發(fā)表于 01-23 16:42 ?1203次閱讀
    主站蜘蛛池模板: 亚洲三级免费| 99久久免费中文字幕精品| 妖精视频永久在线入口| 男女交性视频免费视频| 奇米影视四色7777| 欧美全免费aaaaaa特黄在线| 乱色伦图片区| 一级特黄aaa大片大全| 2018天天拍拍拍免费视频| 午夜影吧| 有没有免费的视频在线观看 | 69日本xxxxxxxxx78| 久操视频网| 超级乱淫小黄文小说| 91av成人| 一区二区三区伦理高清| 99久久免费精品国产免费高清| 亚洲香蕉视频| 日本网络视频www色高清免费| 久久精品女人天堂| 夜夜爽免费视频| 激情www| 九九热在线视频观看这里只有精品| 在线视频永久在线视频| 性8sex亚洲区入口| 性欧美高清精品videos| 嫩草影院www| ts人妖系列在线专区| videosgratis欧美另类老太| 天天摸天天操天天射| 天天亚洲综合| 午夜精品久久久久久影视riav| 久久国产高清字幕中文| 亚洲区中文字幕| 四虎在线视频| 日本免费看黄| 国产精品国产主播在线观看| 欧美8888| 狠狠色噜噜狠狠狠狠五月婷| 色多多免费观看| 免费在线看黄色|