數據科學家會被機器學習取代嗎?雖然現在的數據科學家崗位需求非常熱,但是所從事的工作領域,正好面臨機器學習的不斷挑戰。福布斯作者認為,數據科學家工作的5個領域,未來5-10年會被機器學習取代,Reddit網友對此進行了激烈的討論。
數據科學崗位正在面臨巨大的變革。
計算器被發明之前,它的工作是由人來擔當的;互聯網剛剛發展起來的時候,網管是一個非常熱門的職業;中層領導曾經并不自己做PPT,這些瑣碎的工作由他們的秘書處理。
如今,計算員、網管、中層領導的秘書這些崗位,早已被科技的浪潮淹沒在海底深處。
數據科學淘金熱
數據科學家崗位現在的形勢,很像當年美國西部淘金熱潮。一些數據科學家賺到了高薪,各大公司、薪酬網站也在不算釋放缺人、待遇高的信號。
根據美國最熱崗位排行榜數據顯示,數據科學家崗位的招聘信息在過去3年時間,增加了75%,而薪資也提升到了嚇人的30萬美元,相當于200萬人民幣。
與此相對應的是,包括UC伯克利在內的多所高校,均新增了數據科學專業,并很快就成為最熱門專業。
著名科技網站Slashdot聯合創始人、Sight Machine聯合創始人兼CTO、福布斯科技委員會成員Nate Oostendorp對此表示,未來只會有一小部分人能夠真正成為數據科學家,而其中大部分,前途依舊充滿未知。
從匯編到高級語言,再到數據自動化
作為一名元老級別的開發者,Nate Oostendorp經歷了從低級語言到高級語言的變革時期。
最早的時候,編譯器設計是一門必修課程,比如把C轉換成匯編。在商業應用上直接使用匯編,是再正常不過的事情。
然而僅僅幾十年后,大家都還是用高級語言,直接用匯編語言開發的軟件,基本上絕跡了。而數據科學領域的變化,顯然更快。
如今,很多公司都在提供數據分析工具,就算你不懂代碼,也可以輕松進行數據分析。
3年后,更高級別的工具將越來越多地減少對基礎技術的專業知識的要求。這些工具的不僅簡化了數據科學家的工作流程、提升了工作效率,更重要的是降低了入行門檻,及時沒學過數據科學的人,不懂代碼也可以完成一些數據科學家的工作。
機器學習,人工智能,像吹氣球一樣吹大了數據科學的旺盛需求,同時也將在5年后,吹爆數據科學家這個職業。
數據科學家崗位在5年后將不復存在
Nate認為,當下非常火的數據科學家,5年后將不再作為一個獨立崗位存在。而是分裂成5種類型:
1. 通才
他們將解釋數據并使其可用。這些通才將專注于教育最終用戶,幫助用戶提出數據問題而不是自己找到所有答案。這可能是一個過渡性的角色,五年內比十年更常見。
2. 行業專家
他們將在制造,醫學和金融等特定行業應用數據科學技術和工具。這是我認為大部分工作都將在這里的地方。但是,這些不會被視為數據科學工作。這名工作人員不會是了解制造業的數據科學家,而是了解數據科學的制造業領導者。今天相當于研究員是統計學王牌。
3. 深度專家
這些細分的特定數據科學技術的深度專家,人數是也最少的。這是剩下的純數據科學工作所在的地方。他們的角色將是抽象地追求數據科學,提高算法的性能和設計新的通用方法。他們將像今天的計算機科學家一樣,建立理論基礎而不是解決日常問題。
4. 分析開發人員
他們將從數據科學家轉變為分析開發人員。這些是軟件開發專家,負責處理數據交互并幫助人們從數據報告中進行推斷。算法設計將是他們工作的一小部分,由數據平臺以及以交鑰匙方式完成大量工作的強大代碼庫提供幫助。
5. 數據工程師
他們構建管道,將數據轉換并傳輸到基礎平臺,進行分析和可視化。雖然數據科學家通常因其出色的算法而受到認可,但數據科學家80%的時間可用于收集,清理和組織數據。
此言論一出,造成了非常大的爭議,并在Reddit上產生了激烈的討論。與其說是討論,不如說是一邊倒的反對此觀點。
各方觀點
反方
logicchains用stackexchange上一個問題(What happens if the explanatory and response variables are sorted independently before regression?)來說明,數據科學并不單單是自動化。選擇正確使用,正確清理和驗證數據的數據至少與選擇正確的模型同樣重要。
他指出,目前沒有任何軟件能夠通過組織內部進行拖網查找`Sales`表上的'Extra2`字段的正確解釋,該字段有三個值:“TRUE”,“Error”和null。言下之意:5年內不可能,10年內不可能。
FrenchCuirassier認為,數據以指數速度增長,未來將會有更多的工作,但其中大部分將分析、理解和解釋數據。
人工智能并不能解釋,也不能理解它做的所有事情。AI在未來可能達到人類智能,但誰敢說我們能活著看到那一天呢?
BeneficialArcher也持有相同觀點,認為大多數數據科學角色不太可能實現自動化。目前自動化已經很成熟了,但沒有任何軟件能夠解決模糊的問題,并使用所有可用的數據解決它。
但他又認為未來幾年工資會有所下降是合理的,因為初中政治學到的最基本的經濟原理:供大于求。
killver聲稱沒有看到一個案例能夠證明AutoML優于熟練的數據科學家。如果有,那每年舉行的Kaggle比賽,靠一個算法就夠了。
具體而言,領域知識將始終是重要的。嘗試了幾次AutoML工具后發現,這些工具從來沒有達到過滿意的效果。
正方
當然,每個人的認知都是不同的。也有人表示認可Nate的部分觀點。
sid__想的比較實際,他認為軟件工程作為一門學科將比數據科學更難實現自動化。
考慮一家不希望聘請150k數據科學家的普通公司,如果能夠利用普通的軟件工程師,將數據投入到autoML引擎中,使用api調用并獲得預測結果,在很多情況下這已經足夠了,特別是如果不是一些關鍵任務應用程序。
-
互聯網
+關注
關注
54文章
11163瀏覽量
103430 -
機器學習
+關注
關注
66文章
8423瀏覽量
132750 -
數據科學
+關注
關注
0文章
165瀏覽量
10076
原文標題:給數據科學家判死刑:5年后將被機器學習取代
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論