現在,不了解一些機器學習技能,可能都會覺得自己有些out了。但過去苦于沒有數據、沒有GPU,沒有算法,很多感興趣的朋友就望而卻步了。今天就不同了,開放的數據比比皆是,算力也逐漸強大,還有數不清的線上課程資料。如果你想開啟機器學習的大門,就和我們一起來看看這份豐富的資源清單吧!我們將從數據、算力、算法和在線教育等四個方面,為你進入機器學習的大門掃清障礙,大步向前!
數據
數據是算法的養料,可以說這一波深度學習的革命就來源于豐富的數據給予的充足養分,才滋養了人工智能再一次的蓬勃發展!
數據集嘛,圖像、文本、語音,你想要的應該都能找到。包括圖像領域著名的ImageNet,kitti等數據集
也包括推薦系統方面的IMDb和Million Song
還包括自然語言處理方面的MS MARCO datasets等等著名的數據。
Github上的小伙伴已經為我們準備好了一份數據大餐,如果你想要數據可以到這里盡情下載,除了深度學習數據外,還包括經濟、醫學、農業等等各個行業的豐富數據,總有一款適合你的興趣。
https://github.com/awesomedata/awesome-public-datasets
如果這還嫌不夠,Kaggle還有一些令人驚喜的優質數據集。
https://www.kaggle.com/datasets
這里有著名的鳶尾花數據集
也有精彩大片的數據集
還有可愛的小蘑菇,讓機器學習看看能不能吃:
甚至還有美國大選的數據集:
無論是使用公開的數據集,還是通過Python從web上抓取數據,現在每個人都可以有機會訪問高質量的數據集。當然,大型科技公司會把數據私有化以便從中挖掘出最大的價值,但卻還有很多人不斷的努力為世界創造出更多開放的優質數據,讓初學者、工程師和數據科學家們都能利用這些數據訓練模型、開啟機器學習的大門。
計算
有了數據后要找地方進行計算也是個頭疼的問題。雖然對于普通的機器學習問題來說,你的筆記本就能夠搞定,但是對于深度學習任務或者大數據量的數據集,小本本的算力就捉襟見肘了。這時候,似乎只有眼饞別人實驗室的GPU了。神經網絡需要使用大規模并行計算,GPU非常適合這個工作。不幸的是,GPU還是比較貴的。
如果你的筆記本有可以使用的顯卡,那就十分愉快啦。如果沒有的話,可以考慮入手一塊1050之類的入門版GPU來開啟你的加速之旅,或者也可以通過亞馬遜、谷歌、微軟以及國內各家云服務廠商提供的GPU實例來進行計算,一頓飯錢就可以跑好長時間了。
當然,還有免費的午餐,谷歌的Colab和kaggle的kernel中,你可以申請開啟GPU來運行自己的算法處理數據。更為方便的是,它們都是基于notebook的格式,使得程序的編寫變得更加直觀方便。
另外各大高校內一般都設有計算中心,校內價格也十分便宜,對于學生來說是一個不錯的選擇。
算法
有人說,算法是一種充滿價值的商品,一個優秀的算法可能價值連城。幸運的是,機器學習領域已經建立了開源共享的良好文化。無論是在NIPS還是ICLR會議上,研究人員非常樂意分享他們成果。像Github和reddit一樣的社區在源源不斷地交流、碰撞出各種新思想和新方法,這里的代碼可以作為你學習和研究的起點。
對于學術型的小伙伴來說,如果想跟上最新的研究,可以到Arxiv閱讀最新的論文,幾乎覆蓋了全球范圍內各個研究團隊的最新研究結果。
教育
有了代碼,也有了數據,有了計算能力,現在只需要學習如何使用它們。你可以從coursera上開始你的機器學習入門之旅,有包括吳恩達在內的名師指路,學習一定會有個好的開始。同時也可以在網站上找到各種優秀的機器學習入門書籍,深入學習后你會發現無窮的魅力!
同時網上豐富的視頻教程也能讓你學習到無數的實踐、思想和機器學習的無數技巧~
是不是有點小激動呢?這是一個不可思議的時代。在這個飛速變化的時代里,機器學習可以幫助我們以另一種我們不擅長的方式理解這個世界。它可以幫助我們比以往更有效地創造和發現無數的新事物。現在我們獲得了這種神力了,聰明的你一定會善加利用的!
-
機器學習
+關注
關注
66文章
8430瀏覽量
132859 -
數據集
+關注
關注
4文章
1208瀏覽量
24766 -
深度學習
+關注
關注
73文章
5511瀏覽量
121360
原文標題:掃盲貼 | 再也沒有借口不學機器學習了!全方位資源消滅你不學習的接口
文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論