沒有什么比薅 GPU 羊毛更喜聞樂見。
之前有專門教程介紹谷歌資源,需要科學上網。但最近知乎上又有一套國產GPU資源的薅羊毛分享,價值上億的高性能算力,對科研學習者完全免費。
這就是百度的 AI Studio。現在,我們將這篇測評及使用分享轉載如下,祝薅羊毛開心順利。
1. AI Studio 和飛槳(PaddlePaddle)
AI Studio 和飛槳算是后起之秀,包括我在內的很多人還不是很熟悉這一整套方案,在開薅之前,所以先簡單介紹下。
1.1 AI Studio
AI Studio是百度提供的一個針對AI學習者的在線一體化開發實訓平臺。
平臺集合了 AI 教程, 深度學習樣例工程, 各領域的經典數據集, 云端的運算及存儲資源, 以及比賽平臺和社區。[1]你可以把 AI Studio 看成國產版的 Kaggle。
和 Kaggle 類似,AI Studio 也提供了 GPU 支持,但百度 AI Studio 在 GPU 上有一個很明顯的優勢。Kaggle 采用的是 Tesla K80 的 GPU,AI Studio 采用的是 Tesla V100 的 GPU,那么下表對比兩款單精度浮點運算性能,就能感覺 v100 的優勢了。
明顯在單精度浮點運算上,AI Studio 提供的運行環境在計算性能上還是很有優勢的。理論上訓練速度可以提高近 3 倍左右。
雖然性能上好很多,但目前還是可以免費薅到,目前 AI Studio 提供了免費申請和運行項目獎勵這兩種獲得算力卡的方式,最后一章我會帶領大家去薅。
即使算力卡用完了(目前送得太多,根本用不完),AI Studio 的 CPU 也是很有競爭力的。親自用腳本測試過,AI Studio 的 CPU 是 Intel(R) Xeon(R) Gold 6148 CPU,可以說在配置上,AI Studio 也是很有競爭力的。
1.2 飛槳
根據官網介紹,飛槳是百度推出的 “源于產業實踐的開源深度學習平臺”,致力于讓深度學習技術的創新與應用更簡單。
Paddle 是 Parallel Distributed Deep Learning 的縮寫,翻譯過來是就是槳。和 TensorFlow,Pytorch 等框架一樣,飛槳給開發者提供了很多常用的架構,也可以直接在包里直接加載常用的數據庫,對于學習者來說,還是很方便的。
飛槳(PaddlePaddle)還是有點國產的意思,去Github可以搜到PaddlePaddle 的項目,除了英文文檔,還提供了中文文檔,這個有時候還是挺方便的。雖然現在 star 比起 TensorFlow 還是差不少,但是感覺進展得如火如荼。
1.3 AI Studio 與飛槳的生態
下圖是百度在4月首屆 WAVE SUMMIT 2019 深度學習開發者峰會時首次對外公布的 飛槳全景圖。
生態其實設計得很好,可能TensorFlow先發得太早吧,感覺飛槳追趕得很吃力。但從百度最近推廣飛槳的力度來看,我猜飛槳很有可能兩三年左右進入主流深度學習框架之列。
2. AI Studio實例測評:以數字識別項目為例
2.1 AI Studio GPU 和 CPU 性能對比。
為了測試 AI Studio 的性能,我用最經典的 MNIST 數據集,在 LeNet 5 模型上跑,對比在 GPU 和 CPU 下在 AI Studio 的的性能。同時我進行了一個不算嚴謹的測試,我用最經典的 MNIST 數據集,飛槳用的 MNIST 數據集是 60000 個訓練數據,10000 個測試數據,Kaggle 的訓練集數據 42000,測試集數據 28000。https://aiStudio.baidu.com/aiStudio/projectdetail/45293
以下是 AIStudio 的 CPU 和 GPU 測試性能對比
GPU 提升效果為 11 倍,因為訓練過程有驗證測試,而且 CPU 配置也太高了,所以并未達到理論上的 47x 的加速,但這速度還不錯。
2.2 AI Studio 和 Kaggle 對比測試
測試環境:
1. Kaggle Kernel.
測試kernelhttps://www.kaggle.com/orange90/mnist-with-lenet-5-test-run-time. Batch_size =50,訓練 5000 輪,使用框架TensorFlow,CNN 架構是 LeNet-5
2. AI Studio.
測試項目https://aiStudio.baidu.com/aiStudio/projectdetail/45293
Batch_size=64,訓練 5000 輪,使用框架飛槳, CNN 架構是 LeNet-5
AI Studio 的測試結果在 2.1 展示了,就不再贅述了,以下是 Kaggle 的性能測試對比:
GPU 提升效果為 8 倍,因為訓練過程有驗證測試,所以并未達到理論上的 12.5x 的加速。
由于架構的超參不一樣,直接對比運行時間不太嚴謹,但從 GPU 提升速度的倍數上來說,AI Studio 略勝一籌,況且 AI Studio 本來 CPU 就很高配了,所以理論上 47x 的加速可能還得打個折。
2.3 AWS
也在AWS開了個instance來測試,選的是這一款配置里的p2.xlarge
直接把2.2里用到的kaggle的內核導進去了,測試結果如下:
性能上比前兩者都差一點。
順便一提,這個測試做得我腦殼痛,前期開 instance,配置環境的就花了一個多小時。對于 AWS 新手來說,可能折騰一天,薅了十幾美刀,還是沒能把代碼跑通。真的強烈不推薦在AWS來練習自己 deep learning 技能。
2.4. 測試總結
下表總結在不同環境下的測試效果及成本:
在使用體驗上,和 Kaggle Kernel 或者 Jupyter Notebook 很接近,雖然外觀稍有不同,但快捷鍵基本一樣,沒有太大的不適應。除此之外,AI Studio 由于在國內,頁面響應比 Kaggle 更快,比 Kaggle 網絡更穩定,斷線重連幾率要更低,畢竟斷線重連要重跑還是挺蛋疼的。
不過需要提醒的是,AI Studio 目前還是按運行環境啟動時間來計費,是在無 GPU 環境下把代碼寫好,再開啟 GPU 去跑。雖然 AI Studio 的算力卡也是送的,但也要趕緊薅起來,囤點算力資源,萬一哪天百度沒錢了,不送了呢?
3. 羊毛來了,薅起來
現在的算力卡還是很好拿的,沒什么門檻,自己申請一下就拿到了,而且每天運行一次項目,又送 12 個小時算力,連續運行 5 天再加送 48 小時。
值得注意的是,申請的算力卡到手就是 48 小時,裂變之后能湊 120 小時,而且有效期比日常運行獲取的12小時這種要長很多。
我尋思每天免費讓你12小時 NVIDIA v 100GPU 這種事情,真的是天上掉餡餅吧。
此外,AI Studio 官方也有比賽,有獎金,如果你的實力在 kaggle 里離拿獎金只是一步之遙,那么蹭 AI Studio 還沒火起來之前,去 AI Studio 比賽應該是很好拿獎的。
3.1 自己申請
點進https://aistudio.baidu.com/aistudio/questionnaire?activityid=539
接著填寫個人信息
提交后,會出現下圖
然后就靜候佳音。通過運營人員核驗后,用戶的郵箱將收到運營人員發送的算力邀請碼:一串 32 位數字。
通過上面鏈接能申請到 48 小時的算力卡(有效期1個月),并且可以分裂,送給別人(稍后送上我的分裂算力卡)
使用算力卡的方法很簡單,在運行項目時選上 GPU,就會開始消耗了,如下圖。
3.2 跑項目賺算力卡
這個簡直了,你不僅可以運行自己的深度學習代碼,測試自己的項目,而且同時還會得到算力卡。每天跑一次就可以得到12小時算力卡(有效期2天),另外算力充電計劃,就是連續5天有使用算力卡,就會額外送48小時(有效期7天)。但預感這么高成本的事情應該不會持續太久,建議早薅。下面是我的算力卡獎勵歷史,感覺只要你用,AI Studio 就送你算力,不擔心算力不夠。
3.3 算力卡分裂
AI Studio 的算力卡有分裂功能,你申請到算力卡會有三個邀請碼,你可以分享給你的朋友。我申請的算力卡有三個分裂,我每天會在評論區放一個算力卡,對羊毛貪得無厭,或者懶得申請又想馬上使用的,那可要盯緊評論區了。
3.4 比賽薅羊毛
另外額外告訴大家一個可能能行的薅羊毛的方法,需要一定的實力。AI Studio 也有一些常規比賽,相對于 Kaggle,可能競爭會小點,如果你在 Kaggle 能top10%以上,來 AI Studio 薅類似的比賽,就很大幾率拿得到獎金了。
羊毛不是天天有,該出手時就出手!
-
cpu
+關注
關注
68文章
10899瀏覽量
212621 -
gpu
+關注
關注
28文章
4766瀏覽量
129199 -
AI
+關注
關注
87文章
31429瀏覽量
269832
原文標題:免費GPU計算資源哪里有?帶你薅薅國內GPU羊毛
文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論