優步有開源光纖,一個新的庫,旨在授權用戶在計算機集群上實現大規模的機器學習計算。 庫的主要目標是利用異構計算硬件,動態規模算法,并減輕工程師在集群上實現復雜算法的負擔。.
對于機器學習框架來說,保持足夠的靈活性來支持強化學習(RL)和基于人口的算法以及其他啟發式算法(如深度學習)是一個挑戰,因為需求可能會有很大的變化。
雖然TensorFlow和Py Torch等已建立的框架涵蓋了大多數常見機器學習方法的分布式培訓設置,但這些框架不太適合基于RL和基于人口的方法,這往往需要與模擬器頻繁交互以及復雜和動態的縮放策略。 光纖為其分布式計算框架提供了統一的Python用戶界面,以支持這些新需求。
與Fiber一起發表的研究論文詳細介紹了用于評估框架開銷、進化策略和近端策略優化(PPO)庫的實驗。 研究人員比較了Fiber與IPy并行(iPython用于并行計算)、Spark和標準python多處理庫在框架開銷上的性能,發現Fiber在任務持續時間較短時優于iPy并行和Spark,這是處理模擬器時要理解的重要指標。
與Atari基準中關于Breakout的多處理實現相比,Fiber啟用的PPO分布式版本的性能表明,Fiber可以將RL算法擴展到本地機器之外。
光纖分成API層,后端層,簇層。. API層與標準Python多處理模塊具有相似的要求和語義,但擴展到分布式環境中工作。
后端層可以處理多個不同集群管理器的任務通信。 最后,聚類層包含Kubernetes和Peloton等集群管理器。
光纖引入了一個新的概念,稱為工作支持過程。 當啟動其中一個進程時,將創建一個在當前集群上帶有Fiber后端的新作業。 父容器在使用相同的容器映像啟動子進程之前封裝所需的文件、輸入數據和該作業的任何其他依賴項,以保證一致的運行環境。 下圖更詳細地說明了這一架構:
纖維和谷歌新的分布式強化學習庫種子RL的發布表明,大科技公司的目標是既降低成本,又簡化培訓尖端機器學習算法的過程。
-
光纖
+關注
關注
19文章
3942瀏覽量
73420 -
算法
+關注
關注
23文章
4625瀏覽量
93129 -
機器學習
+關注
關注
66文章
8430瀏覽量
132856
發布評論請先 登錄
相關推薦
評論