【導讀】作為全球首個聯(lián)邦學習工業(yè)級技術(shù)框架,F(xiàn)ATE支持聯(lián)邦學習架構(gòu)體系與各種機器學習算法的安全計算,實現(xiàn)了基于同態(tài)加密和多方計算(MPC)的安全計算協(xié)議,能夠幫助多個組織機構(gòu)在符合數(shù)據(jù)安全和政府法規(guī)前提下,有效和協(xié)作地進行數(shù)據(jù)使用和聯(lián)合建模。
8月18日,F(xiàn)ATE 1.0版本正式發(fā)布,重點推出了聯(lián)邦建模可視化工具FATABoard,以及聯(lián)邦學習建模pipeline調(diào)度和生命周期管理工具FATEFlow,并對FederatedML進行了重大升級。
該項目已發(fā)布在github:
https://github.com/webankfintech/fate
FATEBoard
簡單高效,聯(lián)邦學習建模過程可視化
FATEBoard是聯(lián)邦學習建模的可視化工具,為終端用戶可視化和度量模型訓練的全過程,幫助用戶更簡單而高效地進行模型探索和模型理解。
FATEBoard由任務(wù)儀表盤、任務(wù)可視化、任務(wù)管理與日志管理等模塊組成,支持模型訓練過程全流程的跟蹤、統(tǒng)計和監(jiān)控等,并為模型運行狀態(tài)、模型輸出、日志追蹤等提供了豐富的可視化呈現(xiàn)。FATEBoard可大大增強聯(lián)邦建模的操作體驗,讓聯(lián)邦建模更易于理解與實施,有利于建模人員持續(xù)對模型探索與優(yōu)化。
圖1 FATEBoard功能架構(gòu)總覽
圖2 FATEBoard界面示意圖
FATEFlow
高性能聯(lián)邦學習pipeline生產(chǎn)服務(wù)
FATEFlow是聯(lián)邦學習建模Pipeline 調(diào)度和生命周期管理工具,為用戶構(gòu)建端到端的聯(lián)邦學習pipeline生產(chǎn)服務(wù)。FATEFlow實現(xiàn)了pipeline的狀態(tài)管理及運行的協(xié)同調(diào)度,同時自動追蹤任務(wù)中產(chǎn)生的數(shù)據(jù)、模型、指標、日志等便于建模人員分析。另外,F(xiàn)ATEFlow還提供了聯(lián)邦機制下的模型一致性管理以及生產(chǎn)發(fā)布功能。
在FATE 0.3版本以前,啟動任務(wù)的模塊是由Workflow完成。在Workflow中,各算法組件的順序被完全固定,用戶只能選擇是否開啟某個模塊,無法按照需求調(diào)整組件順序,甚至多次調(diào)用同一個組件。每多開發(fā)一個組件,都要修改整體的Workflow,以適應(yīng)新組件的添加。這種設(shè)計,使開發(fā)者在添加新組件時,修改部分過多,限制了整體系統(tǒng)的可擴展性。
而FATE 1.0新推出的FATEFlow良好解決了workflow中,由于需要提前規(guī)定算法組建順序而造成的流程排版復雜問題,在調(diào)用模塊時不再存在大一統(tǒng)組件,每一次建模任務(wù)都能自定義算法流程。在FATE v1.0版本中,開發(fā)者自定義流程只要一個普通的json文件就可以實現(xiàn),這使得開發(fā)者在添加新組件時,不用修改過多部分,極大程度地提升了整體系統(tǒng)的可擴展性。
FATEFlow提供了極為豐富的功能,主要包括:
● DAG定義聯(lián)邦學習Pipeline
多方非對稱Pipeline DAG、通用json格式DAG DSL、DSL-Parser
●聯(lián)邦任務(wù)協(xié)同調(diào)度
多方任務(wù)隊列管理、協(xié)同分發(fā)任務(wù)、任務(wù)一致性保證、多方狀態(tài)同步等
●聯(lián)邦任務(wù)生命周期管理
多方啟停、狀態(tài)檢測等
●聯(lián)邦模型管理
聯(lián)邦模型存取、聯(lián)邦模型一致性、版本管理、發(fā)布管理等
●聯(lián)邦任務(wù)輸入輸出實時追蹤
數(shù)據(jù)、模型、自定義指標、日志等實時記錄存儲
此外,F(xiàn)ateFlow還提供了多種接口,方便用戶完整把握整個建模任務(wù)。包括:
●上傳和下載數(shù)據(jù)功能,使得用戶可以方便地切換數(shù)據(jù)源;
●狀態(tài)查詢功能,獲得每個組件的實時狀態(tài);
●下載功能,獲取每個組件的配置文件和中間結(jié)果,最大程度方便用戶調(diào)試。
在FATE 1.0版本中,用戶自定義流程得以進一步簡化,過程非常簡單,只需通過一個普通的json文件即可將算法全流程實現(xiàn)。
而配置運行DSL,也只需要三步:
1.module:
●模型組件,F(xiàn)ATE當前支持11個模型組件
2.Input:
●data: 數(shù)據(jù)輸入
●model: 模型輸入
●isometric_model: 異構(gòu)模型,當前只用于Feature Selection
3.Output
●data: 數(shù)據(jù)輸出
●model: 模型輸出
通過以上配置,dsl-parser能自動對用戶設(shè)定的json文件,解析出完成的算法DAG圖,并將其通過FATEBoard展示出來,使得用戶可以清晰地看到整個算法流程的架構(gòu)。
DAG圖示意
FederatedML
重大升級所有算法模塊運行機制
FederatedML支持FATEFlow以組件模塊化的方式構(gòu)建任意模型,支持FATEBoard回調(diào)中間統(tǒng)計結(jié)果以可視化展示。另外,還增加和升級了多項重要功能:
●優(yōu)化算法模塊增加對Nesterov Momentum SGD 優(yōu)化算法的支持,極大提升了聯(lián)邦學習算法的收斂速度;
●多方安全協(xié)議增加對Affine Transform的加法同態(tài)加密算法的支持;
●聯(lián)邦特征分箱增加對稀疏輸入格式的支持;
●升級評估指標以覆蓋大部分分類評估與回歸評估;
●重構(gòu)和升級算法參數(shù)類,實現(xiàn)算法參數(shù)定義和校驗一體化。
FATEServing
聯(lián)邦推理功能升級
在線聯(lián)邦推理中,F(xiàn)ATE 1.0新增了在線聯(lián)邦建模pipeline的DSL解析器,允許用戶生成聯(lián)邦推理pipeline并進行聯(lián)邦推理。
總之,F(xiàn)ATE 1.0版本為聯(lián)邦學習建模帶來更豐富更強大的功能,極大提升了聯(lián)邦建模體驗。
微眾銀行AI團隊歡迎對聯(lián)邦學習有興趣的同仁一起貢獻代碼,提交 Issues 或者 Pull Requests。
-
算法
+關(guān)注
關(guān)注
23文章
4625瀏覽量
93124 -
可視化
+關(guān)注
關(guān)注
1文章
1198瀏覽量
20993 -
機器學習
+關(guān)注
關(guān)注
66文章
8429瀏覽量
132854
原文標題:重磅!全球首個可視化聯(lián)邦學習產(chǎn)品與聯(lián)邦pipeline生產(chǎn)服務(wù)上線
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論