Uber 宣布開源 Ludwig,一個基于 TensorFlow 的工具箱,該工具箱特點是不用寫代碼就能夠訓練和測試深度學習模型。
Uber 官方表示,對于AI開發者來說,Ludwig 可以幫助他們更好地理解深度學習方面的能力,并能夠推進模型快速迭代。另一方面,對于 AI 專家來說,Ludwig 可以簡化原型設計和數據處理過程,從而讓他們能夠專注于開發深度學習模型架構。
Ludwig 提供了一套 AI 架構,可以組合起來,為給定的用例創建端到端的模型。開始模型訓練,只需要一個表格數據文件(如 CSV)和一個 YAML 配置文件——用于指定數據文件中哪些列是輸入特征,哪些列是輸出目標變量。如果指定了多個輸出變量,Ludwig 將學會同時預測所有輸出。使用 Ludwig 訓練模型,在模型定義中可以包含附加信息,比如數據集中每個特征的預處理數據和模型訓練參數, 也能夠保存下來,可以在日后加載,對新數據進行預測。
對于 Ludwig 支持的數據類型(文本、圖像、類別等),其提供了一個將原始數據映射到張量的編碼器,以及將張量映射到原始數據的解碼器(張量是線性代數中使用的數據結構)。內置的組合器,能夠自動將所有輸入編碼器的張量組合在一起,對它們進行處理,并將其返回給輸入解碼器。
Uber 表示,通過組合這些特定于數據類型的組件,用戶可以將 Ludwig 用于各種任務。比如,組合文本編碼器和類別解碼器,就可以獲得一個文本分類器。
每種數據類型有多個編碼器和解碼器。例如,文本可以用卷積神經網絡(CNN),循環神經網絡(RNN)或其他編碼器編碼。用戶可以直接在模型定義文件中指定要使用的參數和超參數,而無需編寫單行代碼。
Ludwig 采用的這種靈活的編碼器-解碼器架構,即使是經驗較少的深度學習開發者,也能夠輕松地為不同的任務訓練模型。比如文本分類、目標分類、圖像字幕、序列標簽、回歸、語言建模、機器翻譯、時間序列預測和問答等等。
此外,Ludwig 還提供了各種工具,且能夠使用開源分布式培訓框架 Horovod。目前,Ludwig 有用于二進制值,浮點數,類別,離散序列,集合,袋(bag),圖像,文本和時間序列的編碼器和解碼器,并且支持選定的預訓練模型。未來將支持更多資料的種類。
-
人工智能
+關注
關注
1791文章
47336瀏覽量
238698 -
Uber
+關注
關注
0文章
411瀏覽量
36267
原文標題:不寫代碼也能玩轉人工智能!Uber開源AI工具箱Ludwig
文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數據技術】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論