MIT的研究人員使用貝葉斯推理,讓計算機程序編寫專門為數據分析設計的新程序。其目的是減輕那些本身不是人工智能專家的數據科學家的負擔。
最近有個非常流行的話題:如何讓普通人(普通人指既不是程序員,也不是IT管理員,更不是機器學習科學家的人群)更容易接近人工智能?
比較流行的一種方法是將所有的復雜性抽象到云計算操作中。
然而,本周MIT提出了另一種方法:讓機器學習自己完成更多的工作,發明自己的程序,在時間序列分析等特定應用程序中處理數據。
這本身就是人工智能的一個熱門領域,讓機器建立模型,進而從數據中歸納出答案。
計算機程序設計自動化方法中,“第一個概率程序的貝葉斯合成”
研究人員描述了一種自動創建推斷數據模式的程序的方法,這意味著數據科學家不再需要找出適合所研究數據的“模型”。
這項工作發表在計算機協會網站上的一篇論文中,題為《用于自動數據建模的貝葉斯合成概率程序》(Bayesian Synthesis of Probabilistic Programs for Automatic Data Modeling)。
其作者分別是MIT的Feras A. Saad、Marco F. Cusumano-Towner、Ulrich Schaechtle、Martin C. Rinard和Vikash K. Mansinghka。
Saad和他的同事們所要攻克的問題是:找到正確的程序來分析給定的數據集所需的所有工作。
正如他們在文章當中所述,要解決這個問題,將面臨如下方面的困難:
用戶需要手動選擇模型或程序結構;
需要大量的建模專業知識;
建模能力有限;
如果用戶沒有探索足夠廣泛的模型或程序結構,可能會丟失數據的重要方面。
為了解決這個問題,他們打算讓計算機做決定。
Saad和他的同事們繼承了近年來“合成”計算機程序的傳統,讓一個程序生成另一個程序。
在這方面,有很多值得借鑒的例子,例如Google DeepMind科學家2014年為建立“神經圖靈機”所做的努力。 該項目使用所謂的“循環神經網絡”來發現簡單的計算機算法,例如復制和粘貼文本。
作者的同事通過設計“概率”程序而不是經典的“確定性”程序來做區分。
這意味著在給定特定輸入的情況下,程序不一定會產生可預測的輸出。相反,程序的輸出將反映輸入它們的數據的噪聲和不確定性。
為了實現這一點,作者使用了貝葉斯統計方法。他們對大量的計算機程序進行取樣,并對每個程序的可能性進行評分,以此作為處理想要研究的數據的可能解決方案。
正如作者所說,在所有的計算機程序設計自動化方法中,他們的方法是“第一個概率程序的貝葉斯合成”。
“領域特定語言”構建的程序是關鍵
幫助研究人員實現這一壯舉的是他們做出的一個關鍵選擇:他們開始構建,或“合成”,不僅僅是任意一般類型的計算機程序,而是由“領域特定語言”構建的程序。
MIT的研究人員描述了他們的貝葉斯推理方法在特定領域的語言中搜索表達式的過程,以組合一組可以分析特定類型數據的算法。
DSL是在某種程度上可以匹配它們處理數據的語言。例如,有一些“數據建模”語言可以幫助表示數據中的關系。Yang就是這樣一種數據建模語言的名稱,用于計算機網絡的建模。
通過將他們的方法限制在DSL上,作者適當縮小了計算機程序的“搜索空間”,從而提高了他們找到解決方案的幾率,而不是像神經圖靈機那樣采用更通用的方法。
一旦貝葉斯推理過程裝配了一些Winning Program,這些程序就能夠對數據進行推理。
例如,作者描述了適合分析多年飛行里程的程序。這是一個時間序列分析問題,所謂的高斯統計過程是合適的。
因此,他們的貝葉斯推斷綜合了包含高斯過程操作的算法,以找到那些有可能擬合數據的算法組合。
與“卷積神經網絡”等一些通用機器學習模型不同,這種方法的一大好處是,合成的程序在某種意義上是可以解釋的,它們不是AI中令人恐懼的“黑匣子”。
這是因為程序是特定于領域的,所以它們的操作會“泄露”它們在數據中發現的內容。
正如作者所描述的,“領域特定語言中合成的程序提供了緊湊的數據模型,使定性屬性在程序的表面語法中變得明顯。”
同時,作者還展示了如何使這些DSL程序能夠對新數據進行泛化。
他們使用一個解釋器程序將單個算法轉換成一種叫做Venture的東西,這是一種更加廣泛和通用的概率編程語言。然后Venture就可以在更廣泛的應用程序中對數據進行推斷。
當然,這項工作有進一步的方向。研究人員特別指出,他們的工作在未來可能會納入用戶對數據應如何處理或分析的具體要求。
這意味著人類對數據的智能與機器技能的融合,或許是人與人工智能的理想結合。
-
人工智能
+關注
關注
1793文章
47590瀏覽量
239486 -
機器學習
+關注
關注
66文章
8435瀏覽量
132885 -
數據分析
+關注
關注
2文章
1459瀏覽量
34103
原文標題:MIT實現機器自動建模,數據分析分分鐘搞定
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論