IBM公司正在嘗試使用與Trifacta Inc.共同開發的新數據準備工具來解決準備用于人工智能和機器學習模型訓練的數據的繁瑣且耗時的過程。
兩家公司指出,數據準備是構建機器學習和預測模型的重要步驟。那是因為數據需要非常準確,否則模型將無效,但是問題是數據科學家最多可以將80%的時間花費在此任務上。
這是一個非常漫長的時間,可以更好地用于其他事情,這就是為什么IBM和Trifacta今天宣布推出其新的InfoSphere Advanced Data Preparation工具的原因,他們說這有助于加快流程。
借助InfoSphere,數據科學家可以將其原始數據集轉換為適合于機器學習模型的格式,同時使用其現有的數據湖和數據倉庫。
兩家公司表示,該工具旨在“格式化,構造和豐富用于分析處理和標準報告的數據集”。它的工作原理是幫助用戶可視化數據準備過程,以便他們可以連續跟蹤數據的質量,并確保在格式化數據時不會發生錯誤。該過程也是完全自動化的,這意味著正式員工和數據科學家可以準備和豐富其數據以進行分析。
Trifacta首席執行官亞當·威爾遜(Adam Wilson)表示,該公司與IBM合作創建了InfoSphere,此前該公司目睹了許多組織由于數據質量差和準備流程效率低下而難以開展AI計劃。
威爾遜說:“這項合作將使組織能夠在受管和集中管理的環境中加快自助服務分析的數據準備?!?/p>
Constellation Research Inc.分析師Doug Henschen告訴SiliconANGLE,與IBM的合作實際上是Trifacta的妙招,更不用說為IBM節省時間了,因為它可以帶來“最新的自助服務數據”向市場“準備能力”的速度比它自己完成的速度更快。
Henschen說:“我認為IBM明智地專注于建模生命周期的開發,部署,監視和持續管理方面,并在可能的情況下開發自動化?!?“為什么Trifacta很好地應對了準備挑戰?Trifacta在其云平臺上也與Google建立了重要的合作伙伴關系,因此這是著名合作伙伴對其能力的第二次認可?!?/p>
-
IBM
+關注
關注
3文章
1761瀏覽量
74779 -
機器學習
+關注
關注
66文章
8434瀏覽量
132873
發布評論請先 登錄
相關推薦
評論