2016年機器學習有三大趨勢。其中,Gartner分析認為,算法將形成一個全球性的交易市場,就像當年的App經濟,催生出全新一代的專業技術初創企業,并且革新機器與機器之間的交互方式;算法是創造智能應用的基石。同時,更多的數據將生成更好的模型和用戶體驗,進而吸引更多的用戶以及更多的數據,而這將導致儲存和計算數據的成本持續降低。
上個月,在被視為美國人工智能發展另一片新天地的西雅圖,Madrona風險投資集團舉辦了一場機器學習與人工智能峰會。100 多個專家、研究者和記者匯聚一堂,討論人工智能的未來、機器學習的趨勢,以及如何設計更智能的應用程序。
算法公司 Algorithmia 的 Matt Kiser 參加本次峰會后總結,如今,每家公司都成了數據公司,能夠在云中使用機器學習來大規模地部署智能應用,這得益于機器學習的三大發展趨勢。
“每個成功的新應用程序都將是智能應用,”Madrona 風險投資集團的投資合伙人 Somasegar說。“智能模塊和學習功能將成為應用的大腦。”Somasegar曾是微軟副總裁,負責軟件開發者部門,2015年離職,加入Madrona。
下面就來看看,機器學習的這三大趨勢將如何讓應用變得更智能。
算法將形成經濟。
Gartner副總裁兼研究員Peter Sondergaard說,“從根本上來說,數據是不會說話的,真正的價值在算法,算法決定行動”。
Gartner副總裁:算法才是真正價值所在
如果你不去利用數據,世界上的數據就不會有用。算法其實指的是如何在業務過程中有效拓展人為管理,利用數據。
“世界上所有大規模的東西都將被數據和算法所管理,”微軟機器學習和數據集團全球副總裁 Joseph Sirosh 說。在不遠的未來,“所有業務都將成為算法業務”。
而這,將催生出“算法經濟”:算法交易將會形成一個全球性的市場,世界各地的研究人員、工程師都能在這個市場上創造、分享乃至合成大規模的新算法。屆時,算法也將變得像集裝箱一樣,能夠任意組和擴展,從而搭建適用于不同應用的架構。
也就是說,多個機器學習算法可以結合起來成為更強大的算法,從而更好地分析數據,充分發掘數據里的價值。
在算法經濟中,前沿的技術項目,無論是先進的智能助理,還是能夠自動計算庫存的無人機,最終都將落實成為實實在在的代碼,供人使用和交易。
上圖的智能應用列表揭示了智能應用的抽象層級:從最下一層起,先是數據基礎設置,接下來是數據收集和準備,再來是建造模塊和服務,第4層是交互界面,最后才是消費者直接用到的服務。而要實現上圖中的智能應用,無論是那一層,都離不開算法。
算法是創造智能應用的基石。
至于數據國際人工智能學會Fellow、香港科技大學冠名講座教授楊強就試圖用遷移學習讓計算機擺脫對大數據的嚴重依賴,從而讓人工智能不再只是“富人的游戲”。也就是說,如果算法足夠強大,大數據并非必須。
“算法市場類似于App 商店,后者創造了所謂的App經濟。”Gartner 的研究總監 Alexander Linden 說。“App經濟的本質是,讓各種各樣的個人能夠在全球范圍內發行和銷售軟件,而不需要用自己的想法去說服投資人或建立自己的銷售、市場和分發渠道。”
Gartner曾發表報告,對算法經濟可能帶來的市場影響做出評估。Gartner認為,算法經濟將無可避免地創造一個全新的市場,人們可以對各種算法進行買賣,為當下的公司匯聚大量的額外收入,并催生出全新一代的專業技術初創企業。
想象這樣一個市場:數十億的算法都是可以買賣的,每一個算法代表的是一種軟件代碼,能解決一個或多個技術難題,或者從物聯網的指數級增長中創造一個新的機會。
正如App變革了人類與機器的交互方式一樣,我們將會看到,算法經濟將會促進下一代機器對機器互動演進的巨大飛躍。
人們將會通過產品使用的算法來評價它的性能好壞。企業的競爭力也不僅僅在于大數據,還要有能夠把數據轉換為實際應用的算法。因此,CEO應該關注公司有產權的算法,而不僅僅是大數據。
其中,最好的例證莫過于 Mobileye,這家市值已經超過百億的以色列算法公司在2014年8月IPO時,首日漲幅接近50%。此前的智駕深談中,新智元也提到過,截至2015年底,Mobileye在全球有超過1000萬裝機量,覆蓋超過20家車企的273款車型。集成度極高的解決方案,快速的市場推進速度,無一不讓所有人覺得眼前一亮,這些成功的背后,都是因為其多年積累的強大算法在支撐。
Mobileye 為特斯拉提供的自動駕駛系統是全球首個實際上路的DNN。
5月,被英特爾收購的初創公司 Itseez,其核心技術是一套名叫“駕駛員高級助理系統”的視覺算法,能讓汽車硬件識別出行人和交通標志,探測汽車何時偏離車道,并對可能發生的碰撞提出警報。這類技術目前已應用于高端汽車;將來當自動駕駛汽車實際上路時,該技術或將變得更加重要。
差不多在同一時間,ARM 以 3.5 億美元收購了英國計算視覺公司 Apical。Apical 是全球領先的圖像和嵌入式計算視覺公司,擁有多項計算視覺 IP 模塊。不僅如此,現在全球有超過 15 億 臺智能手機和 3 億臺網絡攝像機、數碼靜態相機和平板使用 Apical 的圖像產品。像這樣既有數據又有算法的公司,ARM 以 3.5 億美元收購用以鞏固計算視覺和圖像處理技術壁壘,也就不令人意外了。
Magic Pony 的算法看了左邊的圖片后,自動生成右邊的圖片。
還有剛剛過去的熱潮,Twitter 據稱用 1.5 億美元收購只有十幾個員工的英國初創公司 Magic Pony。根據英國專利局網頁,這家機器學習算法公司在圖像和視頻處理方面擁有 15 項專利(Magic Pony 官網稱擁有超過 20 項)。其中,最有名的算法能夠利用圖像中原本沒有的信息,提高圖像的分辨率,這些新的數據是算法從以前看過的、與待處理圖像類似的大量圖像中生成的,這個算法的工作原理跟人眼類似。
數據飛輪效應
數據和云存儲遵從摩爾定律:每過兩年,世界上的數據量就會翻倍,同時用于存儲這些數據的成本則會以同樣的速度下降。這些大量的數據使得人們可以創造出更多的產品特征和更好的機器學習模型。
Somasegar 用“數據飛輪效應”來形容這個情形:在智能應用的世界里,數據為王,而那些能夠產生出最高質量數據的服務將獲得壓倒性的優勢更多的數據生成更好的模型、更好的用戶體驗,進而吸引更多的用戶以及更多的數據。換句話說,也就是形成一個閉環和正反潰
例如,Tesla 收集了 7.8 億英里的駕駛數據,每過 10 小時里程數就會遞增 100 萬英里。
這些數據被喂給了 Telsa 的輔助駕駛程序 Autopilot,它使用超聲傳感器、雷達和攝像機以在不與人互動的情況下進行駕駛和改變車道和避免碰撞。最終,這些數據將成為他們計劃在 2018 年發布的自動駕駛汽車的基矗
谷歌的自動駕駛項目只積累了 150 萬英里的駕駛數據。與之相比,Telsa 的數據飛輪效應更加強勁有力。
云端人工智能
一家公司要想發現其業務中的洞見,使用算法機器智能從其數據中進行迭代學習是唯一可擴展的方式。要知道,這一直以來都成本高昂,也不一定有產出。
Sirosh 說,今天的數據科學就像40年前的裁縫一樣費時費力。
例如,一家公司需要首先收集定制數據,雇傭一個數據科學家團隊,持續地開發并優化模型,以跟上快速改變和增長的數據的步伐而這只是工作的開始。
現在,當擁有更多的數據,而存儲數據的成本也下降之后,機器學習開始向云端遷移;在云上,可擴展的網絡服務是可以隨叫隨用的 API。數據科學家不再需要管理基礎設施或實現自定義代碼。系統將為他們實現這些功能,實時產生新的模型,并提供更快、更準確的結果。
數據顯示,谷歌從2012年到2015年,使用深度學習技術的軟件數量每年都在急劇增長,2012年只有100個左右,到了2015年第四季度前,已經有近2700個。
“當用來建造和部署機器學習模型的成本大大變小,當你可以 ‘批量生產’ 它時,我們就可以從云端廣泛地獲取機器學習所需的數據了。”
正在涌現的機器智能平臺可以以“模型作為服務”的方式,托管預訓練過的機器學習模型,從而令企業能夠更容易地開啟機器學習,快速將其應用從原型轉化成產品。
“當企業們采用了微服務(microservice)發展范式后,接入并使用不同的機器學習模型和服務以提供特定功能的能力將變得越來越有價值”,Somasegar 說。
當諸如Scikit-Learn, NLTK,Numpy, Caffe, TensorFlow, Theano, or Torch 等開源機器學習和深度學習框架在云端運行時,企業將能夠方便地利用預訓練過的托管模型來標記圖片、推薦產品和進行一般的自然語言處理任務。
機器學習趨勢總結
“我們的世界觀是,每家企業現在都是一家數據企業,而每個應用都是智能應用,”Somasegar 說,“企業怎樣才能從海量數據中獲得洞見,并從中學習?這是世界上的每家公司都需要了解的。”
當數據飛輪開始運轉,用來獲娶儲存和計算數據的成本將持續下降。
這創造出了算法經濟,其中的機器智能基石將在云端實現。這些預訓練的、托管的機器學習模型將使每家 App 都能夠大規模利用算法智能。
數據飛輪、算法經濟和云托管智能的融合將意味著:
每家公司都可以成為數據公司;
每家公司都可以獲取算法智能。
評論
查看更多