霍金弟子Alan Yuille在前不久發表言論稱,至少在計算機視覺領域,深度學習的瓶頸已至。然而,人工智能與大數據的發展相輔相成,數據將會推動人工智能的發展,促進更多技術應用落地,將人工智能帶入一個新臺階——數據紅利悄然將至。
深度學習已至“瓶頸”?數據處理或許是一劑良藥。
前不久,霍金弟子、約翰霍普金斯大學教授Alan Yuille發表言論稱,至少在計算機視覺領域,深度學習的瓶頸已至。
在此問題上,Alan Yuille認為該領域最嚴峻的挑戰是開發能夠應對組合爆炸的算法,如果研究人員追求更多樣性的方法和技術,而不僅是追逐當前的流行趨勢,這一領域將會得到更快的發展。
而現在,對于深度學習發展已經到了天花板的問題,似乎有了另外的解決方案——數據。
6月18-21日,以“打破理論與現實的壁壘”為主題的O’Reilly和英特爾人工智能大會在京舉行。
大會期間,英特爾公司架構圖形與軟件集團副總裁和數據分析技術總監馬子雅在被問到如何看待“深度學習到達瓶頸”的問題時表示,人工智能、數據分析界在此問題上長期以來有兩派意見:
一派意見認為人工智能的發展一定要通過對其算法的不斷提升才能真正把AI推到一個新臺階;
另一派意見認為人工智能只做算法是不行的,若是不能更好地利用、分析數據,人工智能很快就會達到它的瓶頸。
而馬子雅認為,二者是相輔相成的,如同事物發展規律曲折回復,其最終結果會呈上升趨勢。
人工智能一直有所精進,但其應用方面并不是非常理想。自從有了大數據,對圖像分析領域產生了突破性推進作用。
數據會推動人工智能的發展,會將人工智能帶入一個新臺階,部署行業應用,推進人工智能落地:
“人工智能業務的需求牢牢地根植于數據,要充分利用以數據為中心的基礎架構,充分利用將數據分析與人工智能無縫銜接起來的軟件創新技術。”
而圍繞數據為核心,英特爾在AI時代的戰略圖景也可通過此次大會有所了解:
在軟件方面,提供一系列通用工具集,幫助用戶最大化利用硬件, 以及通過BigDL和Analytics Zoo構建統一的大數據分析與人工智能平臺,幫助用戶開發部署行業應用,推進人工智能落地;
在硬件方面,提供完整的硬件產品組合和計算平臺,滿足用戶從設備到邊緣再到云端的不同工作負載需求 。
在產、學、研生態打造方面,英特爾宣布在中國成立大數據分析和人工智能創新院,進一步加快集成數據分析和AI的大規模創新與部署。
英特爾人工智能戰略的核心在于,致力于給客戶帶來領先的人工智能硬件和軟件產品組合,幫助用戶搭建所需要的AI應用,幫助客戶解決所面臨的個性化問題。除了技術本身,英特爾還致力于與廣泛的行業伙伴合作,一起面向共同服務的客戶,開發全套、全面、完整的AI解決方案。
在AI時代,英特爾正在完成一次轉型——從“芯片航母”到以數據為中心,深挖數據紅利,釋放數據價值,通過軟硬件協同加速人工智能的行業應用。
低門檻開源工具BigDL、Analytics Zoo,數據紅利悄然將至
人類處于一個數據變革的時代——歷史上90%的數據都是在過去幾年產生的,而50%的數據卻是在短短兩年所生成。
在過去的一段時間數據分析和人工智能得到了空前的發展。
但事實上到目前為止,只有2%的數據被真正的分析用來幫助人類的生產生活。人工智能是時候走出實驗室了,走向落地應用了。
而這一過程需要一條完整的數據分析流水線:
第一步,通常需要從生產線上收集大量的原始數據;
第二步,要對這些原始數據進行大量的清理和預處理;
第三步,利用數據分析、機器學習、深度學習對于清理過的數據進行歸納總結;
第四步,可視化。
這條流水線有著較高的門檻:20%的任務是深度學習,但80%都是在做數據收集、數據存儲、數據管理、數據清理、數據預處理。
這也正是英特爾開源BigDL、Analytics Zoo的重要原因——降低門檻,讓人工智能走出實驗室。
目前,BigDL和Analytics Zoo都已開源,大大降低了普通大數據用戶和數據科學家在使用深度學習進行數據分析和構建人工智能應用時的門檻。
先來看看BigDL,BigDL是一個建立在大數據平臺(Hadoop/Spark)之上原生的分布式深度學習庫,它提供了在Apache Spark上豐富的深度學習功能,以幫助 Hadoop/Spark成為一個統一的數據分析平臺,為整個數據分析和機器學習過程提供比現有框架更加統一和集成化的支持。
同時,在Apache Spark、BigDL以及TensorFLow、Keras的基礎上又構建了一個大數據分析+AI的平臺Analytics Zoo,方便用戶開發基于大數據、端到端的深度學習應用。
不止降低了開發者學習深度學習的門檻,在建立AI生態上,“釋放數據紅利”已經逐漸變成現實。
人工智能如果不能真正地效力于生產實踐,其實是沒有任何價值的。看未來的趨勢,必須先看到人工智能對于未來哪幾個方面能產生比較大的影響。
英特爾通過Analytics Zoo構建統一的大數據分析和人工智能平臺,幫助用戶開發部署深度學習、人工智能和大數據分析的應用,攜手眾多合作伙伴和用戶,共同推動人工智能部署,加速落地。
美的、韻達、歐洲核子研究組織(CERN)都在利用英特爾Analytics Zoo進行人工智能的落地。英特爾借助BigDL和Analytics Zoo幾乎與各行各業的廠商展開了合作,實施部署了各種各樣的人工智能的解決方案。
這其中就包括智慧醫療、智慧銀行、智慧交通、智慧生產、智慧電信等等。英特爾也與大型云服務提供商、原型設備制造商、軟件開發商進行合作,將技術整合產品當中,包括阿里巴巴、百度、騰訊、京東等等。
同時英特爾還推動與產、學、研的深度合作,打造AI生態。大會上,英特爾宣布啟動英特爾數據分析和人工智能研究院創新院。創新院的主要負責人是英特爾高級首席工程師、大數據技術全球CTO戴金權。
這個創新院的主要工作集中在以下幾點:
第一,加速人工智能在中國市場的落地,尤其是通過將它與數據分析進行整合來加速落地。
第二,解決中國市場的最新需求,引領創新,創新用法、創新算法。第三,幫助中國市場更好地使用英特爾最新的軟件和硬件技術。
AI芯片,絕不能輸的戰場
如今AI芯片已經成為一個“絕不能輸的戰場”。
在O’Reilly大會期間,有著“芯片航母”之稱的英特爾在接受媒體采訪時透露了在硬件方面的布局圖景。
馬子雅表示:英特爾的硬件圖景不只集中在計算,我們希望英特爾的硬件能夠比較全面,例如針對存儲方面,英特爾開發了“傲騰”技術,另外英特爾也已經做了很久的網絡架構技術。
而作為整個產業的根基,AI芯片如今成為各大巨頭紛紛爭先想要占領的高地。收購Nervana Systems,成為英特爾全面擁抱人工智能的一個重要節點。
去年,英特爾全球副總裁兼人工智能產品事業部總經理Naveen Rao表示AI已是英特爾“絕不能輸的戰場”。在2019年1月,英特爾推出了Nervana神經網絡推理處理器。本次馬子雅也透露對于Nervana的未來規劃公司已有路線圖,會在更合適的機會和大家分享。
馬子雅強調未來的計算力不能局限于CPU一種,尤其是在AI時代,需要通過研發多種多樣的硬件形式,保證計算力能夠在固定每幾年翻一番的速度繼續下去,可能都不是集中在通用芯片上,有時候是專用和通用的結合。
事實上,盡管CPU不再是“唯一”,但仍然是計算結構里不可或缺的重要組成部分。就如同Naveen Rao此前說得一樣,只要是馮·諾依曼架構,“你必須要有一個CPU”。
英特爾一大優勢在于,市面上已經安裝并且投入使用的CPU,而硬件基礎設施的更新則是逐步進行,“把舊的全扔掉然后換新的”并不現實。如今,全球有3500萬公司使用英特爾的CPU,眼下最火熱的人工智能推理,也有近 90% 是在英特爾的芯片上完成。
英特爾在制程與封裝上仍處于領先位置。制程工藝不斷向更高的晶體管密度發展,為芯片帶來更強的性能和更低的功耗,擁有領先的制程技術,是構建領先硬件產品的關鍵。
制程的領先仍然是英特爾繼續發揮產品優勢的關鍵因素,在10納米領域英特爾繼續推動產品的發展。在Foveros的制程中,英特爾的3D封裝技術可實現在邏輯晶圓上堆疊邏輯處理單元,能夠把邏輯芯片和邏輯芯片連在一起,更好地發揮異構功效。
另外,在CPU的周圍,你可以放上GPU、DSP、ISP,以及NNP,或者各種新的架構。
英特爾認為,未來十年架構創新會是創新的主要驅動力,將繼續帶來指數級的擴展效應。除了常見的標量、矢量、矩陣和空間這四種計算架構外,英特爾在架構創新上還做了更多的工作,例如:
Loihi神經擬態計算。它可以用超低的功耗去完成一個GPU用很高功耗才能完成的任務,并能通過學習得到一個新的網絡。
量子計算。量子計算是在架構上的另外一個全新的超大并行規模計算。英特爾在量子計算有兩個不同的探索模式,一個是和業界類似的通過超導方式做量子位和量子芯片;另外一種是基于英特爾比較擅長的硅處理工藝,用自旋的方式,目前也有了(自旋)量子位芯片,并且為了能夠規模化的生產和測試,專門和產業界、學術界合作。
保持CPU王者的領先優勢,同時開發適合AI時代的多種硬件形式,AI化是英特爾發展硬件的未來方向。
AI并非“一策萬能”,要軟硬件協同創新
事實上,過去幾年間計算力正在以驚人的速率增長。計算力指數級上升的實現,正是基于硬件與軟件的結合。如果想實現指數級的增長,必須要硬件和軟件共同創新。
在講述硬件未來圖景時,馬子雅提到需要研發多種多樣的硬件形式。然而,AI并非“一策萬能”。
沒有一種方案能解決所有問題(one size doesn’t fit all),需要多樣化的產品組合滿足不同人工智能應用的需求。
從某種程度上,在人工智能這一領域,英特爾更像是AI解決方案提供者,針對不同的案例提供不同的軟硬件組合:
從軟件層面,英特爾主要集中在開源方面,例如開源BigDL和Analytics Zoo。
未來十年的計算創新由架構驅動。英特爾具備獨具一格的優勢,可以將標量(CPU)、矢量(GPU)、矩陣(AI)和空間(FPGA)等不同架構整合到系統級平臺和系統級封裝,同時也在進行架構創新的新探索,比如Loihi神經擬態計算芯片、量子計算。
而怎樣進行組合則是由客戶的工作負載來決定,決定適合的軟件和合適的硬件。
馬子雅透露,最有效的辦法、為客戶提供最好的解決方案,就是先知道他的工作負載是什么,然后找到相應的軟件硬件結合來解決那個工作負載,這是最行之有效的。
英特爾強調在硬件上每得到一個指數級的性能提升,如果加上軟件的話可能有兩個指數級的性能提升。對此,英特爾從操作系統再到上層整合成一個完整的全棧軟件技術(Vertical Stack),然后在硬件架構的優化全部打通。
通過這種技術能把各種性能,架構上所有軟件的性能整合起來然后提供給用戶,大大提高其在這些架構上得到的性能和算力。值得一提的是,英特爾“One API”項目將為開發者帶來一套能提供一個統一編程模型的工具。針對跨多種架構的工作負載,這個模型簡化了相關的開發工作。
對英特爾而言,就是要提供多樣化的標量、矢量、矩陣和空間架構組合,以先進制程技術進行設計,由顛覆性內存層次結構提供支持,通過先進封裝集成到系統中,使用光速互連進行超大規模部署,提供統一的軟件開發接口以及安全功能,從而實現超異構計算的技術愿景。
AI計算如今已經邁入超異構時代,硬件基礎只是AI超級生態中的一個環節,但是以數據為中心的未來還需要更完整的系統思考,單一因素已經不足以滿足多元化的未來計算需求,必須實現軟硬件協同創新。
-
芯片
+關注
關注
456文章
50927瀏覽量
424597 -
英特爾
+關注
關注
61文章
9982瀏覽量
171939 -
人工智能
+關注
關注
1792文章
47399瀏覽量
238905 -
深度學習
+關注
關注
73文章
5507瀏覽量
121266
原文標題:深度學習已至“瓶頸”?英特爾:數據處理是一劑良藥
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論