11月18日,第五屆世界聲博會暨2022科大訊飛全球1024開發者節在合肥拉開序幕。開幕式上,中國科學院院士鄂維南發表了《下一代智能》的主題演講,分享對未來的思考與展望。
鄂維南院士表示,關于下一代人工智能可能是人工智能領域里面討論的最多的一個話題。以深度學習為核心的這一代人工智能已經取得了巨大的成功,但仍然存在多方面的挑戰。因此,發展下一代人工智能,是人工智能領域許多人都在思考和探索的問題。
巨大成功背后 這一代人工智能面臨的挑戰
從圖像識別、AlphaGo下圍棋,到蛋白質結構解析,以深度學習為核心的“這一代“人工智能,已經取得了巨大成功。那么為什么還需要發展“下一代”方法呢?鄂維南院士用一個簡單且深刻問題,引發大家的思考。
要回答這個問題,就必須從人工智能的底層邏輯出發。人工智能的底層邏輯包括社會邏輯、科學邏輯和商業邏輯。
在社會層面,我們要努力確保新的技術是有利于社會發展的。在科學層面,人工智能在工程方面已取得巨大成功,但是在科學方面仍然有很多問題,尤其是深度學習,像是一堆黑魔術。人工智能不應該僅僅是一些技術的組成,而是一個系統的Science,就像物理化學這類傳統學科一樣。
商業邏輯方面有三個關鍵問題——能不能用,是不是可靠,以及成本如何。對于能不能用,還存在許多挑戰。以皮膚狀況鑒別診斷為例,雖然深度學習提供了高診斷精度,但不具備可解釋性,這嚴重制約了實際應用。對于可靠性問題,鄂維南院士舉猴子照片的例子說到,雖然深度學習算法能夠準確識別猴子,但是如果猴子前面存在遮擋,深度學習算法有可能將其識別為人類。在成本維度,深度學習有效但并不高效,需要大量訓練數據、人力成本和算力消耗。
數據、算法、系統……,下一代AI需要解決的基本問題
當談及下一代人工智能時,“數據、算法、平臺、模型、系統以及應用”是重要的六大維度。在大會現場,鄂維南院士著重分享了對“數據、算法和系統”三個方向的思考。
首先,談到系統層面,如果平臺上有幾百個,幾萬個,甚至幾十萬個模型,就需要一個模型管理系統。這里涉及不僅僅是技術問題,還包括社會學,以及社會制度的問題。對于數據,可以說, 目前深度學習模型都是建立在原始數據的基礎上。現在人工智能這么高的門檻,很重要原因就是需要處理大量的非結構化數據,例如視頻、文本等。這些的處理成本比較高。對此,鄂維南院士分享了邰騁、湯林鵬等開發的AI數據庫的想法,即在原始數據湖或數據系統,加一層AI數據庫,其效果就像把非結構化數據庫結構化一樣,可以用通常搜索語言實現搜索, 并且實現了高精度、高效率地實現精確或近似查詢。這為模型開發提供了新的、更加高效的模式。
關于算法,鄂維南院士則分享到,目前人工智能算法基本分為兩大類,一類是基于學習(數據、經驗)的算法,例如深度學習、強化學習等,也就是這一代人工智能。另一類就是基于規則的算法,比如邏輯方法、符號方法、專家系統,即上一代人工智能。其中,專家系統的可解釋性相對好,但是對復雜系統的準確度不夠。與此同時,深度或強化深度學習則對復雜系統的準確率比較高,但可解釋性比較差。
如何能找到一個可解釋性強,并且對復雜系統準確率高的新方法?鄂維南院士分享了自己的建議——墨奇算法。墨奇算法有四個關鍵點:首先是非結構化數據的多尺度表示;其次是知識驅動的自監督學習;再者是基于算法的規則提取;最后是迭代改進。同時,以指紋識別為例,分享了墨奇算法如何發揮作用,并建立起第一個十億級指紋識別系統。這樣的系統僅僅依靠深度學習是做不到的。
“深度學習為什么能取得這么大的成功?”鄂維南院士最后分享道,在2012年,寫深度學習的程序是非常困難的。現在,基本上本科生都能很容易做到。巨大轉變的背后是一個非常完善的生態,包括算法、算力、好的數據集、以及模型訓練平臺等。因此,下一代人工智能不是個單純的算法,而是要建立起來一個良好的生態。
面向未來,鄂維南院士也在大會現場呼吁,企業、高校與科研機構攜手,建立這樣的良好生態,共同實現下一代人工智能。
審核編輯 :李倩
-
人工智能
+關注
關注
1791文章
47294瀏覽量
238578 -
深度學習
+關注
關注
73文章
5503瀏覽量
121182
原文標題:中國科學院院士鄂維南:下一代人工智能
文章出處:【微信號:訊飛開放平臺,微信公眾號:訊飛開放平臺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論