互聯網無疑成為我們生活、學習、工作不可缺少的平臺。而伴隨互聯網產生的搜索引擎,幾乎是每個人上網都會使用到的。搜索引擎自誕生以來,依托于爬蟲、檢索排序、大數據處理、自然語言處理等多種技術,為檢索用戶提供信息服務。
目前,隨著人工智能技術的快速發展,得益于自然語言理解、知識圖譜等技術的支撐,傳統的信息檢索正在向新一代智能搜索轉變?!靶乱淮阉鲗⒅饕譃閮蓚€方向,一個方向是從通用搜索進入行業企業,成為行業的智能決策支撐;另一個方向則在更遙遠的未來,搜索是在個人端的技術演進,成為個人智能信息助手。” 一覽群智CEO胡健表示。
那么,從傳統信息搜索到新一代智能搜索,底層技術有什么改變?從感知智能到認知智能,企業又應該從何入手?筆者近日采訪了一覽群智CEO胡健,就新一代智能搜索,以及其中涉及的人工智能技術進行了深入探討。
傳統信息搜索的現狀與瓶頸
搜索技術的架構和交互界面已經有30年沒有改變過。由于搜索都是采用關鍵詞檢索的方法,無法做到完整的描述整個信息需求,因此,搜索系統不會主動進行交互和引導,只是高度依賴用戶的表達能力,因此人們得到的信息也是千人一面。
此外,搜索的核心技術也有10年沒有重大進步,傳統信息檢索與挖掘算法缺乏對底層數據與認知基礎的理解,并沒有充分解決該領域核心問題,導致搜索結果難以解釋,算法效率難以提升。
傳統的搜索是相對傻瓜化的通用決策引擎。搜索的本質是整合了互聯網的海量、多源、異構的數據理解網頁內容,同時理解用戶的查詢需求,最終將兩方進行匹配。在通用情況下,搜索引擎不會切分特別細致,這就造成交互形態是簡單的。此外,由于通用搜索引擎對于效率要求高,對網頁理解也相對簡單,因此,大家通過搜索引擎得到的結果也是近似的。
因此,搜索引擎需要升級轉型,下一代智能搜索應運而生。隨著人工智能技術的快速發展,新一代智能搜索正在成為可能。
新一代智能搜索加速探索
在一覽群智首席科學家文繼榮看來,智能信息檢索與挖掘是搜索的發展方向,而其具體表現現實是智能信息助手,它將取代搜索引擎成為連接人與信息的新工具,用存儲、計算和智能拓展人的能力,構建具有超級記憶力、知識能力和分析能力的“超級助手”,能夠隨時、隨地方便地獲取高質量相關信息和知識。文繼榮不僅是一覽群智首席科學家,還是中國人民大學信息學院院長、中國人民大學高瓴人工智能學院院長,他正在領導“智能信息檢索與挖掘”團隊,致力于做出“基于自然交互的個人智能信息助手”,取代傳統的搜索引擎,成為下一代信息獲取工具。并將在這個過程中,在理論基礎、算法模型、系統三個層面展開研究,進行源頭創新。
智能信息助手是可以有多重形態,可以是機器人,也可以是無形的。它有大腦,可以理解人們所提出的需求,給予回應,并且這種對話可以是多輪深度的。但是,現如今還達不到智能信息助手的狀態,因為,智能信息助手要與人形成溝通,理解人說話的意思,是需要有“腦子”。
“新一代搜索的另外一個形態我們將更快看到,那就是將通用搜索應用在行業企業中?!焙≌f,當前的人工智能的智力是相當于12歲的孩子,推理能力還相對較弱,但是其腦容量特別大,記憶力特別好,可以結合其優勢來找到適合的場景,也就是智能決策引擎。
智能決策引擎不是簡單的進行搜索,而是將不同渠道、異構的數據整合,將非結構化數據轉化成結構化數據,再關聯企業業務流程,從而進行分析預測,輔助企業進行決策。胡健強調,一定要加上“輔助”二字,因為現階段,完全通過機器自動完成還沒有實現。
目前,智能決策引擎可以替代中低端腦力勞動工作者,例如公安和司法領域,智能決策引擎能夠更好的整合案情案件數據、結構化視頻數據,做好事前預警、事中跟蹤和事后研判。其次,可以將專家的經驗變成模型,用模型來替代偏分析判斷類、輔助決策類的工作,從而可以替代偏重復性或半重復性的中檔腦力勞動者。
感知智能向認知智能演進
隨著移動互聯網、大數據、云計算等技術的快速發展,圖像、語音、視頻等與感知相關的感知能力在快速發展。目前,人工智能正在向能夠理解、思考、判斷、分析等認知智能延伸。人工智能的發展到了由感知智能邁向認知智能的界點。
如今的人工智能還是弱人工智能狀態,沒有所謂的大腦,若想形成大腦,最核心的就是要有知識。將人類的各種經驗沉淀,形成模型,讓機器可以讀得懂并且使用,最終成為生產力,這就是認知智能。認知智能技術是智能信息助手實現基礎。
胡健表示,目前,認知智能最大的難題就是構建知識。如今知識有很多,可以構建很多知識圖譜,但是開放性知識圖譜還很難形成。原因有二:一是關聯密度不足;二是知識的干凈程度不夠。但是,在專用領域,可以通過人工校驗的方式,來構建相對較準確的行業知識圖譜。
過去,構建知識圖譜基本都是依靠人工,隨著數據的在線化,知識圖譜可以由機器以自動的方式來進行構建,而機器構建的知識圖譜的數量級也會更大。此外,圖數據庫的快速發展,也可以將知識圖譜中的圖數據進行存儲。第三,得益于大數據的發展,海量數據的出現以及計算能力的提升,使得知識圖譜的構建更加精準。
胡健認為,人工智能要形成閉環,需要感知智能與認知智能相結合才有價值。但是,現階段,認知水平還有限,機器還不能完全像人一樣有大腦來進行決策。因此,重復式的、推理要求較低、沒有歧義需求的封閉場景,是完全可以用認知智能的技術來解決的。
一覽群智的“超”能力
除了在學術界有著超前的理論研究以外,一覽群智還將在現階段幫助用戶落地相關人工智能技術。
一覽群智于2015年11月成立,是一家以自然語言處理和知識圖譜等認知智能技術為核心的人工智能公司,為客戶提供一站式AI產品和行業解決方案。在一覽群智公司里,除了有文繼榮教授帶領的技術研究團隊,為智能信息助手的未來發展奠定基礎以外,還有胡健帶領的產品應用落地團隊,來確保行業智能決策引擎落地。
胡健將公司推出的四大產品稱作為智能搜索的四大底座,從感知智能到認知智能形成閉環。基于自然語言處理平臺智語產品來理解用戶的意圖;知識圖譜構建平臺智圖,讓機器學會知識;交互式關聯分析平臺智策,復制行業專家級分析推理能力,從而達到人機有效協同工作;最后通過機器學習與智能標注平臺智慧來進行學習,最終打造成Elens智能決策平臺。
胡健表示,未來的搜索可以在企業或者行業內部來使用。但是,并不是每家企業都適用。首先,企業需要有數據。數據是一切的基礎,沒有數據是無法構建知識圖譜,也就無法形成企業內部的搜索。第二,企業信息化程度要相對較高,如果企業信息化程度較低,很多業務流程還沒有完善,在企業信息化程度不高時做出來的搜索也是徒勞。第三是資金實力相對雄厚,畢竟構建知識圖譜并不是一件便宜的事情,因此企業需要有一定的資金支持才能完成。
目前,依托于Elens智能決策平臺,結合企業內部以及行業公開數據,一覽群智打造出金融智能決策解決方案和政企智能決策解決方案,滿足金融行業和政企用戶的需求。
結語
現如今的人工智能屬于初級的探索階段,就像十年前的云計算,業界也出現很多做人工智能的公司,頗有百花齊放的狀態。胡健認為,人工智能的技術都只是一個點,人工智能企業需要通過這一個點,幫助用戶打造完整的解決方案,從而幫助企業進行數字化轉型升級。
的確,如今從事人工智能領域的公司眾多,都在圍繞不同場景幫助用戶提供服務,而此階段的人工智能尚處于初級階段,無論是學術研究、還是服務提供商,乃至企業應用,都需要攜手推進,加速人工智能技術的落地,才能產生出更大的價值。
責任編輯:ct
評論
查看更多