知識圖譜(Knowledge Graph)是人工智能的重要分支技術(shù),它在2012年由谷歌提出,成為建立大規(guī)模知識的殺手锏應(yīng)用,在搜索、自然語言處理、智能助手、電子商務(wù)等領(lǐng)域發(fā)揮著重要作用。知識圖譜與大數(shù)據(jù)、深度學習,這三大“秘密武器”已經(jīng)成為推動互聯(lián)網(wǎng)和人工智能發(fā)展的核心驅(qū)動力之一。
知識圖譜的概念與分類
知識圖譜(Knowledge Graph)于2012年由谷歌提出并成功應(yīng)用于搜索引擎當中。它以結(jié)構(gòu)化的形式描述客觀世界中概念、實體及其之間的關(guān)系,將互聯(lián)網(wǎng)的信息表達成更接近人類認知世界的形式,提供了一種更好地組織、管理和理解互聯(lián)網(wǎng)海量信息的能力。 知識圖譜的分類方式很多,例如可以通過知識種類、構(gòu)建方法等劃分。從領(lǐng)域上來說,知識圖譜通常分為兩種:通用知識圖譜、特定領(lǐng)域知識圖譜。
常見的知識圖譜示意圖主要包含有三種節(jié)點:實體、概念、屬性。 實體指的是具有可區(qū)別性且獨立存在的某種事物。如某一個人、某一座城市、某一種植物、某一件商品等等。世界萬物由具體事物組成,此指實體。實體是知識圖譜中的最基本元素,不同的實體間存在不同的關(guān)系。 概念指的是具有同種特性的實體構(gòu)成的集合,如國家、民族、書籍、電腦等。 屬性則用于區(qū)分概念的特征,不同概念具有不同的屬性。不同的屬性值類型對應(yīng)于不同類型屬性的邊。如果屬性值對應(yīng)的是概念或?qū)嶓w,則屬性描述兩個實體之間的關(guān)系,稱為對象屬性;如果屬性值是具體的數(shù)值,則稱為數(shù)據(jù)屬性。
知識圖譜的三大典型應(yīng)用
現(xiàn)在以商業(yè)搜索引擎公司為首的互聯(lián)網(wǎng)巨頭已經(jīng)意識到知識圖譜的戰(zhàn)略意義,紛紛投入重兵布局知識圖譜,并對搜索引擎形態(tài)日益產(chǎn)生重要的影響。如何根據(jù)業(yè)務(wù)需求設(shè)計實現(xiàn)知識圖譜應(yīng)用,并基于數(shù)據(jù)特點進行優(yōu)化調(diào)整,是知識圖譜應(yīng)用的關(guān)鍵研究內(nèi)容。 知識圖譜的典型應(yīng)用包括語義搜索、智能問答以及可視化決策支持三種。
1、語義搜索
當前基于關(guān)鍵詞的搜索技術(shù)在知識圖譜的知識支持下可以上升到基于實體和關(guān)系的檢索,稱之為語義搜索。 語義搜索可以利用知識圖譜可以準確地捕捉用戶搜索意圖,進而基于知識圖譜中的知識解決傳統(tǒng)搜索中遇到的關(guān)鍵字語義多樣性及語義消歧的難題,通過實體鏈接實現(xiàn)知識與文檔的混合檢索。 語義檢索需要考慮如何解決自然語言輸入帶來的表達多樣性問題,同時需要解決語言中實體的歧義性問題。同時借助于知識圖譜,語義檢索需要直接給出滿足用戶搜索意圖的答案,而不是包含關(guān)鍵詞的相關(guān)網(wǎng)頁的鏈接。
2、智能問答
問答系統(tǒng)(Question Answering,QA)是信息服務(wù)的一種高級形式,能夠讓計算機自動回答用戶所提出的問題。不同于現(xiàn)有的搜索引擎,問答系統(tǒng)返回用戶的不再是基于關(guān)鍵詞匹配的相關(guān)文檔排序,而是精準的自然語言形式的答案。
智能問答系統(tǒng)被看作是未來信息服務(wù)的顛覆性技術(shù)之一,亦被認為是機器具備語言理解能力的主要驗證手段之一。
智能問答需要針對用戶輸入的自然語言進行理解,從知識圖譜中或目標數(shù)據(jù)中給出用戶問題的答案,其關(guān)鍵技術(shù)及難點包括準確的語義解析、正確理解用戶的真實意圖、以及對返回答案的評分評定以確定優(yōu)先級順序。
3、可視化決策支持
可視化決策支持是指通過提供統(tǒng)一的圖形接口,結(jié)合可視化、推理、檢索等,為用戶提供信息獲取的入口。例如,決策支持可以通過圖譜可視化技術(shù)對創(chuàng)投圖譜中的初創(chuàng)公司發(fā)展情況、投資機構(gòu)投資偏好等信息進行解讀,通過節(jié)點探索、路徑發(fā)現(xiàn)、關(guān)聯(lián)探尋等可視化分析技術(shù)展示公司的全方位信息。
可視化決策支持需要考慮的關(guān)鍵問題包括通過可視化方式輔助用戶快速發(fā)現(xiàn)業(yè)務(wù)模式、提升可視化組件的交互友好程度、以及大規(guī)模圖環(huán)境下底層算法的效率等。
知識工程的五個發(fā)展階段
知識圖譜技術(shù)屬于知識工程的一部分。1994年,圖靈獎獲得者、知識工程的建立者費根鮑姆給出了知識工程定義——將知識集成到計算機系統(tǒng),從而完成只有特定領(lǐng)域?qū)<也拍芡瓿傻膹碗s任務(wù)。 回顧知識工程這四十多年來的發(fā)展歷程,我們可以將知識工程分成五個標志性的階段:前知識工程時期、專家系統(tǒng)時期、萬維網(wǎng)1.0時期、群體智能時期、以及知識圖譜時期,如下圖所示。
1)1950-1970時期:圖靈測試—知識工程誕生前期 這一階段主要有兩個方法:符號主義和連結(jié)主義。符號主義認為物理符號系統(tǒng)是智能行為的充要條件,連結(jié)主義則認為大腦(神經(jīng)元及其連接機制)是一切智能活動的基礎(chǔ)。 這一時期的知識表示方法主要有邏輯知識表示、產(chǎn)生式規(guī)則、語義網(wǎng)絡(luò)等。 2)1970-1990時期:專家系統(tǒng)—知識工程蓬勃發(fā)展期 由于通用問題求解強調(diào)利用人的求解問題的能力建立智能系統(tǒng),但是忽略了知識對智能的支持,使人工智能難以在實際應(yīng)用中發(fā)揮作用。從70年開始,人工智能開始轉(zhuǎn)向建立基于知識的系統(tǒng),通過“知識庫+推理機”實現(xiàn)機器智能。 這一時期知識表示方法有新的演進,包括框架和腳本等80年代后期出現(xiàn)了很多專家系統(tǒng)的開發(fā)平臺,可以幫助將專家的領(lǐng)域知識轉(zhuǎn)變成計算機可以處理的知識。
3)1990-2000時期:萬維網(wǎng)1.0 在1990年到2000年期間,出現(xiàn)了很多人工構(gòu)建大規(guī)模知識庫,包括廣泛應(yīng)用的英文WordNet,采用一階謂詞邏輯知識表示的Cyc常識知識庫,以及中文的HowNet。 Web 1.0萬維網(wǎng)的產(chǎn)生為人們提供了一個開放平臺,使用HTML定義文本的內(nèi)容,通過超鏈接把文本連接起來,使得大眾可以共享信息。W3C提出的可擴展標記語言XML,實現(xiàn)對互聯(lián)網(wǎng)文檔內(nèi)容的結(jié)構(gòu)通過定義標簽進行標記,為互聯(lián)網(wǎng)環(huán)境下大規(guī)模知識表示和共享奠定了基礎(chǔ)。 4)2000-2006時期:群體智能 萬維網(wǎng)的出現(xiàn)使得知識從封閉知識走向開放知識,從集中構(gòu)建知識成為分布群體智能知識。原來專家系統(tǒng)是系統(tǒng)內(nèi)部定義的知識,現(xiàn)在可以實現(xiàn)知識源之間相互鏈接,可以通過關(guān)聯(lián)來產(chǎn)生更多的知識而非完全由固定人生產(chǎn)。 這個過程中出現(xiàn)了群體智能,最典型的代表就是維基百科,實際上是用戶去建立知識,體現(xiàn)了互聯(lián)網(wǎng)大眾用戶對知識的貢獻,成為今天大規(guī)模結(jié)構(gòu)化知識圖譜的重要基礎(chǔ)。
5)2006年至今:知識圖譜—知識工程新發(fā)展時期 “知識就是力量”,將萬維網(wǎng)內(nèi)容轉(zhuǎn)化為能夠為智能應(yīng)用提供動力的機器可理解和計算的知識是這一時期的目標。從2006年開始,大規(guī)模維基百科類富結(jié)構(gòu)知識資源的出現(xiàn)和網(wǎng)絡(luò)規(guī)模信息提取方法的進步,使得大規(guī)模知識獲取方法取得了巨大進展。 當前自動構(gòu)建的知識庫已成為語義搜索、大數(shù)據(jù)分析、智能推薦和數(shù)據(jù)集成的強大資產(chǎn),在大型行業(yè)和領(lǐng)域中正在得到廣泛使用。典型的例子是谷歌收購Freebase后在2012年推出的知識圖譜(Knowledge Graph),F(xiàn)acebook的圖譜搜索,Microsoft Satori以及商業(yè)、金融、生命科學等領(lǐng)域特定的知識庫。
原文標題:從概念到實踐 | 全面了解知識圖譜
文章出處:【微信公眾號:傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
責任編輯:haq
-
人工智能
+關(guān)注
關(guān)注
1792文章
47445瀏覽量
239052 -
知識圖譜
+關(guān)注
關(guān)注
2文章
132瀏覽量
7718
原文標題:從概念到實踐 | 全面了解知識圖譜
文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論