人工智能更高認知的知識構建的數個維度

智能的真正標志不是知識，而是想象力。

什么知識讓我們變得聰明？我們用來理解世界、解釋新體驗和做出深思熟慮的選擇的認知結構是什么？定義一個闡明給人類或人工智能更深入理解和更高認知的知識的框架，將有助于我們對此話題進行結構化的討論。

近日，英特爾實驗室副總裁兼緊急人工智能研究主任Gadi Singer介紹了這種賦予人工智能更高認知的知識構建（knowledge constructs）的數個維度，并指出一條通往更高智能機器的道路。

更高層次的機器智能的核心，可能是讓知識構建幫助人工智能系統組織自己的世界觀，賦予人工智能理解意義、事件和任務的能力。如此一來，機器認知將從數據擴展到知識結構，包括描述性知識、世界動態模型和起源等維度。

在學習語言時，我們要區分形式（form）和意義（meaning）：形式指的是用來表達意義的符號，也就是表面的表達。每種形式在特定的語境中都有特定的含義，而形式在不同的語境中可以有不同的含義。

正如Bengio和Sch?lkopf等人在“Towards Causal Representation Learning”一文中總結的那樣：“目前機器學習的大多數成功都是源于對適當收集的獨立和相同分布（i.i.d）數據的大規模模式識別。”系統吸收可觀察到的元素，如文本字符、聲音信號和圖像像素，并建立模式和隨機相關性，同時在基于識別的任務中產生出色的結果。

論文地址：https://arxiv.org/pdf/2102.11107.pdf

越來越多的人認為，算法必須超越表面相關性，達到真正理解的水平，從而實現更高水平的機器智能。這種徹底的轉變將使所謂的System 2、3rdWave或廣義/靈活的 AI 成為可能。正如Gadi Singer在核心博客“認知人工智能的崛起”中所說的那樣，更高水平的機器智能需要深層次的知識構建，這種知識構建可以將人工智能從表面相關性轉化為真正理解這個世界。

美國國防部高級研究計劃局（DARPA）的 John Launchbury 指出，在第三次人工智能浪潮中，抽象（比如創造新的意義）和推理（規劃和決策）將掀起一場新革命。第三次浪潮本身的特點是語境適應，即系統為現實世界的各種現象構建語境解釋模型。

知識維度中有兩個維度反映了對世界的看法，一個是描述性維度，描述性維度對世界上存在的事物進行了概念性的抽象，另一個是現實世界及其現象的動態模型。

此外，故事提升了人類在共同信仰和神話基礎上的理解和交流復雜故事的能力。語境和來源歸因以及價值和優先級是元知識維度，這些維度帶來了基于條件的有效性和知識的不斷疊加。最后，概念參考是結構基礎，跨維度、模態和參考而存在。

這六個知識維度結合在一起，可以讓人工智能不僅僅停留在事件相關性上，而是獲得更深入的理解，因為這六個知識維度的潛在概念是持續的，可以解釋和預測過去和未來的事件，甚至允許計劃和干預，并考慮反事實的現實——因此文中使用了“深度知識（deep knowledge）”一詞。

闡明和描述機器智能所需的知識構建類型，有助于確定實現這種知識構建的最佳方式，從而實現更高水平的機器智能。

1?支持更高水平智能的六大知識維度? 對于人工智能系統來說，實施人類理解和交流中觀察到的知識構建可以為智能提供實質性的價值。當所有的知識類型都得到支持和組合時，實際價值會大幅增長。 ?

圖注：支持更高水平智能的知識維度。圖源：Gadi Singer/英特爾實驗室 ?1. ?描述性知識：層次、分類和屬性繼承 ?? 描述性知識（即概念性的、命題性的或陳述性的知識）描述事物、事件、事物/事件的屬性以及其之間的關系。假設使用（適當的）類或概念的分層，深度描述性知識就能擴展其原本的定義。這類知識可以包括事實和記錄系統。與特定用例和環境相關的事實和信息可以作為層次知識進行組織、利用和更新。 ? 單個人工智能系統中使用的基礎本體（ontology）可以使用來自策劃系統的與任務相關的類和實體（例如，OpenCyc本體或AMR命名的實體類型）進行播種。這種基礎本體應該是可以通過神經網絡/機器學習技術進行擴展——也就是說，獲取新知識就會得到新的實體，關系和類。 ?2.世界模型? 世界上的現象模型讓人工智能系統能夠理解情況、解釋輸入/事件以及預測潛在的未來結果并采取行動。現象模型是抽象/概括，可以分為正式模型和近似（非正式）真實世界模型；現象模型允許在特定情況下對實例使用變量和應用程序，并允許對特定實例或更通用的類進行符號操作。 ? 正式模型的例子包括邏輯、數學/代數和物理。與正式模型相比，現實世界的模型通常是經驗的、實驗性的、有時甚至顯得有些混亂。現實世界的模型包括物理模型、心理模型和社會學模型。程序模型（“專有知識”）包括在這個類中。 ? 因果模型可以幫助人工智能系統發展更上一層樓。在語境發生變化的情況下，如果與因果關系等知識模型相結合，并理解了控制原因的語境和考慮反事實的能力，那么過去的統計數據就可以有效地應用于現在從而預測未來。這些模型有助于從條件和可能因素的角度理解情況或事件。因果推理是人類思想不可或缺的組成部分，通過這種方式可以實現人類智慧級別的機器智能。 ?3. 故事和腳本? 正如歷史學家尤瓦爾·哈拉瑞所說，故事構成了個人和社會的文化和世界觀的關鍵部分。故事的概念對于充分理解和解釋人類的行為和交流是必要的。故事是復雜的，在一個連貫的敘述中可能包含多個事件和各種信息。故事不僅僅是事實和事件的集合，故事還包含了重要的信息，這些信息有助于發展對所呈現數據之外的理解和概括。與世界模型不同的是，故事可以被視為具有歷史意義、參考意義或精神意義。故事可以代表價值觀和經歷，這些價值觀和經歷會影響人們的信仰和行為。例子包括宗教或民族故事、神話，以及在任何層次的人群中分享的故事。 ?4. 語境和來源歸因? 語境的定義是圍繞著某個事件并為其自圓其說提供資源的框架。語境可以看作是一種覆蓋的知識結構，調節著它所包含的知識。語境可以是持久的，也可以是短暫的。 ?

持久的語境可以是長期的（比如從西方哲學角度或東方哲學角度獲取的知識），也可以隨著時間的推移、根據新的學習材料而改變。持久語境不會對每個任務進行更改。

當特定的本地語境很重要時，瞬態語境是相關的。單詞是根據其周圍句子或段落的局部語境來解釋的。圖像中感興趣的區域通常在整個圖像或視頻的語境中得到解釋。

持久語境和瞬態語境的結合可以為解釋和操作知識提供完整的設置。 ? 知識的另一個相關方面是數據來源（又名數據追溯），其包括數據來源、在數據傳播的過程中發生了什么以及隨著時間的推移數據將去往何方。人工智能系統不能假設所接收的所有信息都是正確或可信的，尤其是在被稱為“后真相時代”的情況下信息更不可輕易相信。將信息與其來源相關聯可能是建立可信性、可認證性和可追溯性所必需的。 ?5. 價值和優先級（包括善/威脅和倫理）? 知識的所有方面（例如，對象、概念或程序）在整個判斷范圍內都有相對應的價值——從最大的善到最大的惡都有對應。可以假設，人類智力的進化包括追求回報和避免風險（比如，追求吃午餐；避免被當成午餐）。這種風險/回報的關聯與知識緊密相連。潛在的得失具有功利價值；對于實體或潛在的未來狀態，還有一種基于倫理的價值。這種基于倫理的價值反映了一種道德價值觀，即“善”不是基于潛在的有形回報或威脅，而是基于對什么是正確的潛在信念。 ? 價值和優先級是元知識（meta-knowledge），其反映了人工智能系統對知識、行動和結果相關方面的主觀斷定。這為問責制奠定了基礎，應該由負責特定人工智能系統的人認真處理。當人工智能系統與人類互動并做出影響人類福祉的選擇時，潛在的價值和優先級系統很重要。 ?6. 概念參考：消除歧義，統一和跨模態? 知識是以概念為基礎的。例如，“狗”是一個抽象概念——一個有多個名稱（在各種語言中狗的說法都不一樣）、一些視覺特征、聲音聯想等等的概念。然而不管其表現形式和用法如何，“狗”這個概念都是獨一無二的。“狗”的概念被映射到英語單詞“dog”，以及法語單詞“chien”。“狗”的視覺特征可能如下圖： ? ? ? 同時“狗”也和汪汪吠叫聲對應了起來。 ? 概念引用（Concept Reference，簡稱ConceptRef）是與給定概念相關的所有事物的標識符和引用集。概念引用本身實際上不包含任何知識——知識駐留在前面介紹的維度中。概念引用是多維知識庫（KB）的關鍵，因為概念引用融合了概念的所有表象。 ? Wikidata就是集中存儲結構化數據的多維知識庫的一個很好的例子。在Wikidata中，項（items）代表人類知識中的所有事物，包括主題、概念和對象。Wikidata的條目與這個框架中ConceptRef的定義相似——只有一個關鍵的區別：在Wikidata中，術語“項”既指給定的標識符，也指有關標識符的信息；而ConceptRefs 只是帶有指向KB指針的標識符。關于概念的信息則被填充在前面章節中描述的各種視圖中（例如與概念相關的描述性或程序性知識）。 ?常識? 常識知識由隱性信息組成，隱性信息是指廣泛（且為大眾共享）的不成文的假設，人類自動運用這些假設來理解世界。人工智能想要更深入地理解這個世界，將常識應用到情境中是必不可少的。在這個框架中，常識知識被認為是上述六種知識類型的子集。 ?

2?理解與知識類型之間的關系理解是智能的基礎。向更高級機器智能的發展引發了一場關于“理解”的討論。約書亞·本吉奧將擁有人類理解能力的人工智能描述為： ?

明白因果關系，理解世界如何運轉； ?

理解抽象的行為； ?

知道如何使用以上知識去控制、推理和計劃，即使是在新穎的場景中也依然擁有這種能力； ?

解釋發生了什么; ?

out-of-distribution（即OOD，分布外）生成。 ?

而以知識為中心的對理解的定義是：用豐富的知識表示創建世界觀的能力；獲取和解釋新信息以增強這種世界觀的能力；以及對現有知識和新信息進行有效推理、決定和解釋的能力。 ? 這種理解觀點的先決條件是以下四種功能： ?

具備豐富的知識； ?

獲取新的知識； ?

能夠跨實體和關系連接知識實例； ?

對知識進行推理。 ?

理解不是二元屬性，而是因類型和程度而異。這一觀點的核心是知識的本質及其表征——知識結構和模型的表達能力可以促進理解和推理能力快速發展。 ?想象所有的人[和機器]? 正如阿爾伯特·愛因斯坦所觀察到的：“智能的真正標志不是知識，而是想象力。”要真正理解，機器智能必能超越數據、事實和故事。要重建，發現和創造一個可觀察屬性和事件背后的宇宙模型，想象力是必要的。從人工智能系統的角度來看，想象力是通過創造性推理實現的，也就是進行歸納、演繹或溯因推理，并產生不受以往經驗和輸入輸出相關性嚴格規定的新穎結果。 ? 知識表示和推理是人工智能的一個成熟領域，這個領域處理關于世界的信息表示，使計算機系統能夠解決復雜的任務。知識和推理不一定是截然不同的，而是代表了一個從已知到推斷的光譜。機器理解將通過構建知識的能力輔以先進的相關推理（例如，概率推理和似是而非推理、溯及推理、類比推理、默認推理等）來得到實現。 ?建立在深度知識基礎上的神經符號AI? 在使人工智能更有效、更負責任和更高效地為人們提供支持的過程中，我們的目標是使人工智能系統更強大，同時推動人工智能達到更高的認知和理解水平。科學家已經在處理數據、識別模式和尋找轉瞬即逝的相關性方面取得了巨大的進展，但仍有必要思考哪些知識類型能賦予人工智能系統對世界建模和理解世界的能力。 ?

當我們對人工智能獲得更高層次的認知所需要的知識結構的類型有了更深的理解時，我們就可以繼續在這個深度知識的基礎上進行構建，使機器能夠真正地理解世界。

審核編輯：李倩

閱讀全文