(文章來源:十輪網(wǎng))
為了滿足智能助理需要執(zhí)行越來越多復雜任務的需求,Google發(fā)布了最新的架構(gòu)引導對話(Schema-Guided Dialogue,SGD)數(shù)據(jù)集,以擴展智能助理模型,使其有能力處理多重領(lǐng)域的任務。
現(xiàn)在的智能助理可以完成的任務越來越多,包括預定餐廳或是截取網(wǎng)絡(luò)消息等,Google提到,像是Google助理這類智能助理集成了眾多領(lǐng)域的服務,每個服務可能由不同領(lǐng)域的服務疊加而成。為了適應這樣的發(fā)展,讓智能助理能夠支持更多的新服務,而不需要收集額外的數(shù)據(jù)或是重新訓練模型,降低維護成本。因此Google發(fā)布SGD數(shù)據(jù)集,來填補訓練智能助理處理復雜與大規(guī)模任務所需要的數(shù)據(jù)集空缺。
SGD數(shù)據(jù)集是目前最大的任務導向?qū)υ捳Z料庫,Google使用綠野仙蹤(Wizard of Oz)方法產(chǎn)生人類與助理的對話,共包含跨17個領(lǐng)域18,000個對話,并附加了不同的注解。這些對話涉及與服務和API的交互,包括銀行服務、事件、日歷甚至是天氣等17個領(lǐng)域,而在多數(shù)的領(lǐng)域,SGD數(shù)據(jù)集包含多個不同的API,不少API接口不同但是功能重復,以反應實際的狀況。
Google表示,SGD數(shù)據(jù)集是第一個涵蓋這么多領(lǐng)域,會為每個領(lǐng)域都提供多個API的數(shù)據(jù)集,而且為了量化模型對API接口更新或是新API的強健性,評估數(shù)據(jù)集包含了許多在訓練數(shù)據(jù)集中,所沒有的新服務。
用戶使用SGD數(shù)據(jù)集,可以訓練智能助理支持網(wǎng)頁的多樣服務,Google提到,要完成這個目的,通常需要一個大型的主要架構(gòu)(Master Schema),羅列所有支持的功能和參數(shù),但實際上,要開發(fā)適合所有使用案例的主架構(gòu)非常困難,而且即便克服了這項障礙,主架構(gòu)也可能會讓新的或是小型服務的集成變得復雜,進而增加智能助理的維護成本。
而且不少服務之間使用相似的概念,像是訂票服務,電影票、機票和演奏會門票邏輯都相似,但使用主架構(gòu)的方法,就會不方便對這類概念進行連接建模,除非以手動的方式定義之間的映射。
Google提出了一個新的架構(gòu)引導方法解決這些問題,這個新方法不需要為智能助理定義一個主架構(gòu),而是為每個服務或是API,提供功能與相關(guān)屬性列表的自然語言描述,這些描述可以用于學習一個架構(gòu)的分布式語義表達,為對話系統(tǒng)提供額外的輸入,并將對話系統(tǒng)以單個統(tǒng)一的模型實例,這個統(tǒng)一模型為不同服務提供相似概念的表示,并通過架構(gòu)的分布式表達,使得新服務可以不需要事先有訓練數(shù)據(jù)就能運行。
Google為此還以架構(gòu)引導方法創(chuàng)建了一個智能助理,在所有服務和領(lǐng)域使用單一模型,沒有設(shè)置各領(lǐng)域的專門參數(shù),就能處理各式任務,Google開源了用于對話狀態(tài)關(guān)注的模型,可以在新服務和API沒有訓練數(shù)據(jù)的情況下,同時保有與常規(guī)設(shè)置相同的能力。
(責任編輯:fqj)
-
谷歌
+關(guān)注
關(guān)注
27文章
6177瀏覽量
105685 -
AI
+關(guān)注
關(guān)注
87文章
31287瀏覽量
269643
發(fā)布評論請先 登錄
相關(guān)推薦
評論