在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

小米在行業(yè)圖譜上的探索

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2020-11-24 09:41 ? 次閱讀

導讀:小米知識圖譜于2017年創(chuàng)立,已支持公司了每天億級的訪問,已賦能小愛同學,小米有品、智能問答、用戶畫像、虛擬助手、智能客服等互聯(lián)網(wǎng)產品。通過引入知識圖譜,這些產品在內容理解、用戶理解、實體推薦等方面都有了顯著的效果提升。本文的主要內容包括:

小米知識圖譜介紹:包括小米的商業(yè)模式、小米人工智能部、知識圖譜在人工智能部的定位、小米知識圖譜的發(fā)展歷程、以及小米知識圖譜的落地場景。

小米知識圖譜關鍵技術:小米知識圖譜在成長過程中的技術積累。

小米行業(yè)知識圖譜探索:結合業(yè)務,跟大家分享下小米在行業(yè)圖譜上的探索。

01小米知識圖譜介紹

1.小米知識圖譜介紹

在了解小米知識圖譜之前,先介紹下小米的商業(yè)模式。小米在商業(yè)模式上提出硬件+新零售+互聯(lián)網(wǎng)鐵人三項的商業(yè)模式。這種商業(yè)模式下有像手機、小米音箱類的智能硬件;有米商城,有品電商這樣的新零售;還有像人工智能這樣的互聯(lián)網(wǎng)服務。三者相扶相持,相互促進,是一種閉環(huán)的生態(tài)模式,在這種生態(tài)模式下,有很多潛在的應用場景,對人工智能,對內容和知識有很多訴求。

小米人工智能部已經構建了完整的中臺體系,囊括了視覺、NLP、知識圖譜、語音、深度學習等底層的基礎能力,其中知識圖譜就處于這一層。

中間層是問答服務、智能客服等應用能力層,上層是小愛同學、商城等互聯(lián)網(wǎng)業(yè)務和傳統(tǒng)業(yè)務層,這些都是知識圖譜的落地場景,其中小愛同學是小米公司推出的虛擬人工的智能助理,小愛同學適用于手機、音響、電視、手表以及手環(huán)等穿戴設備,通過搭載小愛同學的智能硬件,可以滿足用戶獲取知識和信息的需求。

小米知識圖譜在中臺體系下不斷的成長,2017年小米知識圖譜有了一些開放知識的積累, 2018年知識圖譜團隊成立,2018年底,通用知識圖譜的構建,百科類圖譜構建完成,2019年中,業(yè)務拓展,線上調用達到近億次,2019年底,知識擴增,知識積累了超三百億,2020年行業(yè)探索,行業(yè)圖譜落地。雖然發(fā)展的比較晚,但是在自己的業(yè)務場景下,發(fā)展還算迅速。

小米知識圖譜在公司的職責,主要是研究開放領域和行業(yè)領域的構建和應用技術,并把圖譜推廣到相關業(yè)務場景上,來提高用戶的滿意度的和業(yè)務變現(xiàn)轉化能力。團隊已構建超三百億開放知識和涉及13個領域。除此之外,小米還參與了一些開放知識圖譜的構建,是OpenKG之OpenBase子項目組主要成員單位,是IEEE知識圖譜國家標準編制組主要成員。

小米知識圖譜已經已經賦能公司10+個業(yè)務場景,這些落地場景包括智能問答、智能客服、小愛同學、虛擬助手、全局搜索、NLP等這樣通用的知識領域。還有像游戲中心、廣告,小米有品,小米網(wǎng)等這樣的行業(yè)知識,下面我會重點介紹一下具體場景的細節(jié)。

2. 應用場景:智能問答

第一個是小米知識圖譜在智能問答場景的應用,這個比較廣泛,落地的設備較多,已服務于手機、音響、智能穿戴、智能車載、電視、兒童設備。應用于小愛音響、小愛同學、小尋手表、車載設備等,滿足用戶近億次/天的請求,后面我們介紹落地場景的示例。

目前,智能問答包括兩種模式:一種是一般問答模式,還有一種是規(guī)則推理的。一般問答場景下,在返回具體答案的同時,還會把關聯(lián)實體的附加信息滿足給用戶,比如用戶詢問鞏俐的籍貫的時候,返回答案不只是會返回山東濟南,還會把問答實體鞏俐的視頻,人物關系,資訊新聞,代表作品等都呈現(xiàn)給用戶,這樣在用戶興趣激發(fā)上起到了很大作用。另外一個古詩詞CASE,也能很好的體現(xiàn)這一點,比如用戶問靜夜思的作者是誰,用戶除了想得到這首詩的作者外,可能還想溫故這首詩,也可能想要了解這首詩的釋義。所以我們會把有聲資源、釋義一并滿足給用戶。

最后,問答在歧義場景下還支持列表形式展現(xiàn)。

除了一般的問答方式以外,小米還支持推理的問答。比如:多條件推理,多跳關系推理,還支持像求最大值,最小值這種基礎推理算子。多條件推理的例子如:山東籍的雙子座是誰,首先會對數(shù)據(jù)庫中人物實體的生日推理出星座是雙子座,然后推出省份,最后篩選聚合產出實體結果 ,第二種是多跳關系推理,比較典型的就是人物與人物的六度關系推理,如:徐志摩與梁思成的兒子梁從誡是什么關系?我們會試圖計算起始實體到目標實體的關系的最短可達路徑呈現(xiàn)給用戶。現(xiàn)有的推理邏方法,比如說基于規(guī)則的推理、基于模型的推理,規(guī)則推理主要包含規(guī)則引擎和一階的邏輯規(guī)則。模型推理是用機器學習去表示學習關系推理。所以這里根據(jù)自己的需求、應用場景和應用情況去選擇。

后面介紹一些基于智能問答的一些方法。基于圖譜的智能問答,通用流程如下:語音識別環(huán)節(jié),意圖識別,實體匹配,實體查詢返回結果。

舉個例子,如武漢大學周邊什么好吃的,首先做分詞或者詞法分析,分出武漢大學和好吃的這些關鍵mention,然后意圖識別計算得到是美食需求的,第三步是實體識別,把mention武漢大學映射到知識圖譜中的實體上,把屬性好吃映射成推薦食物,最后實體查詢計算,返回熱干面,武昌魚,豆皮,油燜大蝦。

小米基于知識問答有很多方法,第一種是基于模版的方法,它的大體流程是這樣的:

第一步對query做實體鏈接(實體鏈接技術在第二部分會詳細介紹),第二步把實體名用實體鏈接后的主實體對應的實體類型替換后去離線的模板庫匹配,返回模板庫中映射后的歸一的模版,最后查詢實體庫返回答案。

舉個例子:

姚明的老婆是誰,第一步先做實體鏈接,后面把姚明的實體類型人物替換姚明,去人物垂域模板規(guī)則庫查詢模板,發(fā)現(xiàn)命中了lambda_x.配偶這個模板。最后在圖譜數(shù)據(jù)國查詢姚明的配偶,返回答案葉莉。這種方法有一個好處就是準確率比較好,是離線挖掘的模板,所以性能也比較好,但是缺點也比較明顯泛化能力差。其中模板的挖掘方法的話,主要是離線從知識圖譜中實體中找目標實體對,然后去問答論壇去匹配問題與答案分別出現(xiàn)的pair,生成模板的pair,這么做會有很多噪聲需要做進一步過濾,比如:需要過濾掉出現(xiàn)多屬性的問答對的情況和頻次出現(xiàn)比較低的情況。

為了解決第一種方法泛化性能比較差的問題,用第二種方式基于槽填充的方式來互補。第一種方法在李白有哪些詩的時候,可以命中模版庫滿足用戶的需求。但是變成李白有名的詩有哪些時,就無法找到答案了。為了解決這種問題,我們用了槽填充和意圖識別聯(lián)合學習的方法方法,借鑒了2016年liu的基于attention的意圖檢測和插槽填充聯(lián)合學習的的方法。該方法把槽填充與意圖識別聯(lián)合的學習,方法包含兩部分槽填充和意圖識別,兩部分組成,第一部分是槽填充問題轉化為序列標注的NER問題,第二步是意圖識別,把意圖識別轉換為文本分類問題。最后把兩個問題整合做一個聯(lián)合學習。PPT右下角已給出論文和代碼。該方法在部分垂哉上的召回的提升比較明顯。在菜譜,古詩垂域上欠召回的badcase解決率為30%

第三種方法是基于子圖檢索,該方法依賴于實體的關系路徑。具體第一步query做實體鏈接,把實體轉化為實體ID,第二步根據(jù)實體周圍的屬性篩選出候選路徑。第三步對輸入文本與候選路徑進行實體語義相似和排序,取top結果。

以姚明老婆的國籍是啥為例子,第一步用實體鏈接找到用到接接到知識圖譜姚明這個實體;第二步就是找到姚明這個實體周邊的候選的屬性路徑,如姚明的配偶的國籍,姚明配偶的身高,姚明配偶的類型,姚明教練的出生日期,姚明隊友的出生地等;第三步用bert計算候選路徑和目標路徑的相似關系,除了相似度外,引入了像類型過濾這樣的條件約束,過濾給出排序分值然后取一個最大值。

以上都是基于圖譜的結構化的問答場景,對于非結構的, 比如:天空為什么是藍色的,怎么控制貓的飲食量,青蛙王子是不是安徒生的童話,這三種為什么,怎么樣,是不是,類型的問題,以上方法無法解決,需要通過基于搜索的FAQ的方式,這里就不介紹了。

3. 應用場景:智能客服

第二個是知識圖譜到智能客服的場景。目前智能客服已經落地小米網(wǎng)和小米金融等業(yè)務場景下。PPT中是智能客服團隊用NL2SQL的方法在基金客服上的一個落地場景。

知識圖譜在智能客服中的技術框圖體系,第一層是數(shù)據(jù)標準化層,主要包括數(shù)據(jù)倉庫,數(shù)據(jù)治理,數(shù)據(jù)融合,第二層是AI引擎層,有實體抽取引擎,屬性集合引擎、知識圖譜引擎等,第三層是數(shù)據(jù)共享交換層,第四層是數(shù)據(jù)服務,數(shù)據(jù)分析等。

4. 應用場景:小米商城&游戲中心

第三個應用場景是在小米商城和游戲中心的應用,目前商品圖譜和游戲圖譜已應用到小米商城,有品商城,游戲中心等業(yè)務下。已落在有品商城/小米商城的場景詞搜索發(fā)現(xiàn)、用戶sug引導、商品評價的用戶觀點的的用戶觀點的抽取及聚合,及游戲的評論的觀點抽取及聚合業(yè)務上。在小米的商品圖譜取得不錯的效果,已助力商品轉化率、用戶購買轉化率及游戲下載率至少有30%的提升。

5. 應用場景:AI虛擬助手

另外小米知識圖譜還在多模態(tài)圖譜應用場景下做了嘗試,與AI虛擬助手合作探索了圖片態(tài)與文本態(tài)實體語義關聯(lián),目前已上線植物識圖的功能,后面會持續(xù)的擴展。小米知識圖譜的落地場景很多,這里只介紹了一部分,后面是小米知識圖譜積累的一些關鍵技術。

02小米知識圖譜關鍵技術

1.小米知識圖譜賦能各業(yè)務場景

目前小米知識圖譜已經具備20+關鍵能力,比如實體鏈接,實體融合,概念圖譜,實體推理,實體分類,知識理解,實體關聯(lián),用戶理解等等,后面挑出實體鏈接,實體融合,概念圖譜挖掘三個關鍵技術和大家分享探討。

2. 關鍵技術:實體鏈接

實體鏈接 ( Entity Linking ),也叫實體鏈指,該任務要求我們將非結構化數(shù)據(jù)中的表示實體的詞語(即所謂mention,對某個實體的指稱項)識別出來,并將從知識庫 ( 領域詞庫,知識圖譜等 ) 中找到mention所表示的那一個實體所以實體鏈接的任務定義:就是給定文本mention,判定指代知識圖譜中的實體首先第一個是實體鏈接 ( Entity Linking )。

舉個例子:

比如說劉德華的天下無賊主題曲那一天是誰唱的,實體鏈接需要把劉德華,天下無賊,那一天三個mention聯(lián)接到知識圖譜的實體上。以方便應用到如主題分析,語義的信息檢索等更深度的應用場景下。

常見的實體鏈接如PPT流程。包括中文的切詞,命名實體識別,候選實體選取,實體消歧,實體排序,判空幾部分。第一步中文切詞有很多方法,比如像結巴等一些開源的工具,我們的做法是整合了已有的實體名、實體同義詞名,及開放錨文本信息做為詞典,用維特比算法構造了切詞功能。除了切詞外我們還用的序列標注的方式做了命名實體識別,把實體詞表與NER的結果合并。

其中NER用的是BERT+CRF。在NER的訓練數(shù)據(jù)集構造上,起初用遠程監(jiān)督的方法構造訓練集的方法,但是發(fā)現(xiàn)在句子中有多個實體詞的情況,遠程監(jiān)督的方式只能標注出部分實體詞,這樣對模型的召回影響比較大。所以我們利用開放比賽的標注數(shù)據(jù)作為數(shù)據(jù)集,再加上部分遠程監(jiān)督的數(shù)據(jù)和人工標注的數(shù)據(jù)作為最終的訓練樣本。這種方式的訓練結果比只有遠程監(jiān)督的樣本訓練的結果提升10個點左右。

接下來第二步是候選實體選取,我們離線挖掘了大量的同義詞,別名,縮寫詞等,放在圖譜實體。命中l(wèi)abel,alias,同義詞,縮寫的作為候選對象。但是調研中發(fā)現(xiàn)過多的候選詞不一定有好的效果,比如:長尾的,互動比較少、豐富度比較少的實體引入會造成很多噪聲并且很影響處理性能。因此我們利用用戶使用的熱度,實體的流行度,實體豐富度等對候選實體做了篩選和過濾。精簡后準確率提升了3%,召回下降0.4%,預測速度提升50%。

接下來是實體消歧,實體排序,判空這三塊。這三塊不好解耦,所以可以一塊來說。這里用到了兩處種特征,第一種是上下文無關的,第二種是語義相關聯(lián)的特征。

上下文無關的特征包含:實體流行度,用戶熱度,實體豐富度等等。語義相關的特征包括三部分:

① 對輸入實體mention預測實體類型, 用到的18年Raiman, J. R., & Raiman, O. M.發(fā)表的"DeepType:用神經網(wǎng)的分類系統(tǒng)演化來做多語言實體鏈鏈接"的方法,該方法基于當我們知道了候選實體的類型之后,這個消歧的任務便被解決得差不多了的假設將實體鏈接過程看成是分類獲取的過程。分類的過程是針對知識庫中的分類體系設計了一個DeepType的預測系統(tǒng)。具體是用輸入數(shù)據(jù)文本通過bert編碼取CLS 位置的向量、候選實體對應開始和結束位置對應的特征向量,三個向量連接,經過全連接層,最后softmax激活得到候選實體的類別得到分類。

② 是DeepMatch部分,參照18年 Le, P., & Titov, I的一種通過候選實體與mention之間的潛在關系建模來提升實體鏈接的效果。該文章提出了將實體鏈接問題轉化為文本語義匹配問題,構建了一個DeepMatch模型來匹配輸入語句的上下文和候選實體的描述信息對。把待消歧文本作為text_a,每個候選實體的SPO全部連接起來組成一段文本text_b,計算text_a和text_b的相關性 。訓練時選取連接到的實體作為正例,在候選實體里選取負例。兩個句子長度最大選取為256,負樣本選取了3個。取CLS 位置向量、候選實體對應開始和結束位置對應的特征向量,三個向量連接經過全連接層,最后sigmoid激活得到候選實體的概率得分。

③ 除了這兩個特征外還有共現(xiàn)、協(xié)同推斷等特征。最后把是否存在多個同義詞指向同一個實體、其他mention是否出現(xiàn)在該實體的信息里、LinkCount、DeepMatch模型的相似度、DeepType模型的相似度等經過MLP得到一個分值,排序取 top1的實體,如果top1的分值大于閾值就判定該實體,如果小于閾值則為空。

小米知識圖譜通過該方法參加了2020CCKS比賽,很榮幸拿到了總決賽的第一名,F(xiàn)1的值達到了0.8954。但是這種方法在我的業(yè)務場景,準確率召回可以達到96%以上。

另外,除了效果,這里在業(yè)務上有會有處理性能的問題,所以這里用到三種方法加速,第一是引用了tensorflow的batching serving,第二是把bert中的transformer 用nvidia的faster Transformer替換,第三是用Fp16的方法量化,這種加速效果比較明顯的QPS從30提升到1200。

3. 關鍵技術:知識融合

第二種關鍵技術,是知識融合,該任務的定義是,給定實體集合,識別并合并等價實體 ( 注:等價定義為待融實體指代了現(xiàn)實世界中同一事物或概念 ) 。舉這個例子,花木蘭電影有來自騰訊,愛奇藝,優(yōu)酷,豆瓣,電視貓, 維基的數(shù)據(jù)。需要把實體化后的小實體,找到歸一組,合并融合生成新的實體,更新至知識庫圖譜中這一過程中稱為知識融合。

基于任務定義,把這種任務,拆解成了實體對齊和實體擇優(yōu)兩部分。

實體對齊的方法目前包含成對的實體對齊,集體實體對齊,大規(guī)模集體實體對齊及知識庫與知識庫之間的模式層的實體對齊。小米著重做的是成對對齊,現(xiàn)在用了就兩種的方法:

第一種方法是傳統(tǒng)的方法,基于觀察的先驗,比如:

① 類別間的屬性重要度是不同的 ( 比如人物中,出生時間,出生地點,性別,職業(yè)很重要;地點類的,經度,緯度很重要;視頻: 上映時間,演員,導演,角色很重要;生物:種屬科目綱很重要等 )。

② 文本中的時間,地點很重要,( 比如一些infoxbox中未覆蓋的事件的時間及地點等 ) 基于這兩個經驗,我用一些tfidf的方法計算一些屬性在不同類中的重要性,并找文本中的時間/地點做為一個重要的文本特征,并計算對應屬性值相似度,目前用對一些相似度主要是一基于字粒度的文文相似度,及token粒度的主題相似度等。

第二種方法用基于embedding的deep Match方法,主要參照了2018年ACM SIGMOD 的方法做了一些改進,該方法把實體中的每個屬性下的O的Value concate成一個句子,通過雙向LSTM等一模型encodeing成向量,計算每個屬性下的emdming的相似度,最后經過一個分類模型,判斷是否是同一個實體。該方法沒有考慮類別中的屬性重要度的差異,所以準確與召回效果都不太理想,我們也在考慮更多的方法嘗試改進。

以上兩種方法是針對對于結構化實體對齊的方法,如果是開放文本要依賴實體鏈接技術。

知識融合第二部實體擇優(yōu),是在經過實體對齊后,把實體屬性的差異性或者沖突性做消解。目前的做法基于以下幾個方面對實體的質量進行控制控制:

實體的更新時效性

權威性,不同來源,權威性不同的,比如,人民網(wǎng)的權威性要比一般咨詢類的站會要高

豐富性,不同來源O的值缺失程度是不同的

共現(xiàn)頻次,當多源有沖突時,可以用投票的選出不同來源中出現(xiàn)最多的屬性

4. 關鍵技術:概念圖譜

概念圖譜的概挖掘目前小米圖譜基本三種方式構建。

第一種是在本體模式層構建了分類體系, 分類體系參照了一些開放的行業(yè)和分類標準,還參考了一些人工整理的行業(yè)的標準體系。

第二種是基于autophrase的方法,是實例層的ISA關系的挖掘,該方法是2017年一篇論文中采用海量文本挖掘的方法,該方法通過主要是用短語挖掘的方法來挖掘概念。這種方法需要滿足四個條件:

流行度:質量短語應該出現(xiàn)的頻率足夠高

一致性:token在高質量短語中的搭配出現(xiàn)的概率明顯高于預期

信息性:短語可以表達一個特定的主題或概念

完備性:一個短語可以在特定的文檔上下文中解釋為一個完整的語義單元

這個模型的訓練用實體的長文本和內容文本、遠程的Wikipedia/cn_probase拿到的開放的的高質量的短語及根據(jù)不同領域標注的高質量的詞語三個輸入作為輸入語料。第二步用n_gram的候選篩選,出正樣本與負樣本,正樣本是N_grame頻率大于閾值和人工標注的領域短語及人工cnproese匹配的高質量短語;剩余是負樣本。由于負樣本中摻雜大量的正樣本,所以后面是從負樣本中使用集成分類器訓練了多個基分器來從負樣本中強化出正樣本。為了保證概念短語的質量,方法通過詞性分析過濾不符合語法的短語。

針對概念挖掘的第三種方法是基于序列標注的方法。分為兩步。第一步做一個分類,針對實體長文本描述進行句子拆分,之后判斷 否有這個概念相關的一個實體詞。第二步使用Bert+BiLSTM+CRF的方式作序列標注,標注出SPO的值。

上面三種方法都是概念挖掘,對于實體與概念的關聯(lián),可以用實體分類的方法把模式層的與實體掛接,用實體鏈接的方法把開放詞中的短語與體掛接。

5. 關鍵技術:自動化構建技術

除些之外呢,小米圖譜還在工程構建已有了一套完成的自動化構建技術,可以支持用戶定制,自動實體化,自動實體關系等。

03小米行業(yè)知識圖譜探索

小米知識圖譜的關鍵技術還有很多,我們在這里只給大家介紹典型的幾個關鍵技術,有興趣的話可以線下交流。最后我們看一下小米知識圖譜在行業(yè)的一些探索。

1. 商品圖譜

第一個業(yè)務場景的探索商品圖譜,主要的應用場景是小米商城,小米品的搜索和推薦場景,目標就是輔助電商平臺精準的搜索。

現(xiàn)在商品圖譜已在商品分類體系的建設、主商品詞提取、商品同義詞挖掘、上下位體系構建、場景概念挖掘五個方向構建完成。其中分類體系是在模式層的構建;主商品詞提取和商品同義詞挖掘用于精確匹配與召回;上下位體系結構用于用戶推薦;場景概念挖掘用于搜索發(fā)現(xiàn)及場景推薦。

場景挖掘以泰國旅游為例,可以與沙灘鞋,電話卡,浮潛裝備等商品有關聯(lián),燒烤場景可能與燒烤架,木炭,食材等商品關聯(lián)。

目前商品圖譜已把這五個方向的數(shù)據(jù)和技術落地到小米商城,有品商城上。用戶轉化率和商品轉化率都有不錯的提升。

2. 上位詞

上位詞挖掘的方法分為三部分:

第一部分是上位詞判定,用bert加上分類模型從用戶日志的query中提取出來確識別是否是商品詞或者上位詞。第二部分通過層次化的分類器,對挖掘到的上位詞合并到分類體系中,這里用的了HMC的多分類器。第三部分是把商品與上位詞關聯(lián),用商品名做texta, 上位詞做textb,把關聯(lián)問題轉化為文本分類問題。

目前用這種方法挖掘出的上位詞,平均每個商品覆蓋10.5個上位詞。

3. 同義詞

商品圖譜涉及到的還有一個就是同義詞挖掘。我們是從商品標題中抽取同義詞,在調研中發(fā)現(xiàn),很多商鋪為了盡可能多的命中搜索詞,會把可能多的把相同相近或者同義的詞堆砌到商品名中。所以基于這個假設,我們把同義詞的挖掘,轉化為一個序列標注問題。

其中訓練數(shù)據(jù)用人工標注+ ( 通用圖譜+同義詞庫 ) 遠程數(shù)據(jù)作為訓練樣本。商品title做為texta, 候選的詞做為textb最后標注出BIOS。因為店鋪除了堆砌到同名商品外,還會打包買一些東西,比如鍋盤墊與炒鍋蓋打包賣,所以這樣做會有準確的問題。為了這種問題,我用了以下三種方法去噪:

檢測上位關系是否沖突,鍋盤墊->餐具->餐墊,炒鍋蓋->鍋具->鍋蓋等

用詞向量相似度

用bert相似度計算分類判斷是否同義

用三種方法過濾后我們的準確率達到94%。

4. 金融圖譜

第二個行業(yè)落地場景,是客服團隊金融圖譜在小米金融信貸及保險等業(yè)務的應用。我們就業(yè)務場景中的身份核實的子功能舉例:

碰撞識別主查核實多個用戶的公司地址是否為同一公司

關聯(lián)方探查,是判斷申請貸人與信息是否一致

后面就是金融知識圖譜的框圖:

除了商品及游戲及金融行業(yè)的應用外,我們在更多的行業(yè)圖譜的落地及更多的通用圖譜的應用場景也在持續(xù)探索中。

04總結

簡單總結下,小米知識圖譜已構建超百億的知識,落地10+的業(yè)務場景,擁有20+個技術能力,擁有成熟的自動化構建流程,小米知識圖譜已有多個行業(yè)知識圖譜落地。最后,歡迎大家體驗/使用小愛同學等小米的產品,也歡迎大家吐槽!

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1792

    文章

    47445

    瀏覽量

    239052
  • 小米
    +關注

    關注

    70

    文章

    14367

    瀏覽量

    144438
  • 知識圖譜
    +關注

    關注

    2

    文章

    132

    瀏覽量

    7718

原文標題:知識圖譜在小米的應用與探索

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    光譜看譜鏡分析圖譜

    火電廠材質分析看譜鏡圖譜
    發(fā)表于 12-06 15:02 ?0次下載

    請問ADC的電源產生的噪聲為何會反應在ADC輸出數(shù)據(jù)的頻譜上

    請問ADC的電源產生的噪聲為何會反應在ADC輸出數(shù)據(jù)的頻譜上,有沒有講這類原理的書? 因為看了很多論文,只是給出了結論,沒有說為什么。 求大家推薦一本書,謝謝。
    發(fā)表于 12-05 08:09

    58大新質生產力產業(yè)鏈圖譜

    大躍升 的先進生產力。 58大新質生產力產業(yè)鏈圖譜 01 元宇宙產業(yè)圖譜 02 算力產業(yè)圖譜 03 數(shù)商產業(yè)圖譜 04 人形機器人產業(yè)圖譜
    的頭像 發(fā)表于 11-09 10:16 ?392次閱讀
    58大新質生產力產業(yè)鏈<b class='flag-5'>圖譜</b>

    TLV320AI3101在錄音播放出來的聲音頻譜上可以明顯看出有斷篇和失真破音,怎么解決?

    你好,我們現(xiàn)在錄音播放出來的聲音頻譜上可以明顯看出有斷篇和失真破音的問題。在比較嘈雜的環(huán)境 錄音。 相關硬件接口如圖,問題出在寄存器配置嗎?這方面是菜鳥,請高手知道
    發(fā)表于 11-04 06:36

    革新未來智能版圖,神州數(shù)碼榮登IDC生成式AI圖譜

    6月19日,國際權威市場研究機構IDC正式發(fā)布了《2024年第二季度生成式AI生態(tài)圖譜》,其中,神州數(shù)碼憑借在生成式AI領域的領先布局,以其深度整合算力、模型、知識與應用的核心能力,成功占據(jù)生態(tài)圖譜
    的頭像 發(fā)表于 07-29 15:20 ?419次閱讀
    革新未來智能版圖,神州數(shù)碼榮登IDC生成式AI<b class='flag-5'>圖譜</b>

    萬里紅入選《嘶吼2024網(wǎng)絡安全產業(yè)圖譜》8個細分領域

    近日,國內信息安全領域權威媒體嘶吼正式發(fā)布了《嘶吼2024網(wǎng)絡安全產業(yè)圖譜》(以下簡稱“網(wǎng)絡安全產業(yè)圖譜”)。本次網(wǎng)絡安全產業(yè)圖譜通過市場調研、數(shù)據(jù)精析、文獻研究及政策參考等多方面的綜合分析,全面
    的頭像 發(fā)表于 07-23 14:42 ?868次閱讀
    萬里紅入選《嘶吼2024網(wǎng)絡安全產業(yè)<b class='flag-5'>圖譜</b>》8個細分領域

    smartconfig android手機連接小米pro路由配網(wǎng)失敗怎么解決?

    iphone 配網(wǎng)可以成功連接iphone 可以成功連接其他路由器,并配網(wǎng)成功, 更換多個android 設備 都是均發(fā)生該問題 路由是小米pro路由器連接的是2.4信號
    發(fā)表于 07-19 11:49

    知識圖譜與大模型之間的關系

    在人工智能的廣闊領域中,知識圖譜與大模型是兩個至關重要的概念,它們各自擁有獨特的優(yōu)勢和應用場景,同時又相互補充,共同推動著人工智能技術的發(fā)展。本文將從定義、特點、應用及相互關系等方面深入探討知識圖譜與大模型之間的關系。
    的頭像 發(fā)表于 07-10 11:39 ?1113次閱讀

    小米su7雙表盤相關的破解版資料

    有沒有大神知道小米su7雙表盤相關的破解版資料
    發(fā)表于 07-04 11:04

    維智科技入選《2024中國數(shù)據(jù)智能產業(yè)圖譜1.0》

    近日,數(shù)據(jù)猿與上海大數(shù)據(jù)聯(lián)盟聯(lián)合發(fā)布了《2024中國數(shù)據(jù)智能產業(yè)圖譜1.0》,旨在以大數(shù)據(jù)與AI為代表的智能技術為主要視角,聚焦全產業(yè)鏈為業(yè)內提供更為專業(yè)直觀的行業(yè)指導。維智科技憑借在政務數(shù)字化
    的頭像 發(fā)表于 06-14 19:27 ?1011次閱讀
    維智科技入選《2024中國數(shù)據(jù)智能產業(yè)<b class='flag-5'>圖譜</b>1.0》

    2024年小米汽車產業(yè)鏈分析及新品上市全景洞察報告

    汽車仍在不斷探索和創(chuàng)新,以期在競爭激烈的汽車市場中脫穎而出。文章強調,小米汽車需要充分發(fā)揮其核心優(yōu)勢,積極應對市場挑戰(zhàn),加大研發(fā)投入,提升技術實力,并塑造良好的品牌形象,以贏得消費者的信任和支持。未來
    發(fā)表于 03-29 13:46

    家電行業(yè)探索大模型應用,落地仍面臨挑戰(zhàn)

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)過去一年,各個行業(yè)都在探索大模型的應用。家電行業(yè)也不例外,在近日舉行的AWE2024上,海信、長虹等不少品牌都展示出了與大模型結合的產品。大模型在家電行業(yè)
    的頭像 發(fā)表于 03-21 01:32 ?3016次閱讀

    小米SU7電動汽車即將推出,涵蓋入門級至豪華級

    雷軍曾公開承諾,要盡全力做好小米汽車,不讓消費者失望。作為公司首款汽車,SUV7 承擔著樹立小米品牌形象及奠定未來發(fā)展基石的重任。據(jù)了解,SUV7 的實力將為小米后續(xù)產品打下堅實基礎,助推小米
    的頭像 發(fā)表于 03-13 09:38 ?587次閱讀

    熱重分析儀圖譜怎么分析?#熱重分析儀 #tga熱重分析儀 #圖譜分析

    分析儀分配圖譜
    南京大展檢測儀器
    發(fā)布于 :2024年02月29日 17:08:54

    利用知識圖譜與Llama-Index技術構建大模型驅動的RAG系統(tǒng)(下)

    對于語言模型(LLM)幻覺,知識圖譜被證明優(yōu)于向量數(shù)據(jù)庫。知識圖譜提供更準確、多樣化、有趣、邏輯和一致的信息,減少了LLM中出現(xiàn)幻覺的可能性。
    的頭像 發(fā)表于 02-22 14:13 ?1239次閱讀
    利用知識<b class='flag-5'>圖譜</b>與Llama-Index技術構建大模型驅動的RAG系統(tǒng)(下)
    主站蜘蛛池模板: 中国videos偷窥| 色噜噜噜噜色| 免费h视频| 久操精品在线观看| 69国产视频| 国产午夜精品久久久久免费视小说| mide-776中文字幕在线| 国产一卡2卡3卡四卡精品网站| 日韩一级影院| 欧美日韩生活片| 日韩毛片免费视频一级特黄| 日本中文字幕在线播放| 国内一区二区| 91午夜在线观看| 国产精品午夜在线观看| 色天天综合网| 午夜香蕉网| 免费一级黄色录像| 人人干天天干| 手机看片免费福利| 午夜国产高清精品一区免费| 天天操天天射天天爽| 国产精品久久久久久久牛牛| h网站在线播放| 在线观看黄色一级片| 色色就色色| 国产真实乱偷人视频| 天天综合色天天综合网| 在线观看免费午夜大片| 美女视频黄a视频美女大全| 精品国产自在现线看久久| 一级特黄色片| 免费日韩网站| 1024成人| 午夜影院在线观看| 狠狠干天天色| 777奇米影音| 俺要操| 日本口工禁漫画无遮挡全彩| 日本不卡视频一区二区三区| 亚洲国产色婷婷精品综合在线观看|