在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

通用領域大規模條件性知識圖譜數據集

深度學習自然語言處理 ? 來源:哈工大SCIR 張寧 ? 作者:哈工大SCIR 張寧 ? 2021-06-08 15:23 ? 次閱讀

1.摘要

本數據集由哈爾濱工業大學社會計算與信息檢索研究中心(哈工大SCIR)秦兵教授和劉銘教授主持開發,是一個通用領域大規模條件性知識圖譜數據集。本數據集源自于AG News文本分類語料,包含四個類別,2440 條數據,每條數據都是人工標注的條件知識圖譜。該數據集的提出能夠為條件性知識圖譜的研究提供數據支持。

2.條件性知識圖譜

在大多數情況下,事實的成立都是有條件的。條件和事實起著同樣重要的作用,然而目前的知識圖譜只關注事實而忽略了條件的存在。與此同時,信息提取技術也只關注從給定文本中提取事實,而忽略了條件信息。

為了能夠讓知識圖譜建模條件信息更加充分,我們提出了一個三層的網絡結構條件性知識圖譜(Conditional-KG)。條件性知識圖譜和傳統知識圖譜都是由三元組組成,但是條件性知識圖譜同時包含事實元組和條件元組,以及元組之間的條件關系。

3.數據集

為了支持條件性知識圖譜的研究,我們手動標注了一個條件性知識圖譜數據集。我們選擇了AG News文本分類語料作為條件性知識圖譜的語料。AG News語料具有三大優勢:

AG News中的數據是新聞的標題和一部分正文,每條數據平均包含2.1個句子、6.4個元組和3.5個條件關系;

AG News中的數據具有完整的語法結構,長度較長,語言嚴謹,代詞、口語、習語等較少。

AG News的文本數量足夠大,多樣性豐富。它包含12萬條訓練數據和7600條測試數據,涉及World、Sports、Business、 和Sci/Tech四個類別。

我們標注的數據集追求信息的完整性和元組的原子性。完整性的意思是標注者應該嘗試從句子中提取所有斷言和條件,我們將原子性定義為每個元組必須是一個不可分割的單元。只要有可能,標注者必須從帶有連詞的句子中提取多個原子元組。

我們通過兩輪標注最終得到了人工標注的通用領域條件性知識圖譜數據集。本數據集源自于AG News文本分類語料,包含四個類別,2440 條數據,每條數據都是人工標注的條件知識圖譜。

4.結語

為了建模條件信息,我們提出了一個具有三層網絡結構的條件性知識圖譜,并且為社區貢獻了一個人工標注的通用領域大規模條件性知識圖譜。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24743
  • 知識圖譜
    +關注

    關注

    2

    文章

    132

    瀏覽量

    7718

原文標題:賽爾筆記 | 通用領域條件性知識圖譜數據集

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    三星自主研發知識圖譜技術,強化Galaxy AI用戶體驗與數據安全

    據外媒11月7日報道,三星電子全球AI中心總監Kim Dae-hyun近日透露,公司正致力于自主研發知識圖譜技術,旨在進一步優化Galaxy AI的功能,提升其易用性,并加強用戶數據的隱私保護。
    的頭像 發表于 11-07 15:19 ?657次閱讀

    通用汽車中國裁員并籌劃大規模業務改革

    據外媒最新報道,通用汽車(GM)正在中國市場進行一系列重大調整,以應對全球最大汽車市場的快速變化。知情人士透露,通用汽車已啟動裁員計劃,并計劃在未來幾周內與合作伙伴上汽集團會面,共同探討更大規模的結構性改革方案。
    的頭像 發表于 08-14 16:24 ?434次閱讀

    三星電子將收購英國知識圖譜技術初創企業

    在人工智能技術日新月異的今天,三星電子公司再次展現了其前瞻性的戰略布局與技術創新實力。近日,三星正式宣布完成了對英國領先的人工智能(AI)與知識圖譜技術初創企業Oxford Semantic Technologies的收購,此舉標志著三星在提升設備端AI能力、深化個性化用戶體驗方面邁出了重要一步。
    的頭像 發表于 07-18 14:46 ?547次閱讀

    知識圖譜與大模型之間的關系

    在人工智能的廣闊領域中,知識圖譜與大模型是兩個至關重要的概念,它們各自擁有獨特的優勢和應用場景,同時又相互補充,共同推動著人工智能技術的發展。本文將從定義、特點、應用及相互關系等方面深入探討知識圖譜與大模型之間的關系。
    的頭像 發表于 07-10 11:39 ?1113次閱讀

    Al大模型機器人

    理解能力強大: AI大模型機器人可以理解和生成自然語言,能夠進行復雜的對話和語言任務。它們能夠識別語言中的語義、語境和情感,并據此作出適當的回應。廣泛的知識儲備: 這些模型基于大規模數據
    發表于 07-05 08:52

    40億,今年芯片領域大規模融資誕生

    或許,遲到的IPO就要來了就在5月底,國家集成電路產業投資基金三期股份有限公司正式成立,規模為3440億元人民幣,是最大規模的芯片基金。該消息的傳出猶如一支強心劑,扎在了芯片領域各個企業心上。彼時
    的頭像 發表于 06-26 08:04 ?425次閱讀
    40億,今年芯片<b class='flag-5'>領域</b>最<b class='flag-5'>大規模</b>融資誕生

    大模型應用之路:從提示詞到通用人工智能(AGI)

    鋪平道路。 基于AI大模型的推理功能,結合了RAG(檢索增強生成)、智能體(Agent)、知識庫、向量數據庫、知識圖譜等先進技術,我們向實現真正的AGI(通用人工智能)邁出了重要步伐。
    的頭像 發表于 06-14 10:20 ?2277次閱讀
    大模型應用之路:從提示詞到<b class='flag-5'>通用</b>人工智能(AGI)

    專用集成電路都是大規模的嗎為什么呢

    專用集成電路(Application Specific Integrated Circuit,ASIC)是根據特定應用領域的需求而設計和定制的集成電路。與通用集成電路相比,專用集成電路具有更高
    的頭像 發表于 04-21 09:15 ?551次閱讀

    專用集成電路都是大規模的嗎

    Integrated Circuit,簡稱GPIC)相比,專用集成電路更加定制化和特定化,因此常被視為大規模的集成電路。但是,并不是所有的專用集成電路都是大規模的,這取決于具體的設計需求和應用場景。 在
    的頭像 發表于 04-19 14:39 ?502次閱讀

    專用集成電路都是大規模的嗎對嗎

    。與通用型集成電路(General Purpose Integrated Circuit,簡稱GPIC)相比,專用集成電路在特定的應用領域中更為專注和高效。在關于專用集成電路是否都是大規模的這個問題上,答案
    的頭像 發表于 04-14 10:45 ?537次閱讀

    名單公布!【書籍評測活動NO.30】大規模語言模型:從理論到實踐

    為目的。國內的文心一言就屬于這一類。 垂直大模型,聚焦解決垂直領域問題,是在通用大模型的基礎上訓練行業專用模型,應用到金融、醫療、教育、養老、交通等垂直行業,使大模型領域化、商業化,做到實際應用落地
    發表于 03-11 15:16

    大規模數據中心網絡演進的七大主流趨勢

    自動駕駛已經變成可能,大規模應用只是一個時間問題。大規模網絡運維的自動化也必然是業界的趨勢,要達到自動駕駛或自動化運維都需要兩個共同的條件:一是有足夠有效的數據,二是要有對
    發表于 03-11 11:21 ?506次閱讀

    利用知識圖譜與Llama-Index技術構建大模型驅動的RAG系統(下)

    對于語言模型(LLM)幻覺,知識圖譜被證明優于向量數據庫。知識圖譜提供更準確、多樣化、有趣、邏輯和一致的信息,減少了LLM中出現幻覺的可能性。
    的頭像 發表于 02-22 14:13 ?1239次閱讀
    利用<b class='flag-5'>知識圖譜</b>與Llama-Index技術構建大模型驅動的RAG系統(下)

    Harvard FairSeg:第一個用于醫學分割的公平性數據

    為了解決這些挑戰,我們提出了第一個大規模醫學分割領域的公平性數據, Harvard-FairSeg。該數據
    的頭像 發表于 01-25 16:52 ?572次閱讀
    Harvard FairSeg:第一個用于醫學分割的公平性<b class='flag-5'>數據</b><b class='flag-5'>集</b>

    自動駕駛領域數據匯總

    發自動駕駛論文哪少的了數據,今天筆者將為大家推薦一篇最新的綜述,總結了200多個自動駕駛領域數據,大家堆工作量的時候也可以找一些小眾的
    的頭像 發表于 01-19 10:48 ?1022次閱讀
    自動駕駛<b class='flag-5'>領域</b>的<b class='flag-5'>數據</b><b class='flag-5'>集</b>匯總
    主站蜘蛛池模板: 亚洲午夜久久久精品影院视色| 天天想夜夜操| 天天色天天干天天| 婷婷天堂| 西西人体44renti大胆亚洲| 狠狠的日视频| 四虎黄色网址| 国产精品第一页在线观看 | 绝色村妇的泛滥春情| 西西午夜影院| 98pao强力打造高清免费| 精品久久久久久午夜| 午夜精品在线视频| 高清国产在线| 久久三级国产| 欧美一级高清免费播放| 深夜大尺度视频在线观看| 三级黄页| 色视频在线免费看| 四虎在线永久免费视频网站| 亚洲欧美成人在线| 四虎国产| 六月丁香六月婷婷| 免费看很黄很色裸乳视频| 青草青青视频| 日韩毛片网站| 色偷偷女男人的天堂亚洲网| 天堂bt种子资源地址在线| 亚洲综合色吧| 亚洲爽爽网站| 日韩伦| 黄色美女网站免费看| 亚洲最大毛片| 午夜视频在线免费看| 午夜香蕉网| 国产午夜精品福利| 国产精品夜夜春夜夜爽| 成 人 免费 黄 色 视频| 成人午夜久久| 免费亚洲一区| 国产精品一级香蕉一区|