在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

COG數據集基于一種編程語言

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-03-23 15:54 ? 次閱讀

在認知心理學和神經科學中豐富的視覺推理和記憶傳統的啟發下,我們開發了一個人工的、可配置的視覺問題和答案數據集(COG),用于在人類和動物中進行平行實驗。COG比視頻分析的一般問題要簡單得多,但它解決了許多與視覺、邏輯推理和記憶有關的問題——這些問題對現代的深度學習架構來說仍然具有挑戰性。

可以這樣說,人工智能中一個令人煩惱的問題是對發生在復雜的、不斷變化的視覺刺激中的事件進行推理,比如視頻分析或游戲。在認知心理學和神經科學中豐富的視覺推理和記憶傳統的啟發下,我們開發了一個人工的、可配置的視覺問題和答案數據集(COG),用于在人類和動物中進行平行實驗。COG比視頻分析的一般問題要簡單得多,但它解決了許多與視覺、邏輯推理和記憶有關的問題——這些問題對現代的深度學習架構來說仍然具有挑戰性。此外,我們還提出了一個深度學習架構,它在其他診斷VQA數據集(例如CLEVR)和COG數據集的簡單設置上表現得非常出色。然而,一些COG的設置會導致數據集變得越來越難以進行學習。訓練結束后,該網絡可以零次泛化到許多新任務中。對在COG上訓練的網絡架構的初步分析表明,該網絡以一種人類可解釋的方式完成了任務。

圖1:來自COG數據集的圖像和指令樣本序列。COG數據集中的任務對目標識別、關系理解以及記憶的操作和調整以解決問題。每個任務都可以涉及當前圖像和之前圖像中所顯示的目標。 需要注意的是,在最后一個樣本中,指令涉及的是“last”,而不是“last b”。前者排除圖像中當前的“b”。(白色箭頭)顯示了每個圖像的目標指示響應。為了清晰起見,使用高分辨率圖像和適當的英語表示。

人工智能的一個主要目標是建立一個能夠強大且靈活地推理出感官環境的系統。視覺提供了一個非常豐富和高度適用的領域,用以鍛煉我們建立一個能夠對復雜刺激物形成邏輯推理的系統的能力。研究視覺推理的一個途徑是視覺問題回答(VQA)數據集,其中,模型學習該如何正確回答關于靜態圖像的具有挑戰性的自然語言問題。雖然在這些多模態數據集的研究上取得了非常顯著的成果,但這些數據集突出顯示了當前方法所存在的若干局限性。首先,在VQA數據集上進行訓練的模型的訓練程度無法確定,僅僅是遵循圖像中固有的統計信息,而不是對問題的邏輯組成部分進行推理。其次,這些數據集避免了時間和記憶的復雜性,而這兩個因素在智能體設計、視頻的分析和總結中具有至關重要的作用。

圖2:組合型COG數據集的生成。COG數據集基于一組操作符(A),它們被組合以形成各種任務圖形(B)。(C)通過指定圖形中所有運算符的屬性來對任務進行實例化。任務實例用于生成圖像序列和語義任務指令。(D)正向執行圖形和圖像序列以執行常規任務。(E)生成一致的、具有最小偏差的圖像序列需要以逆向拓撲順序反向通過圖形,并按逆時間順序通過圖像序列。

為了解決VQA數據集中有關空間關系的邏輯推理所存在的不足,Johnson及其同事最近提出使用CLEVR直接對基本視覺推理模型進行測試,以便與其他VQA數據集一起使用。CLEVR數據集提供了人工的、靜態的圖像以及有關這些圖像的自然語言問題,從而鍛煉模型執行邏輯和視覺推理的能力。最近的研究結果表明,網絡以接近完美的精確度取得了令人印象深刻的性能表現成績。

在這項研究中,我們解決了視覺推理中關于時間和記憶的第二個局限性問題。推理智能體必須記住其視覺歷史的相關部分,忽略不相關的細節,根據新的信息更新和操作記憶,并在接下來的時間里利用此記憶做出決策。我們的方法是創建一個人工數據集,它具有時間變化數據中所存在的許多復雜性,同時也避免了在處理視頻時所遇到的許多視覺復雜性和技術難度性問題(例如,視頻解碼、跨時間平滑幀的冗余)。特別是,我們從認知心理學(cognitive psychology)和現代系統神經科學(modern systems neuroscience)的幾十年研究中獲得靈感,在這些領域中,長期以來都是將視覺推理解剖為基于空間和邏輯推理、記憶組合性和語義理解的核心組件。為了實現這一目標,我們建立了一個人工數據集—COG,能夠執行與人類認知實驗同時進行的視覺推理。

圖3:所提出網絡的架構圖

COG數據集基于一種編程語言,該語言構建一系列任務三元組:一個圖像序列、一個語言指令和一系列正確的答案。這些隨機生成的三元組在大量任務中進行視覺推理,并需要文本的語義理解、序列中每個圖像的視覺感知以及工作記憶,從而確定隨時間不同變化的答案(如圖1所示)。我們對編程語言中的若干個參數進行了強調,從而使研究人員能夠將問題難度按照從容易到具有挑戰性進行設置調整。

最后,我們引入了一個多模態循環體系結構,用于進行記憶視覺推理。該網絡將語義和視覺模塊與狀態控制器相結合,對視覺注意力和記憶進行調節,以便正確執行視覺任務。經過一系列的研究,我們證明這個模型在CLEVR數據集上達到了近乎最先進的性能表現。此外,該網絡提供了一個強大的基線,可以在一系列設置中的COG數據集上實現良好的性能表現。通過消融研究和網絡動力學分析,我們發現該網絡采用的是人類可解釋的注意力機制來解決這些視覺推理任務的。我們希望COG數據集、相應的體系結構以及相關的基線能夠為隨時間變化的視覺刺激推理的研究提供有用的基準。

圖4:通過單個CLEVR樣本的注意力和輸出,對提出網絡的思考過程進行可視化。(A)來自CLEVR驗證集的樣本問題和圖像。(B)每個思考步驟的有效特征注意力圖。(C)相對空間注意力圖。(D)語義注意力。(E)前五名的語言輸出。紅色和藍色分別表示更強和更弱。在同時關注到“小金屬球體”的特征注意力和“紅色橡膠物體后面”的空間注意力之后,在語言輸出中反應了有關物體的顏色(黃色)。后來在思考過程中,網絡關注了“大啞光球”的特征注意力,而同時語言輸出中出現了正確答案(yes)。

在該項研究中,我們建立了一個合成的、組合型數據集,該數據集需要一個系統能夠基于英語指令對圖像序列執行各種任務。我們COG數據集中包含的任務,測試了一系列認知推理技能,尤為重要的是,這需要對過去的目標有顯式記憶(explicit memory)。該數據集擁有最小偏差和高度可配置性,旨在通過大量的指定性任務生成豐富的性能指標。

我們還構建了一個循環神行網絡模型,該模型利用注意力機制和門控機制,以一種自然的,且具有人性化的方式處理COG數據集。除此之外,該模型還在另一個名為CLEVR的視覺推理數據集上實現了近乎最先進的性能表現。該模型使用循環控制器來關注圖像和指令的不同部分,并以一種迭代的方式生成語言輸出。這些迭代注意力信號為模型的逐步思考過程提供了多個窗口,并為模型該如何將復雜的指令分解為更小的計算提供了線索。最后,該網絡可以即刻泛化到完全未經訓練的任務上,從而展現出對新任務的零次學習(zero-shot)能力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編程語言
    +關注

    關注

    10

    文章

    1949

    瀏覽量

    34851
  • 人工智能
    +關注

    關注

    1792

    文章

    47514

    瀏覽量

    239250
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24753

原文標題:紐約大學聯合谷歌大腦提出「COG」數據集,可提高系統的「視覺推理」能力

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    C語言編程(免費版)

    C語言編程(免費版)
    發表于 08-20 17:29

    C語言編程技巧程序

    本帖最后由 lee_st 于 2016-11-7 09:59 編輯 C語言編程技巧程序1
    發表于 11-07 09:58

    C語言編程技巧程序

    C語言編程技巧程序:dos命令擴充,給硬盤加鎖,外設的軟鎖和解除,DIR功能擴充,鼠標在程序設計中的應用等內容。
    發表于 08-04 15:14 ?107次下載
    C<b class='flag-5'>語言</b><b class='flag-5'>編程</b>技巧程序<b class='flag-5'>集</b>

    C語言編程

    電子發燒友網為大家提供了C語言編程,希望對您有所幫助,本站資源全是免費,如果您覺得本站不錯,請把電子發燒友網推薦給您的朋友!
    發表于 11-07 17:33 ?0次下載

    基于圖形化編程語言Labview的一種虛擬儀器的實現

    基于圖形化編程語言Labview的一種虛擬儀器的實現。
    發表于 01-20 16:26 ?19次下載

    一種數據混合累加電路設計

    一種數據混合累加電路設計_胡浩
    發表于 01-07 20:49 ?4次下載

    編程能力是一種解決問題的能力

    編程能力是一種解決問題的能力。如果問題沒能被很好地解決,知道再多也沒用。 編程能力是一種運用機器解決問題的能力。首先是要判斷問題在什么程度上可被機器解決,比如理論計算機科學會告訴我們什
    發表于 10-12 10:52 ?0次下載

    arduino用什么語言編程

    Arduino使用C/C++編寫程序,雖然C++兼容C語言,但這是兩語言,C語言一種面向過程的編程
    發表于 11-08 15:21 ?7w次閱讀

    Java編程和c語言一種更有優勢_C語言與JAVA的區別是什么

    軟件開發編程語言多達600余種,每種都有各自的特點和應用領域。目前,在國內,最熱的幾門編程語言無外乎Java、C、C++了,Java和C同為面向對象
    的頭像 發表于 02-05 17:23 ?2.5w次閱讀

    vb編程語言是做什么用的_VB編程語言有哪些

    編程語言(programming language),是用來定義計算機程序的形式語言。它是一種被標準化的交流技巧,用來向計算機發出指令。一種
    的頭像 發表于 03-13 16:52 ?8.3w次閱讀

    機器學習中最流行的10編程語言

    去學習一種新的編程語言呢?如果作為名機器人學新人,你當然會想學習一種確實對你的職業生涯很有用的編程
    的頭像 發表于 01-01 11:02 ?3970次閱讀

    2021年程序員必學的五編程語言

    如果您是編程新手,不知道從哪里開始,這篇文章正好適合您。現在有超過100編程語言(Goolge說有700多種),所以有很多選擇。選擇第一種
    的頭像 發表于 03-01 15:52 ?8225次閱讀

    Python是一種什么語言,它可以用來做些什么

    智慧人生,首選Python Python是一種什么語言? Python是一種計算機程序設計語言。你可能已經聽說過很多種流行的編程
    發表于 04-12 10:56 ?1297次閱讀

    Python編程語言屬于什么語言

    Python編程語言屬于高級編程語言中的一種。它是一種通用、面向對象、解釋型
    的頭像 發表于 11-22 14:31 ?1572次閱讀

    編程語言之間的區別和聯系

    、背景和發展 Python:Python由Guido van Rossum于上世紀90年代初開發,以其簡潔、易讀的語法和豐富的第三方庫而受到廣泛歡迎。它是一種高級編程語言,尤其擅長數據
    的頭像 發表于 02-05 14:16 ?1659次閱讀
    主站蜘蛛池模板: 狠狠色噜噜狠狠狠狠97老肥女| 欧美高清免费一级在线| 欧美福利片在线观看| 天天看片天天操| 超级碰碰青草免费视频92| 理论片午午伦夜理片影院99| 另类激情网| 在线亚洲成人| 黄色录像视频网站| 久久semm亚洲国产| 国产精品虐乳在线播放| 网女色| 欧美性猛交xxxx乱大交高清| 爱综合网| 色西西| 高清精品女厕在线观看| 色极影院| 色综合色综合色综合色综合网| 成人网在线看| 免费毛片软件| 国产一级片免费| 福利社91| 天天射天天操天天色| 操日韩| 美女扒开尿口给男的桶个爽| 人人干狠狠干| 美女黄网站人色视频免费国产| 一区二区三区四区在线不卡高清| 亚洲人成在线精品不卡网| 亚洲码在线| 天堂网在线最新版官网| 六月丁香六月婷婷| 亚洲精品久久久久午夜| 在线观看永久免费| 永久在线观看视频| 国产理论在线| 中文字幕在线观看日剧网| 日本美女黄视频| www黄色大片| 国产精品福利午夜h视频| 美女又黄又www|