在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

人工智能玩家發明自己的“語言”,合作“交流”以贏得紙牌游戲

IEEE電氣電子工程師 ? 來源:lp ? 2019-03-10 11:13 ? 次閱讀

機器正變得越來越具有協作性,其中既包括機器與人的協作也包括機器與機器之間的協作。不久之后,我們可能就會有能協商通行權的自動駕駛汽車,以及協助護士進行家庭護理的機器人。但首先,它們需要學會交流,而且不僅僅是通過言語交流。人類用他們的行動說了很多。踩剎車不僅會讓你減速,還預示著前方可能有麻煩。雙臂交叉在胸前既可以保護你,又傳達出沉默的信號

為了教會人工智能AI)進行交流,研究人員轉向了紙牌游戲。雖然人工智能很久以前就在國際象棋、圍棋、某些形式的撲克和許多電子游戲中擊敗了人類,但橋牌和花火(Hanabi)等游戲提供了一些特殊的挑戰。玩家必須在沒有明確的信息共享方式的情況下進行合作(例如打出對方需要你打出的牌)。研究這兩款游戲的研究人員最近開發了一些人工智能系統,這些系統發明了自己的隱式代碼來協調它們的動作。

在橋牌比賽中,有四名選手,分成兩隊。在任何人出牌之前,玩家可以輪流叫牌。用選定的作為將牌的花色叫牌來表明你認為你的團隊可以贏某個墩數。多年來,橋牌玩家們已經開發出了很多能同時讓隊友知道自己手里有什么排的叫牌方法。例如,一個人可能叫“兩個梅花”(即使他沒有梅花)來表示自己手里有很多花牌(J、Q、K)。通過這樣編碼過的叫牌,團隊可以進行基本的對話。

倫敦大學學院(University College London)的研究人員最近在預印本文庫arXiv上發表了一篇標題為“Learning to Communicate Implicitly By Actions”的論文。在他們的名為“策略-信念-迭代”(Policy - Belief - Iteration,簡稱P-BIT)的系統中,每個AI玩家都有兩個神經網絡。一個網絡學習根據叫牌來推斷隊友手里有什么牌。另一個學習根據對隊友手里有的牌的推斷和自己手里的牌來做出恰當的叫牌。在訓練過程中,AI玩家會因為自己的叫牌提高了隊友所做推斷(推斷自己手里有什么牌)的準確性而得到獎勵。

在經過150萬手的練習之后,這對AI搭檔已經發展出了它們自己的約定,比如用叫一種花色的三張牌的方式來表明這種花色的六張牌可能是一個理想的定約。這對AI玩家擊敗了沒有進行交流或對它們隊友的信念進行建模的基線AI玩家。該論文的作者之一、倫敦大學學院的計算機科學家Jun Wang表示,這些AI玩家還無法與人類玩家相比,但他發現初步結果“是非常鼓舞人心的”。

一款名為花火(Hanabi)的新型紙牌游戲也具有類似的交流挑戰。在這款需要合作的類單人紙牌游戲中,兩到五名玩家每人各持有四到五張牌,每張牌都具有一種顏色并帶有一個數字,玩家需要輪流將它們按正確的順序放到彩色的紙牌堆上。但他們看不到自己的牌,只能看到隊友的牌。

在每個回合中,他們可以出一張牌、丟棄一張牌,或者給另一位玩家一個提示。他們不能告訴對方可以出哪張牌,而是只能說對方手中的哪些牌是某種顏色的或是帶有某個數字的。在某些情況下,指出隊友手中的某張牌的顏色,可能是向隊友示意他接下來應該打出這一張牌。信息不僅可以來自顯性線索本身(牌的顏色),還可以來自為什么選擇該線索而不是其他線索的隱性內容。

最近,DeepMind Technologies和牛津大學的一個團隊在arXiv上發表了一篇標題為“Bayesian Action Decoder for Deep Multi-Agent Reinforcement Learning”的論文。論文中介紹了一個針對雙人版本花火游戲的機器學習系統。他們的“貝葉斯動作解碼器”(Bayesian Action Decoder,簡稱BAD)也使用神經網絡,讓每個人工智能玩家嘗試推斷其隊友的信念。為了避免無限遞歸地思考你的隊友在思考你在思考什么,這個系統兩個玩家外部創建了一套“公共信念”。

這些公共信念代表了有關游戲狀態和之前動作的所有公開可用信息,以及在沒有實際查看其中任何一手的情況下可能說的關于所有手的話。然后,“公共代理人”使用神經網絡將這些信念轉換為關于每個玩家應該做什么以及他們的隊友手中可能拿著怎樣的牌的指示。然后,每個玩家在公共代理的指導下,根據自己的觀察,采取行動。

盡管這些人工智能玩家并沒有因為交流而獲得特別的獎勵,但打信號卻產生了另外的作用。例如,指出紅牌或黃牌意味著AI隊友應該打出最近抽到的牌。研究人員計算出,通過暗示分享的信息中有40%是隱性的。這種編碼通信幫助他們的系統近乎完美地運行,平均得分為24分(滿分25分),比之前最好的機器人高出約1分。(對于人類來說,即使有使用肢體語言的不公平優勢,得分超過20分就是不錯的。)

這兩個系統,即用于橋梁的P-BIT和用于Hanabi的BAD,都依賴于給予人工智能的一些東西,比如人的“心理理論”,或者對他人的信念和意圖的認知。這種推理在人際交往中普遍存在。如果你問你的朋友他的婚姻狀況,而他把話題轉到紐約大都會隊,那么他的話就不僅說明了關于大都會隊的一些情況,也說明了他的婚姻狀況。

為了讓AI能夠高效、優雅地處理與人之間或彼此之間的互動,它們需要理解隱性信號,而紙牌游戲是實現目標的途徑之一。一家名為NukkAI的創業公司專注于為橋牌打造更好的人工智能,并且正籌集了數百萬美元,期望最終將其技術應用于現實世界的問題。在最近的一篇標題為“The Hanabi Challenge: A New Frontier for AI Research”論文中,DeepMind稱花火為“人工智能研究的一個新前沿”,并提供了一個開源測試平臺。

盡管DeepMind的BAD系統通過反復與同一隊友玩游戲來制定出約定,但他們在上面那篇論文中指出,更高級的任務將是對不熟悉的玩家的行為進行動態推理。他們在這個場景下測試了一些系統,而沒有一個系統的平均得分超過4分。

研究機器人和通信的康奈爾大學計算機科學家Julia Proft也強調了即時推理的重要性。她最近發現,當AI花火玩家使用隱性信號時,它們更有可能被判斷為是人類玩家。這一發現發表在標題為“Implicit Communication of Actionable Information in Human-AI teams”的論文中。在談到關于習得約定的論文時,她說:“他們做的事情真酷。”但她又加上一句說,“有趣的問題”是來自上下文的自發推理。

不過,牛津大學的計算機科學家、DeepMind那兩篇論文的合著者Jakob Foerster說:“我并不認為我們有可信的方法來開始考慮自發推理需要什么。說實話,我們離去考慮那個問題還相當遠。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4776

    瀏覽量

    100952
  • AI
    AI
    +關注

    關注

    87

    文章

    31262

    瀏覽量

    269631
  • 人工智能
    +關注

    關注

    1792

    文章

    47497

    瀏覽量

    239214
  • 機器
    +關注

    關注

    0

    文章

    784

    瀏覽量

    40765

原文標題:人工智能玩家發明自己的“語言”,合作“交流”以贏得紙牌游戲

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    嵌入式和人工智能究竟是什么關系?

    嵌入式和人工智能究竟是什么關系? 嵌入式系統是一種特殊的系統,它通常被嵌入到其他設備或機器中,實現特定功能。嵌入式系統具有非常強的適應性和靈活性,能夠根據用戶需求進行定制化設計。它廣泛應用于各種
    發表于 11-14 16:39

    《AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感

    和國際合作等多個層面。這些內容讓我更加認識到,在推動人工智能與能源科學融合的過程中,需要不斷探索和創新,應對各種挑戰和機遇。 最后,通過閱讀這一章,我深刻感受到人工智能對于能源科學的
    發表于 10-14 09:27

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    很幸運社區給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們揭示了人工智能技術在生命科學領域中的廣泛應用和深遠影響。在
    發表于 10-14 09:21

    《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    周末收到一本新書,非常高興,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內容詳實,干活滿滿。 《AI for Science:人工智能驅動科學創新》這本書的第一章,作為整個著作的開篇
    發表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    長時間運行或電池供電的設備尤為重要。 高性能 : 盡管RISC-V架構低功耗著稱,但其高性能也不容忽視。通過優化指令集和處理器設計,RISC-V可以在處理復雜的人工智能圖像處理任務時表現出色。 三
    發表于 09-28 11:00

    人工智能ai 數電 模電 模擬集成電路原理 電路分析

    人工智能ai 數電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學 不過好像都是要學的
    發表于 09-26 15:24

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結經驗,擬按照要求準備相關體會材料。看能否有助于入門和提高ss
    發表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新

    活的世界? 編輯推薦 《AI for Science:人工智能驅動科學創新》聚焦于人工智能與材料科學、生命科學、電子科學、能源科學、環境科學五大領域的交叉融合,通過深入淺出的語言和諸多實際應用案例,介紹了
    發表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI

    呈現、產業展覽、技術交流、學術論壇于一體的世界級人工智能合作交流平臺。本次大會暨博覽會由工業和信息化部政府采購中心、廣東省工商聯、前海合作
    發表于 08-22 15:00

    FPGA在人工智能中的應用有哪些?

    FPGA(現場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發表于 07-29 17:05

    人工智能自然語言處理

    人工智能教學資料。
    發表于 07-17 17:15 ?0次下載

    自然語言處理屬于人工智能的哪個領域

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能(Artificial Intelligence,簡稱AI)領域的一個重要分支。它涉及到計算機與人類語言
    的頭像 發表于 07-03 14:09 ?1459次閱讀

    5G智能物聯網課程之Aidlux下人工智能開發(SC171開發套件V2)

    5G智能物聯網課程之Aidlux下人工智能開發(SC171開發套件V2) 課程類別 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 人工智能 參賽基礎知識指引 14分50秒 https
    發表于 05-10 16:46

    5G智能物聯網課程之Aidlux下人工智能開發(SC171開發套件V1)

    課程類別 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 人工智能 參賽基礎知識指引 14分50秒 https://t.elecfans.com/v/25508.html *附件:參賽基礎知識指引
    發表于 04-01 10:40

    嵌入式人工智能的就業方向有哪些?

    嵌入式人工智能的就業方向有哪些? 在新一輪科技革命與產業變革的時代背景下,嵌入式人工智能成為國家新型基礎建設與傳統產業升級的核心驅動力。同時在此背景驅動下,眾多名企也紛紛在嵌入式人工智能領域布局
    發表于 02-26 10:17
    主站蜘蛛池模板: 热99热| 色月| 朋友夫妇和交换性bd高清| 日本爱爱片| 日韩色爱| 中文字幕第8页| 黄色xxxx| 成人午夜网址| 五月激情在线| 亚洲天堂免费看| 中文三级视频| 亚洲国产精品婷婷久久| 黄到让你下面湿的视频| 2021天天操| 欧美涩色| 六月丁香激情| 国产黄色片在线观看| 日韩精品卡4卡5卡6卡7卡| 在线观看日本亚洲一区| 国产视频h| 精品无码中出一区二区| 亚洲青草视频| 亚洲精品你懂的| 三级视频中文字幕| 日韩成人黄色| 看逼网址| 久久99久久精品免费思思6| 妇少香港三日本三级视频| 天天干亚洲| 日本特黄特色视频| 婷婷六月丁香午夜爱爱| 老师啊灬啊灬用力啊快224视频| 亚洲 欧美 动漫| 天天更新影院| 亚洲第一成年网| 欧美亚洲综合在线观看| 青草国产在线视频| 欧美日韩国产乱了伦| 美女又爽又黄视频| 国产一区二区三区免费大片天美| 夜夜se|