在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepMind用新方法讓智能體在復雜的非對稱博弈里找到納什均衡

mK5P_AItists ? 2018-01-19 10:21 ? 次閱讀

隨著人工智能系統在現實世界中扮演越來越重要的角色,理解不同的系統如何相互作用至關重要。

剛剛,DeepMind發表了一篇名為Symmetric Decomposition of Asymmetric Games的論文。在這篇論文中,DeepMind研究人員采用了博弈論的分支試圖這個問題。

研究人員重點觀察了在德州撲克,棋盤游戲蘇格蘭特警等非對稱博弈中,兩個智能體會有怎樣的行為和表現。

用這種新方法,智能體能簡單快速地在復雜的非對稱博弈里找到納什均衡。

博弈與納什均衡

博弈論屬于數學的一個分支,用于分析競爭環境下決策者的策略。

這套理論適用于人類,動物,以及超過一個AI時的多AI環境。比如說家里多個機器人同時打掃房間。

非對稱信息博弈模擬了真實世界的場景,就像拍賣時買家和賣家的心態和動機不同。我們得到的結果給了我們獨道的見解,以及極其簡潔的方式分析他們。

非對稱博弈的特點是每方玩家都有不同的策略、目標和獎勵。比如說博弈論研究里最常見的協調博弈,性別之戰。

一般來說,多AI系統的進化動態過程是用簡單的對稱博弈來分析,比如說經典的囚徒困境,兩方玩家都可以采取同樣的行動。即使這些博弈能夠為多AI系統提供有效的洞見,告訴我們如何操作所有玩家才能獲得最優結果(這就是納什均衡),但他們并不能模擬出所有的情況。

DeepMind的新的方法,能簡單快速地在復雜的非對稱博弈里找到納什均衡。

雖然目前這套理論的重點還在如何應用在多個AI系統的互動中,但研究人員相信這個結論也可以用于經濟、進化生物學、經驗博弈論中。

歌劇還是電影?

舉個例子吧。

兩名玩家需要決定晚上是去看歌劇還是電影,不巧的是,其中一名偏好歌劇而另一名偏好電影。這是場不對稱的游戲,雖然兩名玩家可以任意選擇,但是根據玩家的喜好,每個玩家得到獎勵是不同的。

但是,為了維持他們的友誼,或者我們稱為一種平衡,雙方需要選擇相同的活動,因此單獨行動的回報為零。

這個游戲有三個平衡:(i)雙方都去看歌劇,(ii)雙方去看電影,(iii)還有一個混合選項,每個玩家在五分之三的時間里選擇他們喜歡的選項。

這個“不穩定的”的最后一個選項,就是用了將不對稱游戲簡化或分解成它的對稱對等體的方法。

我們可以將這種游戲的本質想象成,每個玩家的獎勵分數表是一個獨立對稱的雙玩家游戲,它的平衡點與原始的不對稱游戲一致。

在下面這張圖中,納什均衡是通過兩個對等點得到的,幫助我們快速確定不對稱博弈中的最優策略(a)。反過來說,利用不對稱博弈來確定對稱對等點的均衡。

DeepMind用新方法讓智能體在復雜的非對稱博弈里找到納什均衡

△紅點代表納什均衡。對于不對稱的游戲(a),納什均衡可以很容易地從(b)和(c)兩張對稱圖中得到。上述圖中,x、y軸分別為玩家1、2選擇歌劇的概率

好消息是,這種方法也適用于其他游戲,比如Leduc撲克等。這些方法應用了一個簡單的數學原理,從而快速直接分析不對稱游戲。我們希望它也能幫助我們理解各種動態系統,包括多代理環境。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 博弈論
    +關注

    關注

    0

    文章

    8

    瀏覽量

    7293
  • DeepMind
    +關注

    關注

    0

    文章

    131

    瀏覽量

    10891
  • 納什均衡
    +關注

    關注

    0

    文章

    2

    瀏覽量

    1160

原文標題:AI博弈論:DeepMind讓智能體在非對稱博弈中找納什均衡

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    matlab 如何計算均衡

    如題 怎樣使用matlab 實現計算n人非合作博弈均衡結果?本人新手中的菜鳥 在網上下了一個代碼文件,并找了文章,代碼文件按自己的理
    發表于 03-26 10:10

    蘋果獲得Macbook Pro非對稱散熱風扇設計專利

    中去,起到減小噪音的目的,音調BPF上從聽覺中用戶感覺噪音變小。令風扇的葉片分布處于不均衡狀態,并保持葉輪的平衡,能夠起到很好的降低噪音的效果?!备鶕@募f,對風扇的葉片分布和角度進行重新排列
    發表于 12-23 10:30

    運用于matlab中的矩陣求逆的新方法有哪些啊(不是函數inv)

    運用于matlab中的矩陣求逆的新方法有哪些啊或者考慮矩陣的特殊性質,比如稀疏、對稱性,有哪些求逆的新方法可以運用啊?求助!
    發表于 01-21 17:10

    轉帖:完全Proteus8.0編譯測試ARM Cortex的最新方法

    本帖最后由 鼓山 于 2013-7-4 14:31 編輯 俺在網上找到的基于Proteus 8.0開發LM3S ARM Cortex的新方法給碼農們分享!
    發表于 07-04 14:00

    測電阻,新方法,不加激勵

    測電阻,新方法,不加激勵的辦法有沒有。
    發表于 03-26 10:44

    一種標定陀螺儀的新方法

    一種標定陀螺儀的新方法
    發表于 08-17 12:17

    求大佬分享按鍵掃描的新方法

    求大佬分享按鍵掃描的新方法
    發表于 01-17 06:50

    基于博弈論的功率控制策略及其牛頓迭代算法

    某系統碼相關測距中,每一個飛機的詢問信號都可能會成為其他飛機的干擾。在有限的可用功率下,就需要一個可靠和高效的功率控制策略。博弈(非合作博弈
    發表于 01-29 14:09 ?21次下載

    基于FlipIt模型的非對稱信息條件下攻防博弈模型

    雙方對目標資源的交替控制;然后,考慮到攻防雙方博弈中觀察到的反饋信息的不對稱性以及防御效果的不徹底性,給出了防御者采取更新策略時攻防雙方的收益模型及最優策略的條件,同時給出并分別證
    發表于 11-28 15:06 ?0次下載
    基于FlipIt模型的<b class='flag-5'>非對稱</b>信息條件下攻防<b class='flag-5'>博弈</b>模型

    北卡羅萊州立大學開發了一種直接印刷柔性電子產品金屬電路的新方法

    美國北卡羅萊州立大學的一個研究小組宣布,他們開發了一種直接印刷柔性電子產品金屬電路的新方法。
    的頭像 發表于 01-23 11:31 ?4569次閱讀

    AD采集的新方法資料分享

    AD采集的新方法
    發表于 03-23 09:44 ?10次下載

    Daskalakis憑借自己博弈論、均衡和機器學習領域的貢獻獲得“奈望林獎”

    一個機緣巧合,Daskalakis聽了理論計算機科學家Christos Papadimitriou的一次演講,這給他留下了非常深刻的印象。除了其他內容,演講中重點提及的還有均衡,這是博弈
    的頭像 發表于 08-05 08:52 ?5832次閱讀

    華裔女科學家找到了精確測量重力的新方法

    科學家們找到新方法來通過激光、原子來測量重力。這種辦法精度極高,甚至能測量你的微小體重對重力的影響。
    的頭像 發表于 05-19 15:08 ?2708次閱讀

    基于矩陣半張量積的時滯演化擁塞博弈鎮定方法

    擁塞博弈的動態行為,證明該博弈的不動點即為均衡點,給出其開環控制和狀態反饋控制下全局鎮定到
    發表于 03-30 11:47 ?23次下載
    基于矩陣半張量積的時滯演化擁塞<b class='flag-5'>博弈</b>鎮定<b class='flag-5'>方法</b>

    VLSI系統設計的最新方法

    電子發燒友網站提供《VLSI系統設計的最新方法.pdf》資料免費下載
    發表于 11-20 11:10 ?0次下載
    VLSI系統設計的最<b class='flag-5'>新方法</b>
    主站蜘蛛池模板: 69性xxxxfreexxxx| 女人又色又爽又黄| 国内在线观看精品免费视频| 综合网天天操天天射| 国产在线色| 成人看片在线观看| 一级黄色片在线看| 天天舔天天爽| 毛片视频免费网站| 国产午夜精品理论片在线| 视频网站免费| 男女午夜剧场| 性高清| 日韩一级特黄毛片在线看| 欧美日韩你懂的| 国产经典三级| 台湾一级毛片| 国产看片视频| 亚洲狼色专区| 亚洲视频你懂的| 日本精品一卡二卡≡卡四卡| 久久精品成人免费网站| a站在线观看| 久久视频精品36线视频在线观看| 综合色久七七综合七七蜜芽| 免费看18污黄| 深爱开心激情| 久久mimi色| 亚洲福利午夜| 成年人黄色大片大全| 久久青草免费91观看| 第三级视频在线观看| 手机在线观看你懂得| 男人操女人免费视频| 在线成人欧美| 清纯唯美亚洲综合欧美色| 狠狠色丁香婷婷久久综合不卡| 亚洲 欧美 日韩 丝袜 另类| 最新黄色免费网站| 国产毛片久久国产| 欧美性色欧美a在线观看|