在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器人如何獲得能夠有效泛化到各種現實世界物體和環境的技能?

Tensorflowers ? 來源:未知 ? 作者:胡薇 ? 2018-07-12 17:08 ? 次閱讀

盡管設計一套能夠在受控環境中有效執行重復任務的機器人系統(例如,在裝配線上組裝產品)十分平常,但設計一種能夠觀察周圍環境和確定最佳行動方案,同時對意外結果做出反應的機器人卻非常困難。

不過,有兩種工具可以幫助機器人從經驗中獲得這些技能:深度學習和強化學習。前者非常適合處理非結構化的現實世界場景,而后者可以實現更長期的推理,同時展現出更復雜、更強大的順序決策能力。如果將這兩種技術結合,將有可能讓機器人不斷地從經驗中學習,使它們能夠通過數據而非人為設計來掌握基本的感覺運動技能。

設計用于機器人學習的強化學習算法本身提出了一系列挑戰:現實世界的物體具有各種各樣的視覺和物理屬性,接觸力的細微差別都可能會使物體運動難以預測,并且相關物體可能會受到遮擋。此外,機器人傳感器本身具有噪聲,這也增加了復雜性。所有這些因素綜合到一起,使得學習一個通用解異常困難,除非訓練數據足夠多樣化,然而,收集這樣的數據又十分耗時。

這就促使人們去探索一種能夠有效重用過往經驗的學習算法,類似于我們之前一項關于抓取的研究,這項研究就受益于大數據集。不過,這項研究無法推斷動作的長期后果,而這一點對學習如何抓取十分重要。例如,如果多個物體聚集在一起,那么將其中一個分開(稱為“分割”)將使得抓取更容易,即使這樣做與成功抓取并無直接關聯。

分割示例

為了提高效率,我們需要采用脫策強化學習,這種算法可以從數小時、數天或數周前收集的數據中學習。為了設計這樣一種可以利用從歷史互動中獲得的大量不同經驗的脫策強化學習算法,我們將大規模分布式優化與一個新的擬合深度 Q 學習算法(我們稱之為 QT-Opt)相結合。arXiv 上提供了預印本。

QT-Opt 是一種分布式 Q 學習算法,支持連續動作空間,非常適合解決機器人問題。為了使用 QT-Opt,我們首先使用已收集的數據以完全離線的方式訓練模型。此過程不需要運行真正的機器人,因而更易于擴展。然后,我們在真正的機器人上部署并微調該模型,使用新收集的數據進一步訓練模型。通過運行 QT-Opt,我們得以積累更多的離線數據,這使得我們能夠訓練出更好的模型,而這反過來又有利于收集更好的數據,從而形成一個良性循環。

為了將這種方法應用于機器人抓取,我們使用了 7 個現實世界的機器人,在 4 個月的時間里,機器人總共運行了 800 個小時。為了引導收集過程,我們首先使用手動設計的策略,成功率為 15-30%。在表現提升后,數據收集轉向學到的模型。策略利用相機圖像并返回手臂和抓手的移動方式。離線數據包含對 1000 多種不同物體的抓取。

使用的一些訓練物體

通過過去的研究,我們已經發現在機器人之間共享經驗可以加快學習速度。我們將此訓練和數據收集過程擴展到 10 個 GPU、7 個機器人和多個 CPU,因此得以收集和處理包含超過 580,000 次抓取嘗試的大型數據集。在這個過程的最后,我們成功訓練了一種抓取策略,此策略在現實世界機器人上運行并且可以泛化到訓練時未見過的各種具有挑戰性的物體。

七個機器人正在收集抓取數據

從量化角度來看,在關于以前未見過物體的 700 次抓取試驗中,QT-Opt 方法的抓取成功率達到 96%。先前基于監督式學習的抓取方法的成功率為 78%,相比之下,新方法將錯誤率降低了五倍以上。

評估時使用的物體

為了使任務具有挑戰性,我們增加了物體尺寸、

紋理和形狀的多樣性

值得注意的是,策略展現出了標準機器人抓取系統中少見的各種閉環、反應性行為:

? 當面對一組無法一起拾起的聯鎖塊時,策略先將一個塊與其他塊分開,然后再將它拾起。

? 當面對難以抓取的物體時,策略會推算出它應該調整抓手位置并重新抓取,直到抓牢為止。

? 當在一堆物體中抓取時,策略會探測不同的物體,直到抓手緊緊握住一個物體時才會將它拾起。

? 當我們故意將物體從抓手上弄掉以擾亂機器人時(訓練期間未經歷過這種情況),它會自動重新調整抓手位置,進行另一次嘗試。

最重要的是,這些行為都并非人為設計。這些行為基于 QT-Opt 的自監督式訓練自動出現,因為它們提高了模型的長期抓取成功率。

學到的行為示例

在左側的 GIF 中,策略針對移動的球進行更正

在右側的 GIF 中,策略在多次抓取嘗試后

成功拾起難以抓握的物體

此外,我們發現 QT-Opt 使用較少的訓練數據達到了較高的成功率,盡管收斂時間較長。這對機器人技術來說尤其令人興奮,因為,此領域的瓶頸通常是收集現實機器人數據,而不是訓練時間。將此策略與其他數據效率技術(例如我們之前關于抓取領域自適應的研究)相結合,可以在機器人技術領域開辟一些有趣

總體而言,QT-Opt 算法是一種通用的強化學習方法,在現實世界機器人上表現非常出色。除獎勵定義外,QT-Opt 沒有任何特定于機器人抓取的限制。我們認為這是向更通用的機器人學習算法邁出的重要一步,并期待看到其他適用的機器人任務。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28618

    瀏覽量

    207927
  • 深度學習
    +關注

    關注

    73

    文章

    5511

    瀏覽量

    121392
收藏 人收藏

    評論

    相關推薦

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人的基礎模塊

    非常重要的地位。 先說這個自主機器人的計算系統。計算系統是自主機器人的關鍵部件。自主機器人通過智能計算系統與物理世界交互,自主地完成任務。通常會包括幾個關鍵的模塊,分別是傳感模塊,感知
    發表于 01-04 19:22

    《具身智能機器人系統》第10-13章閱讀心得之具身智能機器人計算挑戰

    取特征點,涉及大量像素級比較運算;優化機器人位姿,需要迭代求解大規模矩陣方程。書中提出了模塊的硬件加速方案,闡述了如何以因子圖為通用模版,以求解非線性優化問題為橋梁,面向多種機器人應用進行加速。 第11
    發表于 01-04 01:15

    NVIDIA技術推動機器人仿真

    借助機器人仿真,開發人員能夠在基于物理學的現實世界數字呈現中對機器人進行虛擬訓練、測試和驗證。
    的頭像 發表于 01-03 14:10 ?152次閱讀

    開源項目!能夠精確地行走、跳舞和執行復雜動作的機器人—Tillu

    學習者和愛好者的理想伙伴。 創新設計 Tillu的設計靈感來自廣受歡迎的Otto DIY機器人,其設計過程包括在Fusion 360中進行CAD建模和精確的3D打印,以實現從堅固的伺服驅動腿部模塊
    發表于 01-02 17:24

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人大模型

    能夠利用\"思維鏈\"的技術將復雜任務分解為多個子任務,以漸進的方式解決問題。這不僅提高了任務的成功率,也顯著增強了系統的魯棒性,使得機器人可以更高效地應對復雜環境和多樣需求
    發表于 12-29 23:04

    【「具身智能機器人系統」閱讀體驗】1.初步理解具身智能

    影響與發展,提供了全球及國內行業趨勢的見解。書中詳細討論了這一新興領域面臨的諸多挑戰,從應用的不確定性、昂貴的成本倫理問題,為讀者呈現了當前形勢的現實視角。 接下來,書中深入探討了具身智能機器人的歷史
    發表于 12-28 21:12

    《具身智能機器人系統》第7-9章閱讀心得之具身智能機器人與大模型

    和經驗積累,使機器人能夠自主發現工藝規律,優化作業參數。家庭服務機器人則采用混合任務規劃策略:將預訓練的基礎技能與實時規劃相結合,靈活應對開放環境
    發表于 12-24 15:03

    【「具身智能機器人系統」閱讀體驗】+數據在具身人工智能中的價值

    100 倍 。此外,Sim2Real 技術的進步也促進了技能與知識從模擬環境實際應用的轉移。這項技術在虛擬空間中訓練機器人和 AI 系統,使它們
    發表于 12-24 00:33

    【「具身智能機器人系統」閱讀體驗】+初品的體驗

    提高機器人的自適應性和自主性,賦能機器人在多種場景中的應用。例如在家庭自動領域,具身智能機器人能夠感知家庭成員的日常習慣和需求,自動執行清
    發表于 12-20 19:17

    《具身智能機器人系統》第1-6章閱讀心得之具身智能機器人系統背景知識與基礎模塊

    將大模型的\"大腦\"裝入物理實體的\"身軀\",讓AI真正走進現實世界。這種革新不僅體現在稚暉君開源的人形機器人方案,更在“AI教母”李飛飛的VoxPoser
    發表于 12-19 22:26

    機器人仿真的類型和優勢

    機器人仿真使機器人工程師和研究人員能夠創建機器人及其環境的虛擬模型。這項技術支持在仿真的無風險環境
    的頭像 發表于 10-14 10:43 ?595次閱讀
    <b class='flag-5'>機器人</b>仿真的類型和優勢

    通過多樣的幾何形狀來訓練機器人從仿真現實轉換的裝配技能

    的部件。在多品種的小批量制造中(即小批量生產各種產品的流程),機器人還必須適應不同的零件、姿態和環境。在保持高精度和高準確度的前提下實現這種適應性是機器人技術所面臨的一大挑戰。 得益于
    的頭像 發表于 08-20 10:39 ?1070次閱讀
    通過多樣的幾何形狀來訓練<b class='flag-5'>機器人</b>從仿真<b class='flag-5'>到</b><b class='flag-5'>現實</b>轉換的裝配<b class='flag-5'>技能</b>

    Al大模型機器人

    豐富的知識儲備。它們可以涵蓋各種領域的知識,并能夠回答相關問題。靈活性與通用性: AI大模型機器人具有很強的靈活性和通用性,能夠處理各種類型
    發表于 07-05 08:52

    NVIDIA發布幾項新功能來幫助機器人專家和工程師打造智能機器人

    ? 機器人技術在智能制造設施、商用廚房、醫院、倉儲物流和農業領域等各種環境中的應用正在迅速擴大。該行業正在向智能自動轉型,因此要求機器人
    的頭像 發表于 06-29 15:14 ?1173次閱讀
    NVIDIA發布幾項新功能來幫助<b class='flag-5'>機器人</b>專家和工程師打造智能<b class='flag-5'>機器人</b>

    碼垛機器人適用環境有哪些

    ? ? ? ? ? 碼垛機器人作為一種自動、職能的生產設備,在多個領域都得到了廣泛應用。其強大的適用性和靈活度使得它可以在各種環境中效高
    的頭像 發表于 05-14 16:21 ?374次閱讀
    主站蜘蛛池模板: 亚洲另类激情综合偷自拍| 久久久久国产精品免费网站| 久久大综合| jlzzjlzz亚洲日本| 黄视频国产| 黄色网址大全免费| 美女淫| 韩国在线视频| 四虎4545www国产精品| 特级aaa片毛片免费观看| 日日噜噜夜夜狠狠va视频| 亚洲美女视频一区二区三区| 亚洲第一区第二区| 如色网| 久久综合九色欧美综合狠狠| 韩国三级视频| 一级毛片在线播放| 日本特黄视频| 欧美性xxxx巨大黑人猛| 大又大又粗又爽又黄毛片女人| 999久久精品国产| 亚洲成av人片在线观看无码| 正在播放91| www.亚洲一区| 婷婷色亚洲| 四虎.com| 久久久久久久久久久9精品视频| 丁香婷婷在线视频| 日日躁夜夜躁狠狠天天| 人色网| 在线天堂资源| 青草网址| 久久六月丁香婷婷婷| cum4k在线| 在线色片| 国产福利久久| 免费看的黄网站| 色色色色色色色色色色色色 | 能直接看黄的网站| 成人久久久精品乱码一区二区三区| 婷婷激情四月|