2019年開啟之際,美國加州大學(xué)伯克利分校教授、機(jī)器人與強(qiáng)化學(xué)習(xí)領(lǐng)域?qū)<?Pieter Abbeel 發(fā)布了一份資源大禮:《深度學(xué)習(xí)與機(jī)器人學(xué)》105頁PPT。這份PPT整理自Abbeel教授2018年受邀參加的69個演講,內(nèi)容涵蓋監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的重要進(jìn)展,以及深度學(xué)習(xí)的主要應(yīng)用等方面,有助于讀者對深度學(xué)習(xí)和機(jī)器人學(xué)有一個宏觀的理解。
Pieter Abbeel教授從AI近年的一些“熱論”講起,從馬斯克認(rèn)為AI是人類文明面臨的最大威脅、普京說“誰能成為AI領(lǐng)域的領(lǐng)袖,誰就將成為世界的主宰者”,概述了近年來AI的熱潮:NIPS等頂會的參會人數(shù)達(dá)到史上最高、arxiv上AI領(lǐng)域的論文翻倍增長。
報告的主體部分是“深度學(xué)習(xí)成功”,詳細(xì)介紹了監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的重要進(jìn)展。Pieter Abbeel教授對這三個概念的解釋如下:
監(jiān)督學(xué)習(xí):模式識別,如果有足夠多的數(shù)據(jù)(input -> output pairs),那么神經(jīng)網(wǎng)絡(luò)就能夠?qū)W習(xí)模式;
強(qiáng)化學(xué)習(xí):通過試錯的過程,學(xué)習(xí)目標(biāo)導(dǎo)向的行為
無監(jiān)督學(xué)習(xí):沒有明確的監(jiān)督的條件下,學(xué)習(xí)世界的結(jié)構(gòu)
最后,報告展示了深度學(xué)習(xí)的一系列應(yīng)用。
PPT下載地址:
https://www.dropbox.com/s/dw4kmxkrv3orujd/2018_12_xx_Abbeel--AI.pdf?dl=0
Pieter Abbeel教授簡介
Pieter Abbeel,加州大學(xué)伯克利分校教授、機(jī)器人學(xué)習(xí)實驗室主任,伯克利人工智能研究(BAIR)實驗室聯(lián)合主任。
Pieter Abbeel是機(jī)器人和強(qiáng)化學(xué)習(xí)領(lǐng)域的大牛。Pieter Abbeel 2008年從斯坦福大學(xué)獲得博士學(xué)位,師從百度前首席科學(xué)家 Andrew Ng(吳恩達(dá)),畢業(yè)后在UC Berkeley任教。
2016~2017年,Pieter Abbeel加入Open AI,任研究科學(xué)家。現(xiàn)在則是Open AI顧問。
Pieter Abbeel還是兩家AI公司的創(chuàng)始人,Gradescope和covariant.ai。Gradescope開發(fā)為家庭作業(yè)、課題研究、試卷等打分的AI系統(tǒng);covariant.ai開發(fā)機(jī)器人自動化的AI系統(tǒng),在制造/倉儲/電子商務(wù)/物流等領(lǐng)域應(yīng)用。
Pieter Abbeel 的研究重點特別集中于如何讓機(jī)器人向人類學(xué)習(xí)(學(xué)徒學(xué)習(xí)),如何讓機(jī)器人通過自己的試錯過程學(xué)習(xí)(強(qiáng)化學(xué)習(xí)),以及如何通過從learning-to-learn(元學(xué)習(xí))過程中加快技能獲取。他開發(fā)的機(jī)器人已經(jīng)學(xué)會了先進(jìn)的直升機(jī)特技飛行、打結(jié)、基本裝配、疊衣服、移動、以及基于視覺的機(jī)器人操作。
機(jī)器人疊毛巾
Pieter Abbeel目前的主要研究方向:機(jī)器人和機(jī)器學(xué)習(xí),特別關(guān)注深度強(qiáng)化學(xué)習(xí)、深度模仿學(xué)習(xí)、深度無監(jiān)督學(xué)習(xí)、元學(xué)習(xí)、learning-to-learn、以及AI安全。
PPT全文
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28512瀏覽量
207500 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4774瀏覽量
100896 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5507瀏覽量
121276
原文標(biāo)題:【強(qiáng)化學(xué)習(xí)干貨】《深度學(xué)習(xí)與機(jī)器人學(xué)》大牛Pieter Abbeel 105頁PPT下載
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論