進入到2021年,AI領域的你最應該學的是什么?我覺得是強化學習。
為什么這么說?首先要知道什么是強化學習。 強化學習是機器學習的一種,是一種行為學習模型。由算法提供數據分析反饋,引導用戶逐步獲取最佳結果。主要解決在 Markov Decision Process(MDP) 中優化長期reward的期望的問題。 強化學習也是現在非常熱門的方向,在近幾年的所有頂級計算機會議中,強化學習都有明顯的增長趨勢。 比如在ICML 2020 熱門話題引用量最高的論文就是強化學習!
同時在12月30剛結束的首屆谷歌足球Kaggle競賽中,使用了深度強化學習的騰訊AI足球隊—絕悟(WeKick),也以顯著優勢奪得冠軍!
不僅如此,工業界中,已經有很多將強化學習應用于推薦系統的研究,也有一些自動駕駛公司在嘗試使用強化學習的技術。 在學術界中,除了強化學習本身關注的問題以外,也有一些NLP的問題可以利用強化學習來解決。 學習強化學習,想要發表論文和落地應用,就一定要理解并掌強化學習領域的經典Paper,才能梳理出主要的知識框架。
責任編輯:xj
原文標題:10 篇論文攻克深度強化學習底層原理,推薦一個論文復現的好方向!
文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
-
AI
+關注
關注
87文章
31429瀏覽量
269826 -
深度學習
+關注
關注
73文章
5511瀏覽量
121392 -
強化學習
+關注
關注
4文章
268瀏覽量
11277
原文標題:10 篇論文攻克深度強化學習底層原理,推薦一個論文復現的好方向!
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論