在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Google AI的研究人員的最新研究提出一個全新概念:剛度(Stiffness)

DPVg_AI_era ? 來源:lp ? 2019-03-21 09:14 ? 次閱讀

Google AI的研究人員的最新研究提出一個全新概念:剛度(Stiffness),為探索神經網絡的訓練和泛化問題提供了一個新視角。

Google AI的研究人員最近在arxiv發表的一篇新論文,探索了神經網絡的訓練和泛化問題的一個新視角。

論文題為“Stiffness: A New Perspective on Generalization in Neural Networks”,作者是谷歌 AI 蘇黎世研究中心的Stanislav Fort等人。

論文提出“剛度”(stiffness)這個概念,透過這個概念研究了神經網絡的訓練和泛化問題。

研究人員通過分析一個示例中的小梯度步驟如何影響另一個示例的損失來測量網絡的“剛度”。

具體來說,他們在4個分類數據集(MNIST、FASHION MNIST、CIFAR-10、CIFAR-100)上分析了全連接卷積神經網絡的剛度。他們關注的是剛度如何隨著1) 類隸屬度(class membership),2)數據點之間的距離,3)訓練迭代,和4)學習率而變化。

研究表明,當在固定的驗證集上計算時,剛度與泛化(generalization)直接相關。剛度函數的靈活性較差,因此不太容易對數據集的特定細節進行過擬合。

結果表明,“剛度”的概念有助于診斷和表征泛化。

學習率的選擇對學習函數的剛度特性有顯著影響。高學習率會導致函數逼近在更大的距離上“更剛”(stiffer),并且學習到的特征可以更好地泛化到來自不同類的輸入。另一方面,較低的學習率似乎能學到更詳細、更具體的特征,即使在訓練集上導致同樣的損失,也不能泛化到其他類。

這表明,高學習率的優勢不僅在于收斂所需的步驟更少,還在于它們傾向于學習的特性具有更高的泛化性,即高學習率充當了有效的正則化器。

剛度(Stiffness)的定義

剛度的定義如下:

如果點處的損失相對于網絡權重的梯度是,并且點處的梯度是?,則我們定義“剛度”為

圖1:“剛度”概念的圖示

如圖1所示,“剛度”可以看做是通過應用基于另一個輸入的梯度更新引起的輸入損失的變化,相當于兩個輸入的梯度之間的梯度對齊(gradient alignment)。

實驗和結果

基于類隸屬度關系的剛度特性

我們基于驗證集數據點的類隸屬度(class membership )作為訓練迭代函數,研究了驗證集數據點的剛度特性。

對于帶有真實標簽的MNIST、FASHION MNIST和CIFAR-10數據集,結果分別顯示為圖3、圖5、圖6,對于帶有隨機排列訓練集標簽的MNIST數據集,結果為圖4.

圖3:MNIST上完全連接網絡剛度的Class-membership dependence

圖4:MNIST上完全連接網絡剛度的Class-membership dependence,訓練時使用隨機排列的標簽。

圖5:FASHION MNIST上完全連接網絡剛度的Class-membership dependence

圖6:CIFAR-10上卷積神經網絡剛度的Class-membership dependence

圖3、圖5和圖6都顯示了4個訓練階段的剛度矩陣:初始化階段(任何梯度步驟之前)、優化早期階段和兩個后期階段。

學習率對剛度的影響

圖8:在MNIST 和 FASHION MNIST上以不同學習率訓練,不同類別的剛度。

如圖8所示,這兩幅圖給出了三種不同訓練損失的 class dependent剛度矩陣。較高的學習率導致來自不同類的輸入之間的剛度更高,表明它們學習的特性在不同類之間更加可泛化(generalizable)。

結論

我們探討了神經網絡剛度的概念,并用它來診斷和表征泛化。我們研究了在真實數據集上訓練的模型的剛度,并測量了其隨訓練迭代、類隸屬度、數據點之間的距離和學習率的選擇而變化的情況。為了探討泛化和過擬合,我們重點研究了驗證集中數據點的剛度。

總結而言,本文定義了剛度的概念,證明了它的實用性,為更好地理解神經網絡中的泛化特性提供了一個新的視角,并觀察了其隨學習率的變化。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Google
    +關注

    關注

    5

    文章

    1766

    瀏覽量

    57629
  • 神經網絡
    +關注

    關注

    42

    文章

    4774

    瀏覽量

    100912
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24742

原文標題:你的模型剛不剛?谷歌提出“剛度”概念,探索神經網絡泛化新視角

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    東京大學的研究人員:新開發的電子皮膚有LED顯示屏

    過去的幾年出現了很多柔性電子皮膚貼片概念,可以管理藥物或監測健康狀況,但是東京大學的研究人員最新開發的版本增加了LED顯示屏。
    發表于 05-15 08:46 ?1468次閱讀

    Google研究人員開發增強現實顯微鏡檢測癌細胞

    Google研究人員開發了種增強現實顯微鏡(ARM),該顯微鏡可以從經過訓練的神經網絡中獲取實時數據,以檢測癌細胞,并將其顯示在查看
    發表于 04-23 12:09 ?2252次閱讀

    帶你了解AI研究人員年薪百萬背后的真相

    近期,紐約時報記者卡德梅茨爆料了條令人「震驚」的消息——AI 研究人員年薪百萬(哪怕是在 OpenAI 這樣的非營利機構里),個個都是人生贏家。
    的頭像 發表于 05-28 17:46 ?5693次閱讀

    深度學習全新打開方式Google Brain提出概念激活向量新方法

    最近,Google Brain團隊的研究人員發表了篇論文,提出種名為概念激活向量(Conc
    的頭像 發表于 07-31 14:11 ?3029次閱讀

    研究人員提出系列新的點云處理模塊

    為了探索這些問題的解決辦法、來自倫敦大學學院的研究人員提出系列新的點云處理模塊,從效率、信息共享和點云卷積操作等方面進行了研究,得到了更寬、更深、更快效率更高的點云處理網絡,讓更
    的頭像 發表于 08-02 14:44 ?3076次閱讀
    <b class='flag-5'>研究人員</b>們<b class='flag-5'>提出</b>了<b class='flag-5'>一</b>系列新的點云處理模塊

    Facebook的研究人員提出了Mesh R-CNN模型

    研究的目標是通過單張圖像輸入,對圖像中的物體進行檢測、獲取不同物體的類別、掩膜和對應的三維網格,并對真實世界中的復雜模型進行有效處理。在2D深度網絡的基礎上,研究人員改進并提出了新
    的頭像 發表于 08-02 15:51 ?3900次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出</b>了Mesh R-CNN模型

    Google AI發布項新研究 可以“近乎即時”地預報天氣

    近日,據外媒報道,Google AI發布項新研究,稱可以“近乎即時”地預報天氣。谷歌的研究人員描述了如何能夠以僅數分鐘的計算,以1公里的分
    發表于 01-17 11:47 ?612次閱讀

    研究人員已經使用機器學習來開發血液測試

    這個由來自哈佛醫學院,克利夫蘭診所,梅奧診所等眾多研究人員研究人員組成的多機構團隊對來自3,052名參與者的數據進行了AI訓練。其中,1,531例患有癌癥,1,521例沒有。
    的頭像 發表于 05-21 10:17 ?1963次閱讀

    AI研究人員如何應對透明AI

    許多現代的AI系統都在神經網絡上運行,而我們僅了解其基礎知識,因為算法本身很少提供解釋方式。缺乏解釋性通常被稱為AI系統的“黑匣子”。研究人員將注意力集中在神經網絡如何工作的細節上
    的頭像 發表于 07-14 16:31 ?1904次閱讀

    研究人員發現可竊取AWS憑證的加密貨幣蠕蟲

    研究人員近期發現可以竊取AWS憑證的加密貨幣蠕蟲。這是首個含有AWS特定功能的蠕蟲,該蠕蟲可以竊取本地憑證、掃描錯誤配置的Docker平臺的網絡。研究人員發現黑客組織TeamTNT
    的頭像 發表于 08-26 14:04 ?1615次閱讀
    <b class='flag-5'>研究人員</b>發現<b class='flag-5'>一</b><b class='flag-5'>個</b>可竊取AWS憑證的加密貨幣蠕蟲

    研究人員宣布了種新的AI機器學習工具

    南加州大學(USC)的Victor Martinez是AI研究的首席研究員該軟件將于本月在2020年自然語言處理經驗方法會議論文集上首次亮相。其他研究人員USC克里希納包括和Soman
    的頭像 發表于 11-23 15:10 ?1898次閱讀

    研究人員發明全新AI感應設備

    12月23日消息,據國外媒體報道,加州大學伯克利分校的研究人員發明了種裝置,利用可穿戴傳感器和人工智能軟件來確定一個人想要做出的手勢。
    的頭像 發表于 12-23 16:51 ?2731次閱讀

    研究人員為鋰硫電池提出種新陰極設計概念

    研究團隊,為鋰硫電池(Li–S)提出種新穎的陰極設計概念,將可大幅提升此類具有發展前景的下代電池的性能。
    發表于 12-29 10:48 ?544次閱讀

    研究人員制造出種復制人類的行為下棋的AI

    我們這些凡人在國際象棋上已經很久沒有真正與人工智能競爭了。距人類在國際象棋比賽中征服計算機已有15年了。但是,近日,研究人員開發了AI國際象棋engine,它的出現并不是打算碾
    的頭像 發表于 02-23 09:38 ?1568次閱讀

    小到分子!研究人員開發種微小的壓電電阻器

    使用壓阻的電子傳感器在許多設備中都很常見,包括汽車、醫療可穿戴設備和智能手機?,F在,澳大利亞的研究人員開發了種微小的壓電電阻器,小到分子,可以實現
    的頭像 發表于 10-31 16:52 ?928次閱讀
    主站蜘蛛池模板: 日本免费不卡在线一区二区三区| 好男人社区www在线观看| 综合网天天| 欲香欲色| 五月婷婷社区| 日韩在线三级| 猛操女人| 久青草国产手机在线观| 红色一级毛片| 99色播| 手机在线看片国产日韩生活片| 国产欧美日韩综合精品无毒| 国产乱码精品一区二区三区四川人 | 一级特黄性色生活片一区二区 | 资源视频在线观看| 1024成人| 日本综合视频| 欧美熟色妇| 成人理伦| 亚洲a视频| 香蕉视频在线观看黄| 日本免费精品视频| 国产三级日本三级在线播放| 99九九成人免费视频精品| 色综合色综合色综合| 456成人免费高清视频| 婷婷国产在线| 香蕉久久夜色精品国产小说| 欧美一级欧美三级在线| 丁香花的视频免费观看| 手机看片福利视频| 欧美乱理伦另类视频| a亚洲| 欧美三级在线观看黄| 爱婷婷视频在线观看| 久久福利网| 狠狠色噜噜狠狠狠狠黑人| 色老头视频在线观看| 国产偷窥女洗浴在线观看亚洲| 狠狠色丁香久久综合五月| 亚洲永久免费视频|