好看的课外书,欢乐颂小说结局,玄幻小说排行榜

概念

當在一個任務中要優化多于一個的目標函數[1] ，就可以叫多任務學習

一些例外

「一個目標函數的多任務」：很多任務中把loss加到一起回傳，實質優化的是一個目標函數, 但優化的是多個任務，loss相加是多任務學習的一種正則策略，對多個任務的參數起一種類似與均值約束的作用[2]，所以也叫multi-task

「多個目標函數的單任務」：一些NLP中用main-task和auxiliary-task 輔助任務，很多輔助任務的loss并不重要，個人覺得這種雖然是多個loss,但是就是為了main-task ,不應該算多任務

動機

應用上節省資源，一個模型跑多個任務，單倍的時間雙倍的快樂

感覺上非常的直觀，好不容易花了30分鐘都出門了，肯定多逛幾個個商場，順便剪個頭發做個指甲

從模型的角度，學習得的底層的概率分布通常是對多個任務都是有效的

兩種常見方式

參數的硬共享機制：從幾十年前開始到現在這種方式還在流行（Multitask Learning. Autonomous Agents and Multi-Agent Systems[3]），一般認為一個模型中任務越多，通過參數共享降低噪聲導致過擬合的風險更低，在參數硬共享機制中loss直接相加就是一種最簡單的均值約束。

參數的軟共享機制：每個任務都由自己的模型，自己的參數。對模型間參數的距離進行正則化來保障參數空間的相似。

混合方式：前兩種的混合

為什么會有效

1. 不同任務的噪聲能有更好的泛化效果

由于所有任務都或多或少存在一些噪音，例如，當我們訓練任務A上的模型時，我們的目標在于得到任務A的一個好的表示，而忽略了數據相關的噪音以及泛化性能。由于不同的任務有不同的噪音模式，同時學習到兩個任務可以得到一個更為泛化的表示

2. 輔助特征選擇作用

如果主任務是那種，噪音嚴重，數據量小，數據維度高，則對于模型來說區分相關與不相關特征變得困難。其他輔助任務有助于將模型注意力集中在確實有影響的那些特征上。

3. 特征交流機制

在不同的任務之間的特征交互交流，對于任務B來說很容易學習到某些特征G，而這些特征對于任務A來說很難學到。這可能是因為任務A與特征G的交互方式更復雜，或者因為其他特征阻礙了特征G的學習。

4. 相互強調（監督）機制

多任務學習更傾向于學習到大部分模型都強調的部分。學到的空間更泛化，滿足不同的任務。由于一個對足夠多的訓練任務都表現很好的假設空間，對來自于同一環境的新任務也會表現很好，所以這樣有助于模型展示出對新任務的泛化能力（Deep Multi-Task Learning with Low Level Tasks Supervised at Lower Layers[4]、Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts[5]），非常適合遷移學習場景。

5. 表示偏置機制

如歸約遷移通過引入歸約偏置來改進模型，使得模型更傾向于某些假設，能起到一種正則效果。常見的一種歸約偏置是L1正則化，它使得模型更偏向于那些稀疏的解。在多任務學習場景中，這會導致模型更傾向于那些可以同時解釋多個任務的解。

為什么無效

先說是不是，再問為什么.

在Identifying beneficial task relations for multi-task learning in deep neural networks[6]中，作者探究到底是什么讓multi-task work, 作者使用嚴格意義上相同的參數用NLP任務做了對比實驗，圖中分別是兩個任務結合時與單任務loss的對比，大部分多任務的效果比不上單任務，作者的結論是單任務的主要特征在起作用，那些多任務結合效果好的情況，是「主任務比較難學（梯度下降比較緩慢），輔助任務比價好學的時候，多任務會有好效果」

為什么會無效？因為所有有效的原因都有它的負向效果

不同任務的噪聲提高泛化，在模型容量小的時候引入的噪聲也無法忽視。

特征的選擇，交流這些起作用的機制會產生一種負遷移（Negative Transfer），共享的信息交流的信息反而是一種誤導信息

...

Muti-task的一些思路

1. 對任務間的不同強制加稀疏性約束的正則化項

如塊稀疏正則化，對于不同任務的參數，加l1正則，或者l1/lx, x>1等的正則，起任務參數的選擇，讓模型自動去選擇應該共享哪些參數, 在keras的multi-task框架中，就是多個任務的loss相加后，用一個優化器優化，就是這種思路

2. 對中間層添加矩陣先驗，可以學習任務間的關系

3. 共享合適的相關結構

高層次監督（High Supervision），共享大部分結構，后面直接輸出分叉那種共享（就是大多數人入手的multi-task），個人覺得除非有很精致的一些調整，感覺效果很難超多個single-task.

低層次監督（Low Supervision），Deep Multi-Task Learning with Low Level Tasks Supervised at Lower Layers中，在NLP中，作者使用deep bi-RNN低層開始對各個任務分別建模，不共享的部分模型更新時不受其他任務影響，效果不錯。

4. 建模任務之間的關系

建模任務之間的關系有非常多的方式，如，加各種約束項，這個約束項，讓不同任務的參數空間，盡量平均，有很多方式花式拓展，正則也是一種約束項，loss相加也是一種建立任務之間關系的約束項目，如 Learning Multiple Tasks with Kernel Methods[7]對模型聚類，a是任務參數，讓各種任務參數空間盡量靠近

a是各個任務的參數

特征交互，在 Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts 中，作者通過不同任務的高層特征交互，同時完成情感向判斷和情感向原因提取，這跟有些多模態特征fusion的方式很相似，

Cross-Stitch Networks for Multi-Task Learning[8]將兩個獨立的網絡用參數的軟共享方式連接起來, 用所謂的十字繡單元來決定怎么將這些任務相關的網絡利用其他任務中學到的知識，并與前面層的輸出進行線性組合。

串行的聯合多任務模型（A Joint Many-Task Model）

NLP 領域中，各個任務間經常是有層級關系，A Joint Many-Task Model: Growing a Neural Network for Multiple NLP Tasks[9]中在多任務并行的同時，加了串行結構，例如具體任務：詞性分析 POS->語塊分析 CHUNK->依存句法分析 DEP->文本語義相關 Relatedness->文本蘊涵 Entailment，每個子任務都偶有自己的loss, 然后又會作為其他任務的輸入

5. 用loss調整任務之間的關系

Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics[10] 用同方差不確定性對損失進行加權（Weighting losses with Uncertainty)，作者認為最佳權值與不同任務的衡量規模和噪聲相關，而噪聲中除了認知不確定性，異方差不確定性，這些取決于數據的不確定性外，作者把同方差不確定性作為噪聲來對多任務學習中的權重進行優化，作者根據噪聲調整每個任務在代價函數中的相對權重，噪聲大則降低權重，反之。

GradNorm: Gradient Normalization for Adaptive Loss Balancing in Deep Multitask Networks[11] 基于不同任務loss的降低速度來動態調整權值, 作者定義了另外一個專門針對權值的優化函數

是每個任務的loss相對第一步loss的優化程度，是每一步對 task 任務的梯度，即如果某個任務的優化程度小，這個loss會超那么就調大這個任務的權值優化，達到個loss學習程度的平衡

應用|適用任務

輔助任務，相關性任務，對抗性任務....等[12]

責任編輯：xj

原文標題：Multi-Task 多任務學習，那些你不知道的事

文章出處：【微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
31155

瀏覽量
269482
多任務

多任務

+關注

關注
0

文章
18

瀏覽量
9077
機器學習

機器學習

+關注

關注
66

文章
8425

瀏覽量
132773

原文標題：Multi-Task 多任務學習，那些你不知道的事

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

傳統機器學習方法和應用指導

在上一篇文章中，我們介紹了機器學習的關鍵概念術語。在本文中，我們會介紹傳統機器學習的基礎知識和多種算法特征，供各位老師選擇。 01 傳統

發表于 12-30 09:16 ?271次閱讀

傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

zeta在機器學習中的應用 zeta的優缺點分析

在探討ZETA在機器學習中的應用以及ZETA的優缺點時，需要明確的是，ZETA一詞在不同領域可能有不同的含義和應用。以下是根據不同領域的ZETA進行的分析：一、ZETA在機器

發表于 12-20 09:11 ?285次閱讀

cmp在機器學習中的作用如何使用cmp進行數據對比

在機器學習領域，"cmp"這個術語可能并不是一個常見的術語，它可能是指"比較"（comparison）的縮寫。比較在機器學習中的作用模型

發表于 12-17 09:35 ?241次閱讀

什么是機器學習？通過機器學習方法能解決哪些問題？

計算機系統自身的性能”。事實上，由于“經驗”在計算機系統中主要以數據的形式存在，因此機器學習需要設法對數據進行分析學習，這就使得它逐漸成為智能數據分析技術的創新源之一，

發表于 11-16 01:07 ?449次閱讀

什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>？通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題？

NPU與機器學習算法的關系

在人工智能領域，機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升，對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習等機器

發表于 11-15 09:19 ?518次閱讀

eda在機器學習中的應用

在機器學習項目中，數據預處理和理解是成功構建模型的關鍵。探索性數據分析（EDA）是這一過程中不可或缺的一部分。 1. 數據清洗數據清洗是機器學習

發表于 11-13 10:42 ?333次閱讀

機器學習中的數據分割方法

在機器學習中，數據分割是一項至關重要的任務，它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器

發表于 07-10 16:10 ?1945次閱讀

如何理解機器學習中的訓練集、驗證集和測試集

理解機器學習中的訓練集、驗證集和測試集，是掌握機器學習核心概念和流程的重要一步。這三者不僅構成了模型學習

發表于 07-10 15:45 ?4371次閱讀

深度學習中的時間序列分類方法

時間序列分類（Time Series Classification, TSC）是機器學習和深度學習領域的重要任務之一，廣泛應用于人體活動識別、系統監測、金融預測、醫療診斷等多個領域。隨

發表于 07-09 15:54 ?1038次閱讀

深度學習在工業機器視覺檢測中的應用

隨著深度學習技術的快速發展，其在工業機器視覺檢測中的應用日益廣泛，并展現出巨大的潛力。工業機器視覺檢測是工業自動化領域的重要組成部分，通過圖像處理和計算機視覺技術，實現對產品表面缺陷、

發表于 07-08 10:40 ?1109次閱讀

深度學習在視覺檢測中的應用

深度學習是機器學習領域中的一個重要分支，其核心在于通過構建具有多層次的神經網絡模型，使計算機能夠從大量數據中自動學習并提取特征，進而實現對復

發表于 07-08 10:27 ?756次閱讀

機器學習在數據分析中的應用

隨著大數據時代的到來，數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具，通過訓練模型從數據中學習規律，為企業和組織提供了更高效、更準確的數據分析能力。本文將深入探討機器

發表于 07-02 11:22 ?656次閱讀

深度學習與傳統機器學習的對比

在人工智能的浪潮中，機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步，為眾多領域帶來了革命性的變化。然而，盡管它們都屬于

發表于 07-01 11:40 ?1435次閱讀

verilog task和function區別

verilog中的task和function都是用于實現模塊中的可重復的功能，并且可以接收參數和返回結果。但是它們在編寫和使用上有一些區別。下面將詳細介紹task和function的區

發表于 02-22 15:53 ?1141次閱讀

verilog中function和task的區別

在Verilog中，Function和Task是用于模塊化設計和重用代碼的兩種重要元素。它們允許開發人員將復雜的操作分解為更小的功能單元，并在需要時調用它們。雖然Function和Task在某些方面

發表于 02-22 15:40 ?1948次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

機器學習中的Multi-Task多任務學習

評論

傳統機器學習方法和應用指導

zeta在機器學習中的應用 zeta的優缺點分析

cmp在機器學習中的作用如何使用cmp進行數據對比

什么是機器學習？通過機器學習方法能解決哪些問題？

NPU與機器學習算法的關系

eda在機器學習中的應用

機器學習中的數據分割方法

如何理解機器學習中的訓練集、驗證集和測試集

深度學習中的時間序列分類方法

深度學習在工業機器視覺檢測中的應用

深度學習在視覺檢測中的應用

機器學習在數據分析中的應用

深度學習與傳統機器學習的對比

verilog task和function區別

verilog中function和task的區別