一種基于偽標(biāo)簽半監(jiān)督學(xué)習(xí)的小樣本調(diào)制識別算法
來源:《西北工業(yè)大學(xué)學(xué)報》,作者史蘊豪等
摘 要:針對有標(biāo)簽樣本較少條件下的通信信號調(diào)制識別問題,提出了一種基于偽標(biāo)簽半監(jiān)督學(xué)習(xí)技術(shù)的小樣本調(diào)制方式分類算法,通過優(yōu)選人工特征集、設(shè)計高性能分類器以及基于輸出概率的偽標(biāo)簽數(shù)據(jù)選擇方法,構(gòu)建高效的偽標(biāo)簽標(biāo)注系統(tǒng),然后通過該偽標(biāo)簽標(biāo)注系統(tǒng)與基于深度學(xué)習(xí)的信號分類方法配合,實現(xiàn)在少量有標(biāo)簽樣本和大量無標(biāo)簽樣本條件下的調(diào)制方式分類。仿真結(jié)果表明,對6種數(shù)字信號進行調(diào)制識別,在信噪比大于5 dB時,偽標(biāo)簽算法可將模型識別性能提高5%~10%,該算法設(shè)計簡單,具有較大應(yīng)用價值。
關(guān) 鍵 詞:調(diào)制識別; 偽標(biāo)簽; 半監(jiān)督學(xué)習(xí)
通信信號調(diào)制方式識別是通信偵察、認知電子戰(zhàn)領(lǐng)域的關(guān)鍵技術(shù)之一,在實際戰(zhàn)場環(huán)境中,由于敵我雙方的非協(xié)作特性,使得在還原敵方通信信號、獲取敵方情報信息之前必須進行調(diào)制方式識別,此外,通信信號調(diào)制方式識別也為后續(xù)的信號解調(diào)、比特流分析、協(xié)議識別、信號解密、靈巧干擾等提供了重要支撐。
調(diào)制識別技術(shù)發(fā)展至今,已逐漸形成兩大類基于似然比的調(diào)制識別方法和基于特征的調(diào)制識別方法。基于似然比的調(diào)制識別方法主要是通過計算似然概率模型估計不同調(diào)制方式的概率,然后將各個信號代入檢驗,最后判定似然概率最大的為識別結(jié)果?;谒迫槐鹊恼{(diào)制識別算法主要分為3類[1-3],但該類方法普適性差的缺點較為明顯,由于概率密度函數(shù)都是針對特殊環(huán)境提出來的,因此參數(shù)微小的偏差和模型失配都會導(dǎo)致識別率大幅降低。基于特征的調(diào)制識別方法通過提取信號不同特征搭配分類算法從而做到對信號的識別,如文獻[4]使用高階累積量對8種數(shù)字信號進行識別,文獻[5]混合高階累積量與循環(huán)譜特征對信號進行分類,文獻[6-7]使用信號熵特征對不同調(diào)制信號進行分類。但是基于人工提取特征的調(diào)制識別算法中,對特征區(qū)分度要求較高,一旦特征對于不同信號辨別性能差,識別模型效果就會顯著下降,因此有必要對自動提取特征的方法進行研究。
近年來,深度學(xué)習(xí)在模式識別、計算機視覺等領(lǐng)域取得了顯著突破,利用深度學(xué)習(xí)的方法自動提取信號特征并對信號調(diào)制方式進行識別也已經(jīng)取得了不錯的效果,O′Shea等[8-9]最早于2016年利用有監(jiān)督深度學(xué)習(xí)技術(shù)實現(xiàn)調(diào)制方式識別,該論文直接使用卷積祌經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)構(gòu)建端到端的學(xué)習(xí)模型,成功對包括WBFM、DSB、BPSK、16QAM在內(nèi)的11種數(shù)字或模擬調(diào)制方式進行了識別。Jeong等[10]學(xué)者在論文中提出了一種算法,利用短時傅里葉變換(short-time Fourier transform,STFT)將信號從時域轉(zhuǎn)換為時頻域,并通過深度卷積神經(jīng)網(wǎng)絡(luò)提取時頻域特征,最終完成了對2-FSK、4-FSK、8-FSK等7種調(diào)制識別方式的識別,其在-4 dB的信噪比下仍有90%以上的識別正確率。Meng等[11]學(xué)者提出了一種聯(lián)合噪聲估計的調(diào)制識別算法,該研究提出了一種巧妙的網(wǎng)絡(luò)結(jié)構(gòu),同時將原始信號數(shù)據(jù)和信噪比作為神經(jīng)網(wǎng)絡(luò)的輸入,仿真結(jié)果顯示這種算法在不同信噪比下、不同頻偏下的識別成功率已經(jīng)非常接近理論識別率的上限。文獻[12]提出利用時頻圖的紋理信息進行調(diào)制識別,在大樣本條件下,可取得良好的分類效果。Zhang等[13]利用卷積神經(jīng)網(wǎng)絡(luò)提取信號SPWVD時頻圖特征和BJD時頻圖特征并與大量手工特征融合對BPSK、QPSK,OFDM等8種調(diào)制方式進行識別,在-4 dB時仍有92.5%的識別準(zhǔn)確率。
雖然基于深度學(xué)習(xí)的調(diào)制識別方法已經(jīng)取得了非常顯著的成果,但是國內(nèi)外專家的研究重點都偏向于有監(jiān)督深度學(xué)習(xí)方法,而有監(jiān)督深度學(xué)習(xí)方法需要大量有標(biāo)簽信號樣本作為支撐。但在實際應(yīng)用中,一些敏感的軍用通信信號由于受敵方保密要求的限制以及地理環(huán)境條件的制約,在平時只能獲取十分有限的信號樣本,而這些信號真正到了戰(zhàn)場又會大量出現(xiàn)。因此,如何利用少量有標(biāo)簽信號結(jié)合大量無標(biāo)簽信號的小樣本調(diào)制方式識別逐漸成了大家關(guān)注的重點方向之一?,F(xiàn)階段,國內(nèi)外針對小樣本調(diào)制識別的研究尚處于起步階段,但在其他領(lǐng)域已有一些半監(jiān)督學(xué)習(xí)算法出現(xiàn)。半監(jiān)督學(xué)習(xí)解決的就是有標(biāo)簽樣本數(shù)量較少情況下如何提升模型性能的問題,其核心思想為結(jié)合無標(biāo)簽數(shù)據(jù)進行優(yōu)化。盡管無標(biāo)簽數(shù)據(jù)沒有標(biāo)簽信息但是它們和有標(biāo)簽數(shù)據(jù)一樣都是從相同的數(shù)據(jù)源獨立同分布采樣得到的,因此它們包含的關(guān)于數(shù)據(jù)分布的信息對優(yōu)化模型大有裨益[14]。半監(jiān)督學(xué)習(xí)方法主要包括自訓(xùn)練學(xué)習(xí)方法[15]、生成式學(xué)習(xí)方法[16]以及半監(jiān)督支持向量機等[17]。
為了充分利用無標(biāo)簽信號解決小樣本調(diào)制識別問題,本文提出了一種基于偽標(biāo)簽半監(jiān)督學(xué)習(xí)的小樣本調(diào)制識別模型。該模型通過優(yōu)選人工特征集結(jié)合高性能分類器為無標(biāo)簽信號進行預(yù)測打上偽標(biāo)簽,然后利用深度學(xué)習(xí)類方法聯(lián)合訓(xùn)練帶標(biāo)簽樣本與偽標(biāo)簽樣本從而實現(xiàn)小樣本調(diào)制識別。
1 小樣本識別模型
本文采用基于偽標(biāo)簽的半監(jiān)督學(xué)習(xí)方法,在僅有少量有標(biāo)簽信號樣本的條件下進行調(diào)制方式識別?;趥螛?biāo)簽的半監(jiān)督學(xué)習(xí)是一種增量算法,算法流程圖如圖1所示,在分類器訓(xùn)練部分,首先通過少量有標(biāo)簽樣本提取優(yōu)選人工特征送入高性能分類器中進行訓(xùn)練,將信號識別準(zhǔn)確率提升到一個較高水準(zhǔn),此時若環(huán)境中存在大量無標(biāo)簽樣本,則進入偽標(biāo)簽生成部分,利用訓(xùn)練好的高性能分類器對無標(biāo)簽樣本進行預(yù)測,通過預(yù)測的概率對無標(biāo)簽樣本進行排序,給可靠的無標(biāo)簽樣本打上偽標(biāo)簽并加入到訓(xùn)練集中,但該過程并非選擇所有的無標(biāo)簽樣本均加入訓(xùn)練集,因為全部無標(biāo)簽樣本內(nèi)包含的錯誤標(biāo)簽樣本會嚴重干擾模型收斂。當(dāng)環(huán)境中無標(biāo)簽樣本不足時,也可利用分類器訓(xùn)練部分模塊直接進行信號分類。
圖片
圖1 算法流程圖
偽標(biāo)簽算法不斷迭代增加有標(biāo)簽樣本數(shù)量,當(dāng)有標(biāo)簽樣本數(shù)量滿足迭代要求時,進入深度學(xué)習(xí)訓(xùn)練部分,將所有帶標(biāo)簽的樣本數(shù)據(jù)組合新的訓(xùn)練集,使用分類能力更強的深度學(xué)習(xí)類方法對所有標(biāo)簽樣本進行聯(lián)合訓(xùn)練,最后利用訓(xùn)練好的模型對測試信號進行預(yù)測。本文選取BP神經(jīng)網(wǎng)絡(luò)作為生成偽標(biāo)簽的高性能分類器,選取CNN卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)方法訓(xùn)練真實標(biāo)簽樣本與偽標(biāo)簽樣本的合集。
2 信號人工特征
本文選取多類具有良好區(qū)分性能的人工特征作為BP神經(jīng)網(wǎng)絡(luò)輸入,這些特征均已被證明具有良好的區(qū)分能力,其中包括高階累積量特征、熵特征以及時頻特征。
2.1 信號高階累積量特征
在調(diào)制識別技術(shù)領(lǐng)域,高階累積量是應(yīng)用非常廣泛的特征之一,其具有較強的周期分量,可用于準(zhǔn)確識別不同的數(shù)字調(diào)制信號。為了提取高階累積量,首先要計算信號的高階矩,信號高階矩由(1)式計算:
Mpq=E[x(n)p-q(x*(n))q]
(1)
通過信號各高階矩便可計算得到許多高階累積量,本文選擇下列高階累積量,這些累積量均已被證明在調(diào)制樣式分類中有較好鑒別性能[18-19]
圖片
2.2 信息熵特征
熵是用于評價信號或系統(tǒng)狀態(tài)平均不確定性的指標(biāo)。在信息論領(lǐng)域,熵用于衡量信息的信息量大小,信息的不確定程度越大,則其熵值越大,因此信息熵理論為我們提供了一個很好的信號特征描述方法。本文提取信號的功率譜熵、奇異譜熵和能量譜熵,以此作為信號的特征[20-21]。
2.2.1 功率譜熵
假設(shè)時間序列X長為L,對其進行離散傅里葉變換,變換結(jié)果為
圖片
(9)
式中:圖片表示傅里葉變換后的第k個頻譜;N表示變換點數(shù),一般要求N為2的整數(shù)冪且接近序列X的長度。計算頻譜序列Y在y(k)處的功率譜
圖片
(10)
記
圖片
(11)
將(11)式代入香農(nóng)熵計算公式,可得到功率譜香農(nóng)熵。香農(nóng)熵計算公式為:圖片式中,H表示熵值;pi表示信號概率分布。
2.2.2 奇異譜熵
奇異譜分析是近年來非常流行的一種研究非線性時間序列數(shù)據(jù)的強大方法,它結(jié)合相空間重構(gòu)和奇異值分解對時間序列維數(shù)進行估計。若一段離散時間序列為
X=[x1,x2,x3…xN]
首先將信號分段,假設(shè)分段長度為m,在奇異譜分析過程中,m最好為信號周期的整數(shù)倍且不宜超過信號序列長度的1/3,重構(gòu)后的序列軌跡矩陣為
圖片
(12)
對(12)式矩陣進行奇異值分解,可得
圖片
(13)
式中:U和V均為正交矩陣;U為左奇異矩陣;V為右奇異矩陣;Σ矩陣可化為對角陣
圖片
式中,σk表示矩陣M的奇異值且除對角線上元素以外其余值均為零,對角線上的非零元素便構(gòu)成了序列的奇異值譜,即
σ={σ1,σ2,…σi,…σj|j
記pi表示非零奇異值σi占所有非零奇異值之和的比值
圖片
(14)
將(14)式代入香農(nóng)熵計算公式,即可得到奇異值香農(nóng)熵。
將(14)式帶入指數(shù)熵計算公式,即可得到奇異譜指數(shù)熵。指數(shù)熵的計算公式為:H=E[e1-pi]=∑pie1-pi。式中,H表示熵值;pi表示信號概率分布。
2.2.3 能量譜熵
對于序列信號X={x1,x2…xN},其能量譜定義為
圖片
(15)
式中,X(ω)表示序列X的離散傅里葉變換。記pi為
圖片
(16)
將(16)式代入指數(shù)熵計算公式,即可得到信號能量譜指數(shù)熵。
2.3 時頻特征
2.3.1 歸一化中心瞬時振幅功率密度最大值
歸一化中心瞬時振幅的功率密度最大值可在一定程度上反應(yīng)不同信號的譜特征,其定義如下[22]:
圖片
式中:Ns表示信號序列長度;ma表示信號瞬時幅度的均值。
2.3.2 歸一化中心瞬時振幅絕對值的標(biāo)準(zhǔn)差
序列信號歸一化中心瞬時振幅絕對值的標(biāo)準(zhǔn)差可由(18)式求得,其定義如下
圖片
(21)
3 網(wǎng)絡(luò)結(jié)構(gòu)
本節(jié)將對選擇的BP網(wǎng)絡(luò)與CNN卷積神經(jīng)網(wǎng)絡(luò)作詳細介紹。選用BP網(wǎng)絡(luò)主要原因是BP網(wǎng)絡(luò)具有學(xué)習(xí)能力,可以自動學(xué)習(xí)各個特征對分類結(jié)果影響的權(quán)重,即送入網(wǎng)絡(luò)的特征中若有部分在分類方面作用不明顯那么其所屬權(quán)重就會減小。因此對于BP網(wǎng)絡(luò)而言,其對輸入的特征會自動進行“特征篩選”,這在一定程度上可以減輕對先驗信息的依賴,此外,由于深度神經(jīng)網(wǎng)絡(luò)等模型參數(shù)龐大、權(quán)重太多,在小樣本條件時模型過擬合現(xiàn)象非常嚴重,因此淺層BP網(wǎng)絡(luò)用作小樣本階段訓(xùn)練具有明顯優(yōu)勢。
BP網(wǎng)絡(luò)的訓(xùn)練過程如圖2所示,在開始訓(xùn)練時,由于僅有少量的有標(biāo)簽信號樣本,訓(xùn)練出的模型泛化能力弱,而人工特征不依賴于訓(xùn)練數(shù)據(jù),可以彌補訓(xùn)練數(shù)據(jù)量較少時特征表達能力不足的問題,因此本文設(shè)計的BP網(wǎng)絡(luò)模型輸入為已具備分類能力的優(yōu)選特征集。首先對信號進行歸一化處理,然后計算信號熵特征、高階累積量特征和時頻特征,將所有特征組合后一起送入BP網(wǎng)絡(luò)訓(xùn)練,最后利用softmax分類器輸出信號預(yù)測概率。
圖片
圖2 網(wǎng)絡(luò)訓(xùn)練過程
BP網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,本文設(shè)計的BP網(wǎng)絡(luò)由1層輸入層,4層全連接層以及softmax分類器構(gòu)成,輸入層大小為1*13,分別代表13種人工提取的特征,各全連接層神經(jīng)元個數(shù)分別為16,32,64,32,各神經(jīng)元均采用ReLU激活函數(shù)。為提升網(wǎng)絡(luò)的泛化能力,在第三、四層全連接層后使用dropout技術(shù)干擾訓(xùn)練以防止網(wǎng)絡(luò)過擬合,以提高網(wǎng)絡(luò)在測試樣本上的泛化能力,但干擾只發(fā)生在網(wǎng)絡(luò)訓(xùn)練階段,在網(wǎng)絡(luò)模型生成偽標(biāo)簽時則停止干擾,Dropout比率設(shè)置為0.5。BP網(wǎng)絡(luò)訓(xùn)練產(chǎn)生的損失函數(shù)如下所示:
圖片
圖3 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖片
(22)
式中:圖片表示有標(biāo)簽信號產(chǎn)生的分類損失;圖片表示偽標(biāo)簽信號產(chǎn)生的分類損失;N表示有標(biāo)簽信號數(shù)量;N′偽標(biāo)簽信號數(shù)量,μ用于控制2類損失的比重。
在利用偽標(biāo)簽算法迭代訓(xùn)練BP網(wǎng)絡(luò)過程中,有時難免給無標(biāo)簽信號樣本打上錯誤的偽標(biāo)簽,因此偽標(biāo)簽的準(zhǔn)確性對網(wǎng)絡(luò)最終的識別率有決定性影響。由于softmax分類器輸出的是各個類別的預(yù)測概率,因此本文提出可靠條件為
p2+p3≤p1
(23)
式中:p1表示softmax分類器輸出的最大概率;p2,p3依次表示softmax分類器輸出的第二大、第三大概率。即只有softmax輸出的最大概率大于第二大概率與第三大概率之和時,才會給該無標(biāo)簽信號打上偽標(biāo)簽,通過此基于輸出概率的樣本選擇算法便可在一定程度上保證偽標(biāo)簽的可靠性。
無標(biāo)簽樣本標(biāo)注偽標(biāo)簽結(jié)束后,將真實標(biāo)簽樣本與偽標(biāo)簽樣本聯(lián)合起來送入CNN卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練,CNN結(jié)構(gòu)如圖4所示。為充分發(fā)揮卷積神經(jīng)網(wǎng)絡(luò)的特征提取能力,本文直接將IQ信號輸入卷積神經(jīng)網(wǎng)絡(luò),信號輸入網(wǎng)絡(luò)前,將其轉(zhuǎn)換為二維數(shù)據(jù),即若信號長為L,則轉(zhuǎn)換后的數(shù)據(jù)格式為[2,L],兩路分別代表I路數(shù)據(jù)與Q路數(shù)據(jù)。網(wǎng)絡(luò)共包含3層卷積層和3層全連接層,其中第一個卷積層卷積核個數(shù)為64,核尺寸為2*4,第二個卷積層卷積核個數(shù)為32,核尺寸為1*4,第三個卷積層卷積核個數(shù)為16,核尺寸為1*4。卷積層完成對序列數(shù)據(jù)的特征提取,將提取后的特征轉(zhuǎn)換為一維序列送入全連接層,3層全連接層的維度分別為64,32,16,將第三個全連接層輸出的特征送入softmax分類器進行分類,輸出預(yù)測結(jié)果,并通過反向傳播不斷優(yōu)化網(wǎng)絡(luò)參數(shù)。
圖片
圖4 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
4 仿真結(jié)果及分析
本文選用的調(diào)制信號集為{BPSK,4PAM,4PSK,8PSK,16QAM,64QAM},共計6種數(shù)字調(diào)制信號,信號序列長度L=100,信噪比從-10至20 dB,間隔為2 dB。訓(xùn)練集每類信號生成4 000個信號樣本,信噪比隨機,共計24 000個樣本。測試集每類信號每個信噪比點生成500個信號,共計48 000個信號,所有信號均由MATLABR2016a仿真生成。
網(wǎng)絡(luò)訓(xùn)練均基于Python下的Keras深度學(xué)習(xí)框架實現(xiàn),硬件平臺為Intel(R)Core(TM)i7-8700CPU,GPU為NVIDIA GeForce 1060Ti。
4.1 信號特征提取分析
本節(jié)對6類數(shù)字信號在-10至20 dB間每個信噪比點生成500個樣本,提取信號13種特征并取平均值,取其中具有代表性的特征并繪圖,得到圖5所示的特征曲線圖。在進行信號奇異譜分析時,由于信號序列長度L=100,且基帶序列為隨機生成無周期特性,因此設(shè)置分段長度m=33;在計算序列離散傅里葉變換時,由于要求傅里葉變換點數(shù)靠近序列長度且為2的整數(shù)冪,因此設(shè)置傅里葉變換點數(shù)
圖片
圖5 信號特征曲線圖
N=128。
圖5a)至5e)分別代表信號功率譜香農(nóng)熵、高階累積量C40、高階累積量C61、奇異譜指數(shù)熵、功率譜峰值和瞬時幅度標(biāo)準(zhǔn)差隨信噪比變化的曲線。可以看出,隨著信噪比的不斷上升,各類信號特征間的差異越來越大,代表著特征的區(qū)分能力越來越強,但每個特征均有無法區(qū)分的調(diào)制信號,因此本文選擇綜合13類特征一起作為分類特征。
4.2 偽標(biāo)簽算法可行性分析
本節(jié)對比3類識別算法在不同訓(xùn)練樣本總量下的識別性能,分別為人工提取特征結(jié)合BP神經(jīng)網(wǎng)絡(luò)、時序IQ序列結(jié)合CNN卷積神經(jīng)網(wǎng)絡(luò)、時序IQ序列結(jié)合LSTM循環(huán)神經(jīng)網(wǎng)絡(luò),LSTM網(wǎng)絡(luò)為KERAS框架下的CuDNNLSTM。3類算法均迭代200次,使用Adam函數(shù)優(yōu)化。當(dāng)不同樣本量條件下進行調(diào)制方式識別時,各算法在測試集上的性能如圖6所示,從仿真結(jié)果可以看出,當(dāng)訓(xùn)練樣本數(shù)量有限時,例如圖6a)所示總樣本量為600個,通過人工提取特征結(jié)合BP神經(jīng)網(wǎng)絡(luò)的識別率要遠高于CNN卷積神經(jīng)網(wǎng)絡(luò)的識別率以及LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的識別率。但隨著樣本數(shù)量的不斷增加,人工提取特征結(jié)合BP神經(jīng)網(wǎng)絡(luò)的識別率變化不大,而CNN卷積神經(jīng)網(wǎng)絡(luò)的識別率和LSTM網(wǎng)絡(luò)的識別率則上升的非常快,當(dāng)總樣本量達到6 000時,CNN的最高識別性能已經(jīng)優(yōu)于人工提取特征結(jié)合BP網(wǎng)絡(luò)的性能,其最高識別率可以達到85%以上,當(dāng)總樣本量達到24 000時,網(wǎng)絡(luò)的最高識別率可以達到95%以上。因此,利用人工特征結(jié)合BP神經(jīng)網(wǎng)絡(luò)在樣本量較少的情況下采用偽標(biāo)簽增量算法增加訓(xùn)練數(shù)據(jù)總樣本量,而后采用CNN卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練是可行的。
圖片
圖6 不同樣本總量下各算法識別率曲線
4.3 偽標(biāo)簽算法識別率分析
通過4.2節(jié)中的仿真結(jié)果可分析出,在樣本量充足的條件下本文提出的CNN深度卷積神經(jīng)網(wǎng)絡(luò)模型性能優(yōu)于CuDNNLSTM網(wǎng)絡(luò),因此本文選用CNN作為訓(xùn)練模型對打偽標(biāo)簽后的樣本集進行訓(xùn)練。
假設(shè)初始條件為有每類調(diào)制信號有100,500,1 000個帶標(biāo)簽樣本,共600,3 000,6 000個帶標(biāo)簽樣本以及48 000個無標(biāo)簽樣本,首先通過人工提取特征結(jié)合BP神經(jīng)網(wǎng)絡(luò)對600,3 000,6 000個帶標(biāo)簽樣本進行訓(xùn)練,而后通過偽標(biāo)簽增量算法對無標(biāo)簽樣本打偽標(biāo)簽,最后利用CNN對有標(biāo)簽樣本、偽標(biāo)簽樣本的IQ序列進行聯(lián)合訓(xùn)練。在CNN網(wǎng)絡(luò)訓(xùn)練過程中,由于真實標(biāo)簽樣本與測試集樣本分布相同且標(biāo)簽準(zhǔn)確,因此本文選用真實標(biāo)簽樣本作為驗證集,以此提升網(wǎng)絡(luò)在測試集上的識別性能。
當(dāng)使用600個真實標(biāo)簽樣本對大量無標(biāo)簽樣本預(yù)測偽標(biāo)簽時,樣本數(shù)隨迭代次數(shù)的變化如表1所示。
表1 600個真實樣本
圖片
從表1的結(jié)果可以看出,隨著迭代次數(shù)的不斷增加,偽標(biāo)簽數(shù)量不斷提升,但由于設(shè)置了可靠條件,所以偽標(biāo)簽樣本總量并未達到48 000。將所有真實標(biāo)簽樣本和偽標(biāo)簽樣本一并送入CNN卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,共計29 520個樣本,測試集的識別率如圖7所示。
圖片
圖7 偽標(biāo)簽算法識別率對比
當(dāng)訓(xùn)練樣本總量為29 520時,算法各部分運行時間如表2所示,當(dāng)使用3 000個真實標(biāo)簽樣本對大量無標(biāo)簽樣本預(yù)測偽標(biāo)簽時,樣本數(shù)隨迭代次數(shù)的變化如表3所示,從表3的結(jié)果可以看出,隨著迭代次數(shù)的不斷增加,偽標(biāo)簽數(shù)量不斷提升,經(jīng)過5次迭代后訓(xùn)練樣本數(shù)總數(shù)可達36 566個,測試集的識別率如圖8所示,當(dāng)訓(xùn)練樣本總量為36 566個時,算法各部分運行時間如表4所示。
表2 算法運行時間 單位:s
圖片
表3 3 000個真實樣本
圖片
表4 算法運行時間 單位:s
圖片
圖8 偽標(biāo)簽算法識別率對比
當(dāng)使用6 000個真實標(biāo)簽樣本對大量無標(biāo)簽樣本預(yù)測偽標(biāo)簽時,樣本數(shù)隨迭代次數(shù)的變化如表5所示。從表5的結(jié)果可以看出,隨著迭代次數(shù)的不斷增加,偽標(biāo)簽樣本數(shù)量不斷提升,經(jīng)過5次迭代后訓(xùn)練樣本數(shù)總數(shù)可達41 063個,測試集的識別率如圖9所示。
表5 6 000個真實樣本
圖片
圖9 偽標(biāo)簽算法識別率對比
當(dāng)訓(xùn)練樣本總量為41 063時,算法各部分運行時間如表6所示。
表6 算法運行時間 單位:s
圖片
通過仿真結(jié)果可以看出,在小樣本條件下,利用偽標(biāo)簽增量算法對傳統(tǒng)特征結(jié)合BP神經(jīng)網(wǎng)絡(luò)的識別性能有一定的提升,當(dāng)信噪比大于5 dB時,本文提出的偽標(biāo)簽CNN的網(wǎng)絡(luò)識別率相較于BP神經(jīng)網(wǎng)絡(luò)結(jié)合人工特征的識別率可提高約5%~10%。
實際上本文提出的偽標(biāo)簽半監(jiān)督模型,其性能與生成偽標(biāo)簽所用的人工特征集以及分類器密切相關(guān),通過大量實驗發(fā)現(xiàn),如果偽標(biāo)簽標(biāo)注分類器不能很好區(qū)分信號類型,那么能夠獲得的有效偽標(biāo)簽樣本就會較少,總體識別準(zhǔn)確率就會偏低,但如果能進一步提升偽標(biāo)簽分類器的識別率,將其控制到90%以上,那么整體算法的識別率甚至可以接近100%。在實際應(yīng)用過程中,一方面可以實時監(jiān)控偽標(biāo)簽樣本數(shù)量分布,從而掌握深度學(xué)習(xí)類方法是否有足夠的樣本量支撐,另一方面還可以不斷改進特征集和分類器,繼續(xù)研究更具區(qū)分能力的特征并選擇更復(fù)雜的模型作為偽標(biāo)簽生成器,這樣深度學(xué)習(xí)類方法的性能也會不斷提升。
5 結(jié) 論
本文針對戰(zhàn)場信號調(diào)制識別領(lǐng)域可能出現(xiàn)的小樣本情況進行研究,設(shè)計了基于人工優(yōu)選特征集與BP神經(jīng)網(wǎng)絡(luò)的信號偽標(biāo)簽標(biāo)注方法,并結(jié)合基于CNN的通信信號分類模型,形成了小樣本條件下通信信號分類新的解決方案,通過大量的實驗驗證了方案的可行性,在單個信號類型的帶標(biāo)簽樣本量為100以上時,本文模型就可有效工作,且在不同標(biāo)簽樣本量條件下,其總體性能均比常規(guī)方法有明顯提升。
審核編輯:符乾江
評論
查看更多