本申請涉及水聲識(shí)別領(lǐng)域,尤其涉及一種聲學(xué)信號(hào)識(shí)別方法、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、聲學(xué)信號(hào)作為一種重要的物理現(xiàn)象,在工業(yè)監(jiān)測、環(huán)境評估等多個(gè)領(lǐng)域均有廣泛應(yīng)用。在水聲識(shí)別領(lǐng)域,對船舶等水下目標(biāo)輻射噪聲的有效識(shí)別是實(shí)現(xiàn)目標(biāo)探測、跟蹤和分類的關(guān)鍵。然而,真實(shí)的聲學(xué)信號(hào)往往具有非平穩(wěn)性、多分量混疊、信噪比低等特點(diǎn),傳統(tǒng)的信號(hào)處理方法如短時(shí)傅里葉變換(stft)及其衍生的梅爾頻率倒譜系數(shù)(mfcc)等特征,在處理此類復(fù)雜信號(hào)時(shí),常因固定的時(shí)頻分辨率或?qū)Φ皖l信息捕捉不足而表現(xiàn)不佳。
2、近年來,深度學(xué)習(xí)技術(shù)在模式識(shí)別領(lǐng)域取得了顯著進(jìn)展,也被應(yīng)用于聲學(xué)信號(hào)識(shí)別任務(wù)。但現(xiàn)有深度學(xué)習(xí)模型在應(yīng)用于聲學(xué)領(lǐng)域時(shí),仍面臨一些挑戰(zhàn):一是如何設(shè)計(jì)更符合聲學(xué)信號(hào)物理特性的前端特征提取方法,以充分挖掘信號(hào)中的有效信息;二是如何構(gòu)建能夠智能聚焦關(guān)鍵信息區(qū)域并有效抑制干擾信息;三是如何設(shè)計(jì)兼顧識(shí)別精度與計(jì)算效率的網(wǎng)絡(luò)架構(gòu),以適應(yīng)不同應(yīng)用場景的需求。
3、因此,開發(fā)一種能夠提供精細(xì)化時(shí)頻表征、實(shí)現(xiàn)智能化特征增強(qiáng),并采用高效分層決策機(jī)制的聲學(xué)信號(hào)識(shí)別新方法,對于提升復(fù)雜水下聲學(xué)信號(hào)的識(shí)別性能具有重要意義。
技術(shù)實(shí)現(xiàn)思路
1、本申請為了實(shí)現(xiàn)上述目標(biāo),而提供了一種聲學(xué)信號(hào)識(shí)別方法、電子設(shè)備及存儲(chǔ)介質(zhì)。
2、本申請的技術(shù)方案如下:
3、一種聲學(xué)信號(hào)識(shí)別方法,包括:
4、s1、采集原始的聲學(xué)振動(dòng)信號(hào),經(jīng)過預(yù)處理獲得數(shù)字化的時(shí)域聲學(xué)信號(hào);
5、s2、將時(shí)域聲學(xué)信號(hào)輸入至sc-cqt特征提取模塊,獲得sc-cqt譜圖;
6、s3、將sc-cqt譜圖輸入至daar特征增強(qiáng)模塊進(jìn)行特征增強(qiáng),得到增強(qiáng)特征圖;
7、s4、將所述增強(qiáng)特征圖輸入至abn雙焦點(diǎn)網(wǎng)絡(luò)模塊進(jìn)行識(shí)別,得到聲學(xué)信號(hào)的類別;
8、其中:
9、所述sc-cqt特征提取模塊執(zhí)行:
10、對所述時(shí)域聲學(xué)信號(hào)進(jìn)行常數(shù)q變換處理,得到復(fù)數(shù)cqt系數(shù);
11、根據(jù)所述復(fù)數(shù)cqt系數(shù)計(jì)算出對數(shù)cqt譜;
12、將所述對數(shù)cqt譜沿頻率軸劃分為n個(gè)頻率子帶,生成n個(gè)子代譜圖,n≥2;
13、對每個(gè)子代譜圖的所有頻點(diǎn)乘以對應(yīng)權(quán)重系數(shù);
14、將加權(quán)后的n個(gè)子代譜圖沿頻率軸從低到高級(jí)聯(lián),獲得sc-cqt譜圖;
15、所述daar特征增強(qiáng)模塊執(zhí)行:
16、對輸入的sc-cqt譜圖分別沿頻率軸和時(shí)間軸進(jìn)行自適應(yīng)平均池化,生成一維的頻率特征序列和一維的時(shí)間特征序列;
17、對所述頻率特征序列和所述時(shí)間特征序列執(zhí)行多尺度深度可分離卷積,得到第一語義特征和第二語義特征;
18、對所述第一語義特征、所述第二語義特征及輸入的sc-cqt譜圖進(jìn)行注意力增強(qiáng)處理,獲得增強(qiáng)特征圖;
19、所述abn雙焦點(diǎn)網(wǎng)絡(luò)模塊包括:
20、基礎(chǔ)網(wǎng)絡(luò)base-net,用于對所述增強(qiáng)特征圖實(shí)施卷積操作,以輸出中層特征;
21、概覽網(wǎng)絡(luò)overview-net,用于對基礎(chǔ)網(wǎng)絡(luò)base-net輸出的中層特征進(jìn)行至少兩次卷積下采樣,生成全局上下文先驗(yàn)特征;以及用于對最后一次下采樣的輸出執(zhí)行全局平均池化后,經(jīng)全連接層生成輔助分類結(jié)果;
22、聚焦網(wǎng)絡(luò)focus-net,用于對所述中層特征和所述全局上下文先驗(yàn)特征實(shí)施拼接,以獲得主分類結(jié)果。
23、在一些實(shí)施例中,n=4,四個(gè)頻率子帶為:第一子帶20-150hz、第二子帶150-800hz、第三子帶800-3000hz、第四子帶3000-8000hz;所述權(quán)重系數(shù)分別為:第一子帶1.3、第二子帶1.0、第三子帶1.0、第四子帶0.9。
24、在一些實(shí)施例中,所述注意力增強(qiáng)處理包括:將所述第一語義特征和所述第二語義特征分別通過sigmoid激活函數(shù),生成頻率注意力圖和時(shí)間注意力圖;將所述頻率注意力圖沿時(shí)間軸復(fù)制擴(kuò)展至與所述sc-cqt譜圖尺寸匹配;將所述時(shí)間注意力圖沿頻率軸復(fù)制擴(kuò)展至與所述sc-cqt譜圖尺寸匹配;對擴(kuò)展后的頻率注意力圖和時(shí)間注意力圖進(jìn)行元素級(jí)乘法,得到組合注意力圖;將所述組合注意力圖與sc-cqt譜圖進(jìn)行元素級(jí)乘法,得到增強(qiáng)特征圖。
25、在一些實(shí)施例中,所述多尺度深度可分離卷積的卷積核大小為3、5、7、9,多尺度輸出特征沿通道維度級(jí)聯(lián)后經(jīng)1×1卷積融合。
26、在一些實(shí)施例中,基礎(chǔ)網(wǎng)絡(luò)base-net由3個(gè)卷積塊組成,其中第1和第3卷積塊包含步長為2的卷積層實(shí)現(xiàn)下采樣,每個(gè)卷積塊包括卷積層、批量歸一化層及relu激活函數(shù);所述概覽網(wǎng)絡(luò)overview-net對所述中層特征進(jìn)行兩次步長為2的卷積下采樣;所述聚焦網(wǎng)絡(luò)focus-net執(zhí)行:對全局上下文先驗(yàn)特征進(jìn)行雙線性上采樣;對所述中層特征及采樣后的先驗(yàn)特征分別應(yīng)用1×1卷積,將通道數(shù)調(diào)整為相同值;將通道對齊后的中層特征和全局上下文先驗(yàn)特征沿通道維度拼接。
27、在一些實(shí)施例中,訓(xùn)練abn雙焦點(diǎn)網(wǎng)絡(luò)模塊時(shí):計(jì)算聚焦網(wǎng)絡(luò)focus-net輸出的主分類結(jié)果的交叉熵?fù)p失;計(jì)算概覽網(wǎng)絡(luò)overview-net輸出的輔助分類結(jié)果的交叉熵?fù)p失;按總損失反向傳播優(yōu)化網(wǎng)絡(luò),其中。
28、一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)上述任一所述的聲學(xué)信號(hào)識(shí)別方法。
29、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一所述的聲學(xué)信號(hào)識(shí)別方法。
30、與現(xiàn)有技術(shù)相比,本申請技術(shù)方案的有益效果為:
31、1、提升低頻解析與表征能力:sc-cqt特征提取模塊通過cqt的對數(shù)頻率軸特性及針對性的子帶加權(quán)級(jí)聯(lián),能夠更精確地捕捉到、并增強(qiáng)到低頻信息,為后續(xù)處理提供了高質(zhì)量的特征輸入。
32、2、智能化的特征聚焦與增強(qiáng):daar特征增強(qiáng)模塊通過解耦的維度處理、多尺度語義提取和組合式注意力機(jī)制,能夠自適應(yīng)地突出顯示特征圖中的關(guān)鍵時(shí)頻模式,有效提高特征的信噪比和判別力。
33、3、高效且精準(zhǔn)的分層決策:abn雙焦點(diǎn)網(wǎng)絡(luò)模塊架構(gòu)借鑒了人類認(rèn)知機(jī)制,通過“概覽-聚焦”的分層處理,并利用上下文先驗(yàn)指導(dǎo)深層網(wǎng)絡(luò),實(shí)現(xiàn)了計(jì)算效率與識(shí)別精度的良好平衡,增強(qiáng)了模型的實(shí)用性和魯棒性。
34、本申請?zhí)岢鲇绕溥m用于處理水下目標(biāo)輻射噪聲等具有顯著低頻特征和復(fù)雜時(shí)變特性的聲學(xué)信號(hào),特別適用于信噪比低于10db、非平穩(wěn)性顯著的水下艦船輻射噪聲識(shí)別場景。
1.一種聲學(xué)信號(hào)識(shí)別方法,其特征在于,所述聲學(xué)信號(hào)識(shí)別方法包括:
2.如權(quán)利要求1所述的聲學(xué)信號(hào)識(shí)別方法,其特征在于:
3.如權(quán)利要求1所述的聲學(xué)信號(hào)識(shí)別方法,其特征在于,所述注意力增強(qiáng)處理包括:
4.如權(quán)利要求3所述的聲學(xué)信號(hào)識(shí)別方法,其特征在于,所述多尺度深度可分離卷積的卷積核大小為3、5、7、9,多尺度輸出特征沿通道維度級(jí)聯(lián)后經(jīng)1×1卷積融合。
5.如權(quán)利要求1所述的聲學(xué)信號(hào)識(shí)別方法,其特征在于:
6.根據(jù)權(quán)利要求5所述的聲學(xué)信號(hào)識(shí)別方法,其特征在于,訓(xùn)練abn雙焦點(diǎn)網(wǎng)絡(luò)模塊時(shí):
7.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)權(quán)利要求1-6任一所述的聲學(xué)信號(hào)識(shí)別方法。
8.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-6任一所述的聲學(xué)信號(hào)識(shí)別方法。