本發(fā)明涉及數(shù)據(jù)處理,尤其涉及一種基于神經(jīng)網(wǎng)絡(luò)的微量級(jí)嵌入式系統(tǒng)語音增強(qiáng)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、對(duì)于嵌入式系統(tǒng)而言,傳統(tǒng)算法在計(jì)算資源和實(shí)時(shí)性方面具有優(yōu)勢(shì),但神經(jīng)網(wǎng)絡(luò)模型在降噪效果方面更為出色。
2、傳統(tǒng)降噪算法通常依賴數(shù)學(xué)公式和統(tǒng)計(jì)方法,計(jì)算復(fù)雜度較低,但是靈活性差,難以處理復(fù)雜環(huán)境下的噪聲,例如非平穩(wěn)噪聲環(huán)境。傳統(tǒng)算法需要花費(fèi)大量時(shí)間手動(dòng)去調(diào)參,同時(shí)傳統(tǒng)算法很難達(dá)到神經(jīng)網(wǎng)絡(luò)的降噪效果。
3、雖然大型神經(jīng)網(wǎng)絡(luò)有強(qiáng)大的泛化和表達(dá)能力,但是能耗高,實(shí)時(shí)性差,需要計(jì)算量較大,這導(dǎo)致大型模型不適合部署在嵌入式系統(tǒng)上。有一些小型神經(jīng)網(wǎng)絡(luò)模型是用語音一幀的功率譜進(jìn)行輸入,即使是這種情況下,復(fù)雜度還是比較大,隨之計(jì)算量還是增大。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了一種基于神經(jīng)網(wǎng)絡(luò)的微量級(jí)嵌入式系統(tǒng)語音增強(qiáng)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),以在減少降噪計(jì)算量的同時(shí)提升降噪效果。
2、根據(jù)本發(fā)明的一方面,提供了一種基于神經(jīng)網(wǎng)絡(luò)的微量級(jí)嵌入式系統(tǒng)語音增強(qiáng)方法,該方法包括:
3、獲取待處理語音數(shù)據(jù)的功率譜數(shù)據(jù),并為預(yù)設(shè)濾波器組計(jì)算濾波器組系數(shù);
4、將所述功率譜數(shù)據(jù)和所述濾波器組系數(shù)輸入預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),得到初始維納濾波系數(shù),所述預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)通過比率掩碼方式和信號(hào)近似方式訓(xùn)練得到;
5、對(duì)所述初始維納濾波系數(shù)進(jìn)行插值處理,得到與所述待處理語音數(shù)據(jù)頻點(diǎn)數(shù)量相同的目標(biāo)維納濾波系數(shù);
6、通過所述目標(biāo)維納濾波系數(shù)處理所述待處理語音數(shù)據(jù),得到降噪處理后語音數(shù)據(jù)。
7、根據(jù)本發(fā)明的另一方面,提供了一種基于神經(jīng)網(wǎng)絡(luò)的微量級(jí)嵌入式系統(tǒng)語音增強(qiáng)裝置,該裝置包括:
8、濾波器組系數(shù)計(jì)算模塊,用于獲取待處理語音數(shù)據(jù)的功率譜數(shù)據(jù),并為預(yù)設(shè)濾波器組計(jì)算濾波器組系數(shù);
9、第一濾波系數(shù)獲取模塊,用于將所述功率譜數(shù)據(jù)和所述濾波器組系數(shù)輸入預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),得到初始維納濾波系數(shù),所述預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)通過比率掩碼方式和信號(hào)近似方式訓(xùn)練得到;
10、第二濾波系數(shù)獲取模塊,用于對(duì)所述初始維納濾波系數(shù)進(jìn)行插值處理,得到與所述待處理語音數(shù)據(jù)頻點(diǎn)數(shù)量相同的目標(biāo)維納濾波系數(shù);
11、處理后語音數(shù)據(jù)獲取模塊,用于通過所述目標(biāo)維納濾波系數(shù)處理所述待處理語音數(shù)據(jù),得到降噪處理后語音數(shù)據(jù)。
12、根據(jù)本發(fā)明的另一方面,提供了一種電子設(shè)備,所述電子設(shè)備包括:
13、至少一個(gè)處理器;以及
14、與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,
15、所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行本發(fā)明任一實(shí)施例所述的基于神經(jīng)網(wǎng)絡(luò)的微量級(jí)嵌入式系統(tǒng)語音增強(qiáng)方法。
16、根據(jù)本發(fā)明的另一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)本發(fā)明任一實(shí)施例所述的基于神經(jīng)網(wǎng)絡(luò)的微量級(jí)嵌入式系統(tǒng)語音增強(qiáng)方法。
17、本發(fā)明實(shí)施例的技術(shù)方案,通過獲取待處理語音數(shù)據(jù)的功率譜數(shù)據(jù),并為預(yù)設(shè)濾波器組計(jì)算濾波器組系數(shù);將功率譜數(shù)據(jù)和濾波器組系數(shù)輸入預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),得到初始維納濾波系數(shù),預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)通過比率掩碼方式和信號(hào)近似方式訓(xùn)練得到;對(duì)初始維納濾波系數(shù)進(jìn)行插值處理,得到與待處理語音數(shù)據(jù)頻點(diǎn)數(shù)量相同的目標(biāo)維納濾波系數(shù);通過目標(biāo)維納濾波系數(shù)處理待處理語音數(shù)據(jù),得到降噪處理后語音數(shù)據(jù),采用引入濾波器組和通過比率掩碼方式和信號(hào)近似方式訓(xùn)練的預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)對(duì)待處理語音數(shù)據(jù)進(jìn)行降噪處理的技術(shù)手段,解決了傳統(tǒng)降噪算法降噪效果不佳以及現(xiàn)有神經(jīng)網(wǎng)絡(luò)降噪存在計(jì)算量大的問題,在減少降噪計(jì)算量的同時(shí)提升降噪效果。
18、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本發(fā)明的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本發(fā)明的范圍。本發(fā)明的其它特征將通過以下的說明書而變得容易理解。
1.一種基于神經(jīng)網(wǎng)絡(luò)的微量級(jí)嵌入式系統(tǒng)語音增強(qiáng)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,為預(yù)設(shè)濾波器組計(jì)算濾波器組系數(shù),包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述語音頻率上限值和所述語音頻率下限值,計(jì)算與所述預(yù)設(shè)濾波器組數(shù)量相同的梅爾刻度,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述功率譜數(shù)據(jù)和所述濾波器組系數(shù)輸入預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),得到初始維納濾波系數(shù),包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)通過以下方式訓(xùn)練獲得:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)所述帶噪語音的功率譜特征向量集和所述純凈語音的功率譜特征向量集對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行比率掩碼形式的訓(xùn)練,得到第一神經(jīng)網(wǎng)絡(luò),包括:
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)所述帶噪語音的功率譜特征向量集和所述純凈語音的功率譜特征向量集對(duì)所述第一神經(jīng)網(wǎng)絡(luò)進(jìn)行信號(hào)近似形式的訓(xùn)練,得到第二神經(jīng)網(wǎng)絡(luò)作為所述預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),包括:
8.一種基于神經(jīng)網(wǎng)絡(luò)的微量級(jí)嵌入式系統(tǒng)語音增強(qiáng)裝置,其特征在于,包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述的基于神經(jīng)網(wǎng)絡(luò)的微量級(jí)嵌入式系統(tǒng)語音增強(qiáng)方法。