本公開涉及計(jì)算機(jī),具體地,涉及一種音頻處理方法、裝置、可讀介質(zhì)及電子設(shè)備。
背景技術(shù):
1、語音增強(qiáng)(speech?enhancement)旨在提高語音信號(hào)的質(zhì)量,改善語音信號(hào)在傳輸和處理過程中的可理解性和可辨認(rèn)性,語音增強(qiáng)技術(shù)可以應(yīng)用于語音通信、語音識(shí)別等領(lǐng)域。
2、相關(guān)技術(shù)中,定向語音增強(qiáng)指的是增強(qiáng)信號(hào)中特定方向的聲音,而抑制非特定方向的聲音,該方案需要多個(gè)氣傳導(dǎo)麥克風(fēng)形成陣列接收語音信號(hào),但是可穿戴設(shè)備上的氣傳導(dǎo)麥克風(fēng)數(shù)量較少,實(shí)際應(yīng)用中效果不佳。
技術(shù)實(shí)現(xiàn)思路
1、提供該部分內(nèi)容以便以簡(jiǎn)要的形式介紹構(gòu)思,這些構(gòu)思將在后面的具體實(shí)施方式部分被詳細(xì)描述。該部分內(nèi)容并不旨在標(biāo)識(shí)要求保護(hù)的技術(shù)方案的關(guān)鍵特征或必要特征,也不旨在用于限制所要求的保護(hù)的技術(shù)方案的范圍。
2、第一方面,本公開提供一種音頻處理方法,所述音頻處理方法包括:
3、獲取骨傳導(dǎo)麥克風(fēng)采集的骨傳導(dǎo)信號(hào)以及氣傳導(dǎo)麥克風(fēng)采集的氣傳導(dǎo)信號(hào);
4、根據(jù)所述氣傳導(dǎo)信號(hào)和第一信號(hào)處理模型得到定向波束音頻特征和噪聲音頻特征,并根據(jù)所述骨傳導(dǎo)信號(hào)和第二信號(hào)處理模型得到骨傳導(dǎo)音頻特征,所述第一信號(hào)處理模型用于提取所述氣傳導(dǎo)信號(hào)中指定方向的定向波束音頻特征和全方向的噪聲音頻特征,所述第二信號(hào)處理模型用于提取所述骨傳導(dǎo)信號(hào)中的音頻特征;
5、基于所述氣傳導(dǎo)信號(hào)、所述骨傳導(dǎo)音頻特征、所述噪聲音頻特征和所述定向波束音頻特征,得到所述指定方向的目標(biāo)增強(qiáng)音頻信號(hào)。
6、第二方面,本公開提供一種音頻處理裝置,所述音頻處理裝置包括:
7、獲取模塊,用于獲取骨傳導(dǎo)麥克風(fēng)采集的骨傳導(dǎo)信號(hào)以及氣傳導(dǎo)麥克風(fēng)采集的氣傳導(dǎo)信號(hào);
8、模型處理模塊,用于根據(jù)所述氣傳導(dǎo)信號(hào)和第一信號(hào)處理模型得到定向波束音頻特征和噪聲音頻特征,并根據(jù)所述骨傳導(dǎo)信號(hào)和第二信號(hào)處理模型得到骨傳導(dǎo)音頻特征,所述第一信號(hào)處理模型用于提取所述氣傳導(dǎo)信號(hào)中指定方向的定向波束音頻特征和全方向的噪聲音頻特征,所述第二信號(hào)處理模型用于提取所述骨傳導(dǎo)信號(hào)中的音頻特征;
9、增強(qiáng)模塊,用于基于所述氣傳導(dǎo)信號(hào)、所述骨傳導(dǎo)音頻特征、所述噪聲音頻特征和所述定向波束音頻特征,得到所述指定方向的目標(biāo)增強(qiáng)音頻信號(hào)。
10、第三方面,本公開提供一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理裝置執(zhí)行時(shí)實(shí)現(xiàn)第一方面中任一項(xiàng)所述方法的步驟。
11、第四方面,本公開提供一種電子設(shè)備,包括:
12、存儲(chǔ)裝置,其上存儲(chǔ)有計(jì)算機(jī)程序;
13、處理裝置,用于執(zhí)行所述存儲(chǔ)裝置中的所述計(jì)算機(jī)程序,以實(shí)現(xiàn)第一方面中任一項(xiàng)所述方法的步驟。
14、通過上述技術(shù)方案,首先獲取骨傳導(dǎo)麥克風(fēng)采集的骨傳導(dǎo)信號(hào)以及氣傳導(dǎo)麥克風(fēng)采集的氣傳導(dǎo)信號(hào),然后根據(jù)氣傳導(dǎo)信號(hào)和第一信號(hào)處理模型得到定向波束音頻特征和噪聲音頻特征,并根據(jù)骨傳導(dǎo)信號(hào)和第二信號(hào)處理模型得到骨傳導(dǎo)音頻特征,進(jìn)而基于氣傳導(dǎo)信號(hào)、骨傳導(dǎo)音頻特征、噪聲音頻特征和定向波束音頻特征,得到指定方向的目標(biāo)增強(qiáng)音頻信號(hào)。采用該方法,通過區(qū)分氣傳導(dǎo)信號(hào)的定向波束音頻特征和噪聲音頻特征,可以增強(qiáng)指定方向的音頻信號(hào)并抑制非指定方向的音頻信號(hào),并結(jié)合骨傳導(dǎo)信號(hào)的音頻特征進(jìn)一步增強(qiáng)音頻信號(hào),得到指定方向的增強(qiáng)音頻信號(hào),無需設(shè)置多個(gè)氣傳導(dǎo)麥克風(fēng),可以應(yīng)用于可穿戴設(shè)備中,并且能夠提高音頻信號(hào)的質(zhì)量,改善音頻信號(hào)在傳輸和處理過程中的可理解性和可辨認(rèn)性。
15、本公開的其他特征和優(yōu)點(diǎn)將在隨后的具體實(shí)施方式部分予以詳細(xì)說明。
1.一種音頻處理方法,其特征在于,所述音頻處理方法包括:
2.根據(jù)權(quán)利要求1所述的音頻處理方法,其特征在于,所述根據(jù)所述氣傳導(dǎo)信號(hào)和第一信號(hào)處理模型得到定向波束音頻特征和噪聲音頻特征,包括:
3.根據(jù)權(quán)利要求2所述的音頻處理方法,其特征在于,所述基于所述氣傳導(dǎo)信號(hào)、所述頻帶信噪比和所述第一信號(hào)處理模型,得到所述指定方向的定向波束音頻特征和所述全方向的噪聲音頻特征,包括:
4.根據(jù)權(quán)利要求3所述的音頻處理方法,其特征在于,所述根據(jù)所述氣傳導(dǎo)頻域信號(hào)、所述頻帶信噪比和所述第一信號(hào)處理模型,得到所述定向波束音頻特征和所述噪聲音頻特征,包括:
5.根據(jù)權(quán)利要求3所述的音頻處理方法,其特征在于,所述根據(jù)所述氣傳導(dǎo)頻域信號(hào)、所述頻帶信噪比和所述第一信號(hào)處理模型,得到所述定向波束音頻特征和所述噪聲音頻特征,包括:
6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的音頻處理方法,其特征在于,所述第一信號(hào)處理模型是通過如下方式得到的:
7.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的音頻處理方法,其特征在于,所述根據(jù)所述骨傳導(dǎo)信號(hào)和第二信號(hào)處理模型得到骨傳導(dǎo)音頻特征,包括:
8.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的音頻處理方法,其特征在于,所述基于所述氣傳導(dǎo)信號(hào)、所述骨傳導(dǎo)音頻特征、所述噪聲音頻特征和所述定向波束音頻特征,得到所述指定方向的目標(biāo)增強(qiáng)音頻信號(hào),包括:
9.一種音頻處理裝置,其特征在于,所述音頻處理裝置包括:
10.一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理裝置執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-8中任一項(xiàng)所述方法的步驟。
11.一種電子設(shè)備,其特征在于,包括: