面向移動應用的語音編解碼開環基音搜索方法
摘要:基音周期搜索的準確性將直接影響到語音編碼器的編碼質量和效率。本文根據AMR-WB+標準中基音周期搜索算法會發生檢測基音倍頻和半頻錯誤,提出了開環基音搜索算法。該算法以自相關函數為基礎,利用基音周期的
(3)判斷自相關函數序列中的最大值對應的基音周期候選值是否為當前最佳基音周期候選值的加倍,若是,保持當前的基音周期最佳候選值,否則設定自相關函數序列中最大值對應的基音周期候選值作為最佳基音周期候選值。
得到了最佳基音周期候選值后,要進行可靠的基音周期全局參考(global_pitch)確定。確定基音周期全局參考的算法為:
(1)若當前幀可以確定可靠的基音周期參考,即確定新的基音周期全局參考,否則,要在當前幀延續近期可靠的基音周期全局參考。若超過了額定的保持基音周期全局參考的幀數,則強制基音周期全局參考為0,意味著該語音片段并不是濁音,而且也不具備較好的基音周期連續性;
(2)對于可靠的基音周期參考,其確定方式為滿足以下4個條件之一即可:
① 基音周期候選值序列中,自相關函數最大值并不是最佳基音周期候選對應的自相關函數值的加倍,并且最佳的基音周期候選值與當前的基音周期全局參考的差值的絕對值小于8 (延續前幀);
② 自相關函數序列中最大值與其它值的比值均大于1.7 (在這種情況下,前面遴選出的最佳基音周期候選值一定是自相關函數序列中最大值對應的基音周期候選值);
③ 基音周期候選值序列中存在基音周期候選值為最佳基音周期候選值的加倍;
④ 當前的基音周期全局參考(延續前幀)是當前最佳基音周期候選值的加倍,并且自相關函數的最大值要大于0.36這一門限。
滿足這四個條件時,基本就可以斷定該段語音信號為一個周期性比較強的濁音信號,因此利用這段語音信號可以確定一個基音周期的全局參考值,該全局參考值可以適用于當前幀以及后來幀。倘若不滿足上述的條件,即不能確定可靠的基音周期,則要考慮是否沿用前面確定的可靠的基音周期全局參考,本文中設定基音周期參考軌跡可以保持三幀,首先判斷是否保持了三幀,如果超過三幀,則強制當前幀的基音周期參考為0,失去參考的意義。否則,考察是否自相關函數最大值小于0.15這一門限,若小于該門限超過1幀,則仍強制該基音周期全局參考為0。
1.3基音周期確定
基音周期的確定可基于前面計算出來的自相關函數序列,以及其對應的基音周期候選序列來分別進行不同情況的基音周期判斷。
在確定基音周期時,需分三種情況確定最終的基音周期:
(1)基音周期候選與基音周期全局參考的差值的絕對值小于5;
(2)最大自相關函數值小于門限值0.15;
(3)無法明顯判斷基音周期,基音周期確定參考值用來對最后的基音周期的確定起到參考的作用,確定該值的步驟如下:
① 若基音周期全局參考非零,基音周期確定參考值設定為基音周期的全局參考;
② 否則,基音周期確定參考值設定為上一個不為0的基音周期全局參考,若上一個不為0的基音周期全局參考保持超過3幀,則該值強制為0。
利用上述條件確定的基音周期確定參考值對整個基音周期候選序列進行搜索,找到基音周期候選值最接近基音周期確定參考值的一個值,將其對應的自相關函數加倍,并重新排序自相關函數值,隨之移動對應的基音周期搜索候選值,同時找到自相關函數最大的基音周期候選值作為基音周期輸出。
2實驗分析
實驗采用本文算法與AMR-WB+中的算法進行對比,以ACELP編碼模式中的分段信噪比作為客觀評價標準,測試數據采用MPEG標準的12個序列,實驗結果如表1所示。其圖示實驗結果如圖1所示。
3結束語
AVS P10標準采用最大化自相關函數值從而得到的基音周期候選值,該候選值與求原始信號以及延遲信號的誤差的最小均方差標準求解得到的基音周期候選值一致,從統計意義上講比較精確,并且與后面的閉環基音搜索中的整數基音搜索相一致。本文中使用歸一化的自相關函數,以通過對自相關函數值的分類分析解決倍周期問題,并且對基音周期平滑性進行加權和判斷語音的周期性強弱,進而最終確定基音周期。在判定過程中設定基音周期全局參考軌跡作為基音周期全局變化的量度,用于平滑基音周期,并采用分類的基音周期分析,針對信號自適應地最佳確定基音周期,解決了基音周期變化范圍大的問題。AVS P10標準的算法運算復雜度和存儲開銷均小于AMR-WB+,而性能與AMR-WB+相當。
參考文獻:
[1]GRIFFIN, DANIEL W, LIM, et al. New Pitch detection algorithm[C]//Proceedings of the International Conference on Digital Signal Processing, 1984: 395-399.
[2]JANER L. New pitch detection algorithm based on wavelet transform[C]//IEEE International Symposium on Signal Processing,1998: 165-168.
[3]樓紅偉,趙建偉,胡光銳.一種小波加權的基音檢測方法[J].上海交通大學學報,2003,37(3): 447-449.
[4]黃海,潘家強.基于Hilbert-Huang變換的基音周期提取方法[J].聲學學報,2006,31(1):35-41.
[5]ZHAO Z D, HU X M, TIAN J F. An effective pitch detection method for speech signals with low signal-to-noise ratio[C]//IEEE International Conference on Machine Learning and Cybernetics[C]. 2008, 5: 2775-2778.
[6]BA H, YANG N, DEMIRKOL I, et al. BaNa: A hybrid approach for noise resilient pitch detection[C]// IEEE Statistical Signal Processing Workshop (SSP), 2012: 369-372.
[7]MAKINEN J, BESSETTE B, BRUHN S, et al. AMR-WB+: A new audio coding standard For 3rd generation mobile audio services[C]//IEEE International Conference on Acoustics, Speech and Signal Processing, 2005.
責任編輯:葉雨田
免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
-
現貨模式下谷電用戶價值再評估
2020-10-10電力現貨市場,電力交易,電力用戶 -
PPT | 高校綜合能源服務有哪些解決方案?
2020-10-09綜合能源服務,清潔供熱,多能互補 -
深度文章 | “十三五”以來電力消費增長原因分析及中長期展望
2020-09-27電力需求,用電量,全社會用電量
-
PPT | 高校綜合能源服務有哪些解決方案?
2020-10-09綜合能源服務,清潔供熱,多能互補 -
深度文章 | “十三五”以來電力消費增長原因分析及中長期展望
2020-09-27電力需求,用電量,全社會用電量 -
我國電力改革涉及的電價問題
-
貴州職稱論文發表選擇泛亞,論文發表有保障
2019-02-20貴州職稱論文發表 -
《電力設備管理》雜志首屆全國電力工業 特約專家征文
2019-01-05電力設備管理雜志 -
國內首座蜂窩型集束煤倉管理創新與實踐
-
人力資源和社會保障部:電線電纜制造工國家職業技能標準
-
人力資源和社會保障部:變壓器互感器制造工國家職業技能標準
-
《低壓微電網并網一體化裝置技術規范》T/CEC 150
2019-01-02低壓微電網技術規范
-
現貨模式下谷電用戶價值再評估
2020-10-10電力現貨市場,電力交易,電力用戶 -
建議收藏 | 中國電價全景圖
2020-09-16電價,全景圖,電力 -
一張圖讀懂我國銷售電價附加
2020-03-05銷售電價附加
-
電氣工程學科排行榜發布!華北電力大學排名第二
-
國家電網61家單位招聘畢業生
2019-03-12國家電網招聘畢業生 -
《電力設備管理》雜志讀者俱樂部會員招募
2018-10-16電力設備管理雜志