您的当前位置:首页正文

基于小波变换的语音基音周期检测

2020-10-08 来源:钮旅网
2011年7月 电子测试 Ju1.2o1 1 第7期 ELEcTRONlc TEST No.7 基于小波变换的语音基音周期检测★ 刘成明,李新娥,张艳兵 (中北大学仪器科学与动态测试教育部重点实验室,山西太原030051) 摘要:语音信号是一种非平稳信号,基音周期是语音信号最重要的参数之一,传统的基音检测方法存在一些缺 陷。小波变换鲁棒性强、能很好地反映信号的时频特性,非常适合处理非平稳信号。为准确提取基音频率,提 出了一种基于小波变换的基音周期检测方法。检测前在小波域上用Teagerfl ̄量算子分离出语音信号的浊音段, 然后对浊音段采用空域相关函数降噪,并用模极大值法提取其基音周期。结果表明,该方法比传统的自相关函 数法具有更高的准确性和更好的鲁棒性。 关键词:小波变换;清浊音分割;基音检测;Teagerlf 量算子;空域相关函数 中图分类号:TP391.9 文献标识码:A Pitch period detection of speech based on wavelet transform Liu Chengrning,Li Xin’e,Zhang Yanbing (Key Laboratory ofInstrumentation Science&Dynamic Measurement,North University ofChina,Taiyuan Shanxi 030051, China) Abstract:Speech signal is a non—stationary signal and pitch period is one of the most important parameters of it. Traditional pitch detection methods have some defects.Wavelet transform has a s ̄ong robustness,and well reflects the time—frequency characteristics,is very suitable for non—stationary signal processing.In order tO extract pitch frequencies accurately,a pitch period detection method based on wavelet transform is proposed.A voiced regions detection algorithm based on wavelet transform and Teager energy operator is proposed firstly.Then suppressing noise using spatial correlation function and estimating pitch period based on wavelet modulus maximum algorithm is presented. FinaHy experiments show that this algorithm has a better robustness and more precision compared with auto——correlated function. Keywords:wavelet transformation;voiced——unvoiced segmentation;pitch detection;teager energy operator;spatial forre1ation function 0引言 音,基音的变化模式称为声调,它携带着非常重要的具有 基音是指发浊音时声带振动所引起的周期性。基音周 辨意作用的信息,有区别意义的功能。所以,基音的提取 期信息在语音识别、说话人识别、语音分析与综合、语音 和估计对汉语更是—个十分重要的问题。由于人的声音的 编码等多个领域有着广泛的应用。因为汉语是一种有调语 易变性及其声道特征的因人而异,而基音周期的范围又很 ★基金项目:山西省自然科学基金资助项目(2008011026---2 o 2o11.7 宽,从1.25ms到40ms,且同一个人在不同情态下发音的 基音周期也不同,加之基音周期还受到单词发音音调的影 响,因而基音周期的精确检测实际上是一件比较困难的事 情 ”。 传统的检测方法(如自相关函数法、平均幅度差函数 法等)都存在比较明显的缺陷 ,它们对基音周期变化较 快的段不合适,不能同时适合高音和低音,对带噪语音效 果不好。小波变换是一种多尺度和多分辨率的分析方法, 具有良好的时频局部化特性和鲁棒陛,广泛应用于信号陕 速变化点以及图像边缘的检测 。语音中的浊音信号在声 门闭合瞬间有一个跳变,S.KamabeⅢ等利用这一原理提出 了基于小波变换的基音频率提取方法。 根据以上理论,提出了一种基于小波变换的基音周期 检测方法。在基音检测前,利用Teager能量算子计算小波 系数的能量,根据阈值判断清浊音,然后利用相邻小波系 音段进行基音检测。 1基于小波变换的基音检测的原理 语音信号是一种非平稳信号,这种非平稳信号基本上 可分为两部分:一部分是低频信号,主要由基音来组成; 另一部分是高频信号,主要由噪声、突变信号组成。基音 信号是低频分量,有明显的强度和周期性的特征,因此可 以从小波系数的低频分量中提取基音周期。文中用到的小 波系数都为小波变换的低频系数。 由小波变换理论 知,如果我们设0(≠)为一光滑函 数,、I,。(f)与、I, (f)分别为如下定义的小波函数: ∽= )= 记Os(f)= e( )则对—个实函数f(t)e (R),在 尺度S处有以下小波变换: 1 ,1∽ 卜 c ∽, Ws2f(t)=f*v ̄∽ I ㈣ 可见Wlsf(t),Ws2f(t)分别正比于厂(f)经0(t)变换 后得到的函数的一阶导数和二阶导数,而函数一阶导数的 极值点对应其二阶导数的零点,同时也是函数本身的拐点, 而一阶导数绝对值的最大值对应于函数的突变点,因此的 巴 Design&Research 厂(f)幅值极大点对应厂(f)的突变点,而W2f(t) ̄ 点则与I厂 Os(f)的拐点相一致。 如果我们选择的小波函数为光滑函数的一阶导数,则 由小波变换的模极大值嘲就可以检测到信号/’(f)的突变点 (奇异点),即若信号.厂(f)在 处有尖锐的变化,则其小 波变换系数在to处呈现极大值,而且对于几个连续的尺度 因子s,其小波变换在 处都取得极大值,led',波变换时 信号的不连续性在不同的分辨甚骨 整性。 人在发音过程中,由于声门闭合形成气流脉冲,引起 声带振动,气流脉冲(声带振动)的频率称为基音频率。声 门闭合瞬间,气流急剧增加,对应在语音波形上即为在该 瞬间有一个明显的跳变,可认为是信号的奇异点。每相邻 两次声门闭合时间间隔即为瞬态基音周期,而大量瞬态基 音周期的均值即为基音周期。所以,我们可以用小波变换 模极大值来检测出语音信号的突变点,也即可以检测出语 音信号的基音周期。 2算法提出及实现 2.1 Teager能量算子与清浊音分割 Teager能量算子ffEO)是由Kaiser提出的一种非线性 算子,它能有效提取信号的能量。TEO已经成功地应用于 语音信号处理中 。 对于一有限频带的信号s(n),Teager能量算子可以描 述如下: d[ ( )]: ( )】 一 +1)s(n一1) f4 在小波域上,浊音段的小波系数幅度比清音段的小 波系数大,所以小波系数的能量是—个可以区分清浊音的 有效参数。TEO能有效计算信号的“能量”,因此可以用 TEO判决清浊音。 清浊音判断步骤如下: 1)小波变换:用Haar小波对语音信号s(n)进行 J次分解,得到第J层小波系数W(j,k),令j=4,则 k=1,…,N/2 ,其中N表示语音信号长度。 2)TEO运算:对小波系数W(j,k)应用Teager算子, 得到e(j, )。 e(j, )=q ̄a[W(j,七)】 (5) 3)取模、平滑:对e(j,k)取模,然后再通过—个截止 频率为30Hz的低通滤波器h(k),得到e(j, )的幅度轮廓 设计与研发 2o”7 .P(j,k),即: 号提取基音周期。 P(j,k)=abs[e(j, )】 (七),k=I,…,N/2 式中,abs表示取模。 (( Wf(j,n)表示尺度j上位置n处含噪信号s(n)的离散 小波变换,取相邻尺度的变换值进行相关计算,定义: 4)提取浊音段:浊音段的P(j,k)幅度明显大于非浊音 Cor ̄(j,,z)=儿 ( + , ) (1o) 段,设门限threshold和浊音段的标志flag有以下关系: 舢 = thresh old lfag(j,k)=1表示为浊音段,否则为非浊音段。 为了提高算法的抗噪能力,随着噪声的变化,门限 threshold也做相应变化。在P(j,.}i)中,前n(n由所用语音 信号而定)个点可以认为是噪声产生的,取其平均值作为 噪声信息。 mean[P(1:,2)】 f81 式中,mean表示取平均值。 为了准确提取浊音段,门限threshold随着 的增加而 增加。经过大量实验,threshold和 有如下关系: 0.01O, < ≤0.0001 0.0l5, 0.0001< 0.0005 0.02, 0.0005<a≤0.001 0.025, O.001< 0.005 threshold= 0.03, 0.005<仅 0.01 0.035, O.0l<0【 0.035 0.06, 0.035<0【 0.075 f9) O.15, >0.075 5)后期处理:由于浊音段和非浊音段在语音信号中常 常交叠在一起,因此上述算法有时会产生错误。这种错误 多发生在能量比较低的浊音上。为了减小错误,需要做一 些处理,基本思想是:短的浊音段不可能出现在连续的非 浊音段中,反之亦然。 2.2基于空域相关函数的基音检测 经典的小波变换算法提取基音周期存在不足,在低尺 度的小波系数中会存在许多由突发噪声以及高次谐波引起 的伪极大值点。信号的突变点在不同尺度的同一位置都有 较大的峰值出现,噪声能量却随着尺度的增大而减少,Xu 基于上述原理提出了利用空域相关函数对信号去噪嘲。对 相邻尺度的小波系数直接相乘进行相关计算,这样做相关 计算将在锐化和增强信号边缘的同时抑制噪声和一些小的 尖峰。声门闭合时刻表现在语音波形上就是瞬间幅度剧增, 产生突变。因此,空域相关函数非常适合在强噪声下对信 其中,表示参与相关运算的尺度数。由于信号的宽度 随着尺度的增大而增大,而且相邻的突变点在粗尺度上将 会相互影响。因此,一般取,一2。第一共振峰频率都在 lkHz以下,为了让小波分解后的信号包含全部基音信息, 尺度j由以下式子决定: J=[1og2( lkHz)] (11) 其中Fc是输入信号的带宽,本实验中Fc--4kHz。 为了保证每次小波变换后不改变系数的长度,且信 号突变点位置在各尺度层上能够整齐的对应,这里在计算 Corr2(j,n)时用静态离散小波变换获得小波系数,小波函 数选用二次B样条小波。 基音检测的算法步骤: 1)取出一帧信号进行二进离散小波分解,得到小波系 数W(4,k)。用上述清浊音判决方法判定该帧是否为清音, 若是,则该帧的基音频率为0,否则进入下一步。 2)对该帧信号做静态离散小波分解,得到小波系数 W(2,k)和w(3,k),然后对得到的Cor5(2,n)进行低通滤 波处理。 3)检测经过滤波处理后的Cor ̄(2,n)波形的极大值点 (取门限为全局最大值的0.7倍),而两个相邻极大值点之 间的平均距离就是基音周期。 4)重复第一步,直到检测出整个语音段上的基音周期。 3实验验证 仿真实验是在一般实验室噪声环境下,利用Windows 操作系统自带的“录音机”工具,录制了一个男生和一个 女生的自然语音信号ml和f1,内容都是“麦当劳”,保 存为wav格式。语音采样频率为44100Hz,量化位数 16bit。仿真前首先对语音信号进行预处理。由于语音信号 的频率多在4000Hz以下,为了滤除50Hz直流噪声和大 于4000Hz的高频噪声,先将语音信号通过一个通带频率 为60 ̄4000Hz的带通滤波器做预处理。这里用专业音频编 辑软件Adobe Audition的滤波功能对以上语音信号进行带 通滤波处理。仿真时利用MATLAB中的wavread命令读 取*.wav文件,ml采样点数是79872点,f1采样点数是 98304点,设置帧长为30ms、帧移lOms。 对语音信号m1、fl用本文提出的方法分别进行清浊 音分割和基音俭测,结果如图l一图4所示。 l 3 0 .1 ;-童 0 1000 2000 3000 4000 5000 喜i 0 1000 2000 3000 4000 5000 0 1000 2000 3000 4000 5000 浊音段提取结果 -0-5 E三 日 O 1000 2000 3000 4000 5000 k 图1语音信号m1的清浊音分割 ^ 一躁旺彻硪 0 5 语音信号 舍0 .0 5 第口日摩小油幕龄 x10 善.!1-, -j。:。。。∞。 。。。。。。。 0 2O00 4000 6000 0 2000 4000 6000 8000 浊音段提取结果 0 2O0o 4000 6000 k 图2语音信号f1的清浊音分割 语音信号 3 o 0 2 4 6 8 基音检测结粟 x10 V 警 窿 甜Ⅲ 划I1 n x 104 图3语音信号m1的基音检测 语音信号 0 5 aImlL。 一.・— 。 -0 5 0 2 4 6 8 l0 基蕾检测结果 x 1 0‘ n x 1134 图4语音信号f1的基音检测 对语音信号ml、fl用传统的自相关函数法进行基音 检测的结果如图5、图6所示。 语音信号 3 0 0 4 ^ v熹匪伽糊 基音检测结果X10 0 5 0 : ., .几r] 4 6 “ x 10 图5语音信号m1的自相关法基音检测 语音信号 0 5 0 .0 5 0 2 4 6 8 10 4 x 10 基音检测结果 \ 蹂 J 匿 籀。 0 2 4 6 8 1O n 4 x 1O 图6语音信号f1的自相关法基音检测 通过以上的仿真结果知:语音信号ml的基音周期在 8ms左右,语音信号n的基音周期在4ms左右,符合男女 生语音的基音周期的范围,且得到的基音频率曲线符合汉 语语音的声调模式。同时,对比图3和图5、图4和图6 的基音检测结果,可以看出,传统的自相关法对语音信号 的清浊音误判情况比较严重,在准确性、抗噪方面都不如 n u 设计与研发 2o117 .基于小波的方法。 [4】 Kadambe S and Boudreaux—Bartels G F.Application of the wavelet transform for pitch detection of speech 4 结论 提出了一种基于小波变换的基音周期检测方法,在小 波域,利用Teager能量算子判别出浊音段,再用空域相关 signal【J】.IEEE Trans.on Information Theory,1992, 38(2):917—924. [51孙延奎.小波分析及应用fM】.北京:机械工业出版 社,2005. 函数降噪及模极大值法对浊音段进行基音检测。实验表明, 与传统的自相关法相比,在含噪情况下,本方法能够更加 准确的提取出汉语语音信号的基音周期。由于本方法用到 【6]赵德祥,吴淑忠.基于小波变换的电磁泄漏信号检 测方法【J].电子测试,2008(8):1—3. 了小波变换,计算量大,因此适用于对实时陛要求不高的 场合。 【7】王义元,赵黎明.基于小波变换和Teager能量算子 浊音段提取fJ1.控制工程,2004(11)S1:99一i01. 【8]Xu Yansun,et a1.Wavelet transform domain filters:A 参考文献 spatially selective noise filtration technique【J】.IEEE Trans.on Image Processing,1994,3(6):747-758. [1]胡航.语音信号处理【M】.3版.哈尔滨:哈尔滨工业 大学出版社,2005. 作者简介: [2】胡瑛.低信噪比下基音检测算法研究[D1.长沙:中南 刘成明。中北大学仪器科学与动态测试 大学,2007. [3】徐慧慧,孙运强,姚爱琴.小波变换在遥感图像处理 中的应用fJ1.电子测试,2010(10):22—25. 教育部重点实验室硕士研究生,主要研 究方向为智能信息系统。 E—mail:Icm8745@sina.com (上接l0页) (06):1249—1253. Wang,Feldkamp-type reconstruction algorithms for 【4] 牛小明.螺旋锥束工业CT的Katsevich精确重建算 法的研究[D】.重庆:重庆大学,2008. [5】 Alexander Katsevich,Samit Basu,Jiang Hsieh.Exact FBP Reconstruction for Dynamic Pitch Helical Cone spiral cone—beam CT with variable pitch[J].Joumal of X——Ray Science nd aTechnology 15(2007):177—196. 【8】庄天戈.CT算法与重建[M】.上海:上海交通大学出 版社,1992. Beam【J】.IEEE,2004:3299-3302. [6】Yu Zou,xiaochuan Pan,Dan Xia,Ge Wang nd aTianzi Jiang.Exact Image Reconstruction in a Helical Cone— 作者简介: 蔚慧甜,在读硕士研究生,主要研究方向为CT图像 重建算法。 E-mail:yuhuitian0701@1 26.com beam Scan with a Variable Pitch[J].IEEE,2004:4200— 4203. 【7]Jun Zhao,Yang Lu,Yannan Jin,Erwei Bai,and Ge 

因篇幅问题不能全部显示,请点此查看更多更全内容