【语音合成】基于matlab语音信号变速【含Matlab源码 565期】
一、获取代码方式
获取代码方式1:
通过订阅紫极神光博客付费专栏,凭支付凭证,私信博主,可获得此代码。
获取代码方式2:
完整代码已上传我的资源:【语音合成】基于matlab语音信号变速【含Matlab源码 565期】
备注:
订阅紫极神光博客付费专栏,可免费获得1份代码(有效期为订阅日起,三天内有效);
二、语音信号变速简介
1 语音变速属语音更改范畴,两方面研究
(1)声学参数,如共振峰频率,基频,主要由声道差异决定。
(2)韵律学参数,如说话快慢,节奏,口音不同。
2 变速本质
把语音在时间上缩短或者拉长,而语音的采样频率/基频/共振峰不改变。
如图,上半轴表示原始语音,下半轴表示变速后的语音。上半轴大圆点表示每一帧的起始位置,下半轴小圆点表示变速后的每一帧起始位置。
语音时间减少,语速增加,缩短语音帧数fn’比原帧数少,因此要对帧数fn进行插值。缩短语音每一帧对应的原始信号的时间,并不是原始信号的时刻,因此要对基音周期进行插值。同样要对线性预测系数进行插值。
2 语音变速步骤
分帧/基因检测/计算lpc系数。
按照新的语音时长,对帧数fn插值为fn‘。
将ai系数转化称LSF参数,对LSF参数插值。
将插值后的LSF系数重构为1-fn’帧线性预测系数ai’。
用预测系数ai’和基音参数合成语音。
PS. 这里讲一下插值函数Interp1函数的使用:
MATLAB hep:1-D data interpolation (table lookup)
既然有interp1,那一定也有interp2/interp3,interp1用来对一维数组进行插值,但是,interp1也可用用来做二维数组的插值,也是一维一维地处理。
用框图表示流程:
三、部分源代码
clear all; clc; close all;
[xx,fs]=wavread('1.wav');
四、运行结果
五、matlab版本及参考文献
1 matlab版本
2014a
2 参考文献
[1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019.
[2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019.
文章来源: qq912100926.blog.csdn.net,作者:海神之光,版权归原作者所有,如需转载,请联系作者。
原文链接:qq912100926.blog.csdn.net/article/details/114997361
- 点赞
- 收藏
- 关注作者
评论(0)