【语音合成】基于matlab重叠存储法的信号分帧与还原【含Matlab源码 567期】

举报
海神之光 发表于 2022/05/30 01:00:39 2022/05/30
【摘要】 一、获取代码方式 获取代码方式1: 通过订阅紫极神光博客付费专栏,凭支付凭证,私信博主,可获得此代码。 获取代码方式2: 完整代码已上传我的资源:【语音合成】基于matlab重叠存储法的信号分帧与还原...

一、获取代码方式

获取代码方式1:
通过订阅紫极神光博客付费专栏,凭支付凭证,私信博主,可获得此代码。

获取代码方式2:
完整代码已上传我的资源:【语音合成】基于matlab重叠存储法的信号分帧与还原【含Matlab源码 567期】

备注:
订阅紫极神光博客付费专栏,可免费获得1份代码(有效期为订阅日起,三天内有效);

二、重叠存储法简介

将x(n)分段,每段长为M,保证M接近N即可,然后 将每段xk(n)向前多取N−1个点,第一段前面补N−1个0,则每段xk(n)长为L=M+N−1,计算L点FFT得到XK(K)将h(n)补零延长至L=M+N−1,计算L点FFT得到H(K)。
计算yk(k)=XK(K)∗H(K),然后求L点的IFFT,得到yk(K)。分析下上面的步骤,对比下线性卷积与圆周卷积。

线性卷积
xk(n):L=M+N−1
h:N
yk(n):M+2N−2

圆周卷积
XK(K):L=M+N−1
H(K):L=M+N−1
Yk(K):L=M+N−1
可以看到线性卷积的长度(M+2N−2)>圆周卷积长度(M+N−1),由线性卷积与圆周卷积的关系可知当圆周卷积长度小于线性卷积长度时会发生混叠,那就在恢复的时候,丢掉前面混叠的部分(M+2N−2)-(M+N−1)=N−1。

总结来说,此方法需x(n)分段时每两段之间需要重叠N−1个值(实际上大于该值都可以,但取N−1时最节省运算量),然后对所求的yk(n)去除前N−1个点。本质就是直接删去0≤n≤N−2的yk(n),只保留N−1≤n≤K−1的yk(n),因此在对分段时需要对x(n)重叠分段,保证对于每个n都有满足N−1≤n≤K−1的xk(n)。

三、部分源代码

clc
clear all
close all
[s,fs]=audioread('2.wav');



  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

四、运行结果

在这里插入图片描述

五、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019.
[2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019.

文章来源: qq912100926.blog.csdn.net,作者:海神之光,版权归原作者所有,如需转载,请联系作者。

原文链接:qq912100926.blog.csdn.net/article/details/114997497

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。