【语音分析】基于matlab短时自相关基音周期检测+LPC预测增益计算【含Matlab源码 1517期】

举报
海神之光 发表于 2022/05/29 01:11:29 2022/05/29
【摘要】 一、案例简介 1 实验要求 1.录一段声音,内容为“间隔读出数字0-4”,转为单声道、8khz、wav格式; 2.每帧帧长20ms160个样点,使用汉明窗hamming加窗; 3.设定能量阈值,判断语音...

一、案例简介

1 实验要求
1.录一段声音,内容为“间隔读出数字0-4”,转为单声道、8khz、wav格式;
2.每帧帧长20ms160个样点,使用汉明窗hamming加窗;
3.设定能量阈值,判断语音中无声、有声区间;
4.计算短时自相关 R(k),k取20-100,计算基音周期和基音频率;
5.信息预测:数字“0”的预测增益E0/Ep(原始信号能量/残差信号能量),并求预测系数a1-a10,阶数p取10。

2 思 路
先对声音进行窗函数划分帧,160个样点一帧,计算各帧短时能量,设定能量阈值筛选出5段浊音段,每段分别进行以下操作:段中的每一帧计算自相关函数(k为自相关滞后时间,取20-100),通过波峰最大值点计算得到该帧浊音的基音频率,进而计算该段的基音频率,进而计算5段浊音段的基音频率。
对于信息预测,对于数字“0”的语音段的某一帧(如第101帧),利用lpc 函数得到阶数取10下的预测系数,进而计算预测信号及残差信号,利用预测增益公式E0/Ep(原始信号能量/残差信号能量)计算得到预测增益。

二、部分源代码

clc;
clear all;
close all;        

% 读取语料
[y,fs,wmode,fidx]=readwav('number.wav','p',-1,-1);
figure(1);stem(y,'.');title('原始音频波形');%显示声音的波形
%l=length(y);

%分帧
%f=enframe(y,hamming(160));                   %分帧长:20ms(160样点)
%figure(2);stem(f,'.');title('分帧后的音频波形');%显示声音的波形


%加窗,计算短时能量
for k = 1:nFrames

    E(k) = sum(y_sub.^2); 
end
figure(2);stem(E,'.');title('全区间的短时能量图');

%如何设定能量阈值为0.001得到安静、有声的区间?
for i = 1:nFrames
    if E(i)<0.001
        E(i)=0
    end
end
figure(3);stem(E,'.');title('有声区间的短时能量图');%处理后的帧的短时能量图像

%计算短时自相关
n=160;
for m=1:length(y)/n            %对每一帧求短时自相关函数,每帧的Rm最大值存在N(m)Rm(k)=0;
     
            Rm(k)=Rm(k)+y(i+(m-1)*n)*y(i+k+(m-1)*n);
        end
    end

end                            

%计算基音周期和基音频率
%N=N+10;                        %补回前边去掉的10个点
%T=N/8;                         %算出对应的周期

figure(4);stem(T,'.');axis([0 length(T) 0 20]);
xlabel('帧数(n)');ylabel('周期(ms)');title('初始未处理的基音周期');

T1= medfilt1(T,7);             %去除野点,中值平滑
for k = 1:nFrames
    if E(k)==0
        T1(k)=0;
    end
end
figure(5);stem(T1,'.');axis([0 length(T1) 0 20]);
xlabel('帧数(n)');ylabel('周期(ms)');title('中值滤波后的基音周期');


for k = 1:nFrames
    if E(k)==0
        F1(k)=0;
    end
end
figure(6);stem(F1,'.');
xlabel('帧数(n)');ylabel('频率(Hz)');title('基音频率');

%计算数字“0”的差分方程系数和预测增益

y1=y(99*160:100*160-1);  %取数字“0”的一帧(第100帧),进行汉明加窗
A=lpc(y1.*w,p);  %得到系数(11个系数中第一个系数值为1)
est_Frame=filter([0 -A(2:end)],1,y1);%estimate frame(lp)预测第100/101?
FFT_est=fft(est_Frame);
%y2=y(100*160:101*160-1);

figure(7);
%subplot(221);plot(1:3360,y1,1:3360,est_Frame,'-r');grid;title('原始语音帧 vs.预测后的语音帧');
subplot(221);plot(y1);grid;title('原始语音段');
%subplot(222);plot(est_Frame);grid;title('预测语音段');
subplot(222);plot(est_Frame);grid;title({'预测语音段及10个预测系数',[num2str(A(2)),',',num2str(A(3)),',',num2str(A(4)),',',num2str(A(5)),',',num2str(A(6)),',',num2str(A(7)),',',num2str(A(8)),',',num2str(A(9)),',',num2str(A(10)),',',num2str(A(11))]});
subplot(223);plot(err);grid;title('误差');
subplot(224);plot(prodictive_gain);grid;title('预测增益');

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67
  • 68
  • 69
  • 70
  • 71
  • 72
  • 73
  • 74
  • 75
  • 76
  • 77
  • 78
  • 79
  • 80
  • 81

三、运行结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

四、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019.
[2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019.

文章来源: qq912100926.blog.csdn.net,作者:海神之光,版权归原作者所有,如需转载,请联系作者。

原文链接:qq912100926.blog.csdn.net/article/details/121311446

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。