- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【情感识别】基于matlab PNN概率神经网络语音情感识别【含Matlab源码 544期】

海神之光发表于 2022/05/29 04:20:30 2022/05/29

【摘要】一、PNN概率神经网络语音情感识别简介１语音情感识别系统在语音情感识别系统中，录制的语料包含5个演员的5种不同情感，即高兴、害怕、悲伤、愤怒和中性，同时语料又被分成训练集和测试集。语音情感识别系统...

一、PNN概率神经网络语音情感识别简介

１语音情感识别系统
在语音情感识别系统中，录制的语料包含5个演员的5种不同情感，即高兴、害怕、悲伤、愤怒和中性，同时语料又被分成训练集和测试集。语音情感识别系统的设计如图１所示。首先对语音信号进行特征提取，采用ＨＭＭ的训练算法（分段Ｋ均值算法）对ＨＭＭ进行训练，得到各单词的ＨＭＭ参数；其次，利用该参数求出语音信号的最佳状态时间序列；再次，根据每个ＨＭＭ状态对应的若干帧语音倒谱矢量，可以看作是特性相近的语音事件（如音素、音节等），将这些长短不一的具有同一状态的倒谱矢量语音信号应用时间进行规整，使其成为具有相同维数的语音特征矢量；最后用ＰＮＮ神经网络进行语音识别。

图１语音情感识别系统

1.1 语音参数特征提取
常用的语音情感识别特征参数主要从时间结、能量、基音、共振峰等结构方面考虑。系统选用平均振幅、最大振幅、语速、语句发音持续时间、平均基音频率、最大基音频率、基音变化率、最大第一共振峰、第一共振峰均值及第一共振峰变化率作为情感特征参数。

１.2 基于PNN的语音情感识别模型
PNN是基于统计原理设计的神经网络模型，见图2所示。用类条件概率密度作为模式划分的依据，网络由输入层、特征层、总和层和输出层构成。输入、输出层由线性神经元组成；特征层为动态概率层，包含 P个神经元，P在网络训练中动态变化；总和层节点是高斯核函数，该核函数能对输入产生局部响应，从而将输入空间划分成若干小的局部区间，以达到分类和函数逼近的目的；输出层包含Ｋ个神经元，每个神经元分别对应一个要识别的语音基元（实验中取Ｋ＝１０）。与多层感知器（ｍｕｌｔｉ－ｌａｙｅｒｐｅｒｃｅｐｔｉｏｎ，ＭＬＰ）相比，网络结构在系统面临外界环境因素改变时，仅须对新进的分类数据定义权值，而无须像其他类型的网络结构那样加入新的分类
数据和改变全部的网络权值，同时，该网络学习速度很快，其学习所需的时间为零，因为其网络连结权值只是直接从训练范例中加载所需数据，无迭代过程。当模式矢量维数较高时，ＰＮＮ具有良好的分类性能和更快的训练速度。

图2 PNN结构图

二、部分源代码

lc 
close all
clear all
load A_fear fearVec;
load F_happiness hapVec;
load N_neutral neutralVec;
load T_sadness sadnessVec;
load W_anger angerVec;
 trainsample(1:30,1:140)=angerVec(:,1:30)';
 trainsample(31:60,1:140)=hapVec(:,1:30)';
 trainsample(61:90,1:140)=neutralVec(:,1:30)';
 trainsample(91:120,1:140)=sadnessVec(:,1:30)';
 trainsample(121:150,1:140)=fearVec(:,1:30)';
  trainsample(1:30,141)=1;
   trainsample(31:60,141)=2;
   trainsample(61:90,141)=3;
   trainsample(91:120,141)=4; 
   trainsample(121:150,141)=5;
   testsample(1:20,1:140)=angerVec(:,31:50)';
  testsample(21:40,1:140)=hapVec(:,31:50)';
 testsample(41:60,1:140)=neutralVec(:,31:50)';
  testsample(61:80,1:140)=sadnessVec(:,31:50)';
  testsample(81:100,1:140)=fearVec(:,31:50)';
  testsample(1:20,141)=1;
   testsample(21:40,141)=2;
    testsample(41:60,141)=3;
    testsample(61:80,141)=4; 
    testsample(81:100,141)=5;
  class=trainsample(:,141);
sum=bpnn(trainsample,testsample,class);
figure(1)
bar(sum,0.5);
set(gca,'XTickLabel',{'生气','高兴','中性','悲伤','害怕'});
ylabel('识别率');
xlabel('五种基本情感');

p_train=trainsample(:,1:140)';
t_train=trainsample(:,141)';
p_test=testsample(:,1:140)';
t_test=testsample(:,141)';
sumpnn=pnn(p_train,t_train,p_test,t_test);
figure(2)
bar(sumpnn,0.5);
set(gca,'XTickLabel',{'生气','高兴','中性','悲伤','害怕'});
ylabel('识别率');
xlabel('五种基本情感');
sumlvq=lvq(trainsample,testsample,class);
function sum=bpnn(trainsample,testsample,class)
%输入参数：trainsample是训练样本,testsample是测试样本,class表示训练样本的类别，与trainsample中数据对应
%sum：五种基本情感的识别率
for i=1:140
    feature(:,i)= trainsample(:,i);
end
%特征值归一化
[input,minI,maxI] = premnmx( feature')  ;

%构造输出矩阵
s = length( class ) ;
output = zeros( s , 5  ) ;
for i = 1 : s 
   output( i , class( i )  ) = 1 ;
end

%创建神经网络
net = newff( minmax(input) , [10 5] , { 'logsig' 'purelin' } , 'traingdx' ) ;   %创建前馈神经网络

%设置训练参数
net.trainparam.show = 50 ;
net.trainparam.epochs = 150 ;
net.trainparam.goal = 0.1 ;
net.trainParam.lr = 0.05 ;

%开始训练
net = train( net, input , output' ) ;

%读取测试数据
for i=1:140
    featuretest(:,i)= testsample(:,i);
end
 c=testsample(:,141);
%测试数据归一化
testInput = tramnmx(featuretest' , minI, maxI ) ;

%仿真
Y = sim( net , testInput ) 
sum=[0 0 0 0 0]; %每类情感正确识别个数
%统计识别正确样本数 
for i=1:20
    if Y(1,i)>Y(2,i)&&Y(1,i)>Y(3,i)&&Y(1,i)>Y(4,i)&&Y(1,i)>Y(5,i)
        sum(1)=sum(1)+1;
    end
    function sumlvq=lvq(trainsample,testsample,class)
P=trainsample(:,1:140)';
C=class';
T=ind2vec(C);
net=newlvq(minmax(P),20,[0.2 0.2 0.2 0.2 0.2],0.1); %创建lvq网络
w1=net.IW{1};
net.trainParam.epochs=100;
net=train(net,P,T);
y=sim(net,testsample(:,1:140)');
y3c=vec2ind(y);
sumlvq=[0 0 0 0 0]; %每类情感正确识别个数
%统计识别正确样本数 
for i=1:20
    if y3c(i)==1
        sumlvq(1)=sumlvq(1)+1;
    end
end
for i=21:40
    if y3c(i)==2
        sumlvq(2)=sumlvq(2)+1;
    end
end
for i=41:60
    if y3c(i)==3
        sumlvq(3)=sumlvq(3)+1;
    end
end
for i=61:80
    if y3c(i)==4
        sumlvq(4)=sumlvq(4)+1;
    end
end
for i=81:100
end

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16
  17
  18
  19
  20
  21
  22
  23
  24
  25
  26
  27
  28
  29
  30
  31
  32
  33
  34
  35
  36
  37
  38
  39
  40
  41
  42
  43
  44
  45
  46
  47
  48
  49
  50
  51
  52
  53
  54
  55
  56
  57
  58
  59
  60
  61
  62
  63
  64
  65
  66
  67
  68
  69
  70
  71
  72
  73
  74
  75
  76
  77
  78
  79
  80
  81
  82
  83
  84
  85
  86
  87
  88
  89
  90
  91
  92
  93
  94
  95
  96
  97
  98
  99
  100
  101
  102
  103
  104
  105
  106
  107
  108
  109
  110
  111
  112
  113
  114
  115
  116
  117
  118
  119
  120
  121
  122
  123
  124
  125

三、运行结果

四、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1]韩纪庆,张磊,郑铁然.语音信号处理（第3版）[M].清华大学出版社，2019.
[2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社，2019.
[3]叶斌.基于HMM和PNN的语音情感识别研究.[J]青岛大学学报(工程技术版). 2011,26(04)

文章来源: qq912100926.blog.csdn.net，作者：海神之光，版权归原作者所有，如需转载，请联系作者。

原文链接：qq912100926.blog.csdn.net/article/details/114954783

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

【情感识别】基于matlab PNN概率神经网络语音情感识别【含Matlab源码 544期】

一、PNN概率神经网络语音情感识别简介

二、部分源代码

三、运行结果

四、matlab版本及参考文献

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

【情感识别】基于matlab PNN概率神经网络语音情感识别【含Matlab源码 544期】

一、PNN概率神经网络语音情感识别简介

二、部分源代码

三、运行结果

四、matlab版本及参考文献

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品