作者小头像 Lv.6
更多个人资料
1949 成长值
28 关注
26 粉丝
+ 关注 私信

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

人工智能
个人勋章
TA还没获得勋章~
成长雷达
1185
744
0
0
20

个人资料

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

人工智能

达成规则

以上满足项可达成此勋章

  • 博客
  • 关注
  • 粉丝
  • 论坛
Pytorch版本的BERT
一、Google BERT:BERT地址:https://github.com/google-research/bertpytorch版本的BERT:https://github.com/huggingface/pytorch-pretrained-BERT使用要求:Python 3.5+  &  PyTorch0.4.1/1.0.0  &  pip install pytorch-pret...
作者小头像 可爱又积极
1311
0
0
2021-10-22 08:53:37
999+
0
0
ESPNet介绍
ESPNet是一套基于E2E的开源工具包,可进行语音识别等任务。从另一个角度来说,ESPNet和HTK、Kaldi是一个性质的东西,都是开源的NLP工具;引用论文作者的话:ESPnet是基于一个基于Attention的编码器-解码器网络,另包含部分CTC组件;个人理解:在ESPNet出现之前,已经出现了CTC、Transformer等端到端ASR模型,ESPNet以这两种模型为核心,将这两个...
作者小头像 可爱又积极
1816
0
0
2021-09-28 14:14:15
999+
0
0
kaidi中nnet概览
根据我的理解,nne是kaldi中已经实现的神经网络,根据不同的参数可以定义不同的神经网络,一共有 nnet1、nnet2、nnet3三个版本。概览type    author    CPU/GPU    featurennet1    Karel    GPU单卡训练    使用pre-training,使用early stoppingnnet2    Dan    支持多GPU训练,以及...
作者小头像 可爱又积极
1328
0
0
2021-09-23 14:36:28
999+
0
0
GMM(高斯混合模型)
GMM(Gaussian mixture model),高斯混合模型,也可以简写成MOG.高斯模型就是用高斯概率密度函数(正态分布曲线)精确地量化事物,将一个事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。GMM已经在数值逼近、语音识别、图像分类、图像去噪、图像重构、故障诊断、视频分析、邮件过滤、密度估计、目标识别与跟踪等领域取得了良好的效果。实际上,GMM的目的就是找到一个...
作者小头像 可爱又积极
2387
0
0
2021-09-23 10:25:55
999+
0
0
混合高斯模型(GMM)
1 GMM基础高斯混合模型(GMM)指的是多个高斯分布函数的线性组合,理论上GMM可以拟合出任意类型的分布,通常用于解决同一集合下的数据包含多个不同的分布的情况。为什么GMM可以拟合出任意类型的分布?不仅GMM可以,只要性质不太奇怪的混合模型一般都能近似任意分布。这个思想和泰勒展开、傅里叶变换是类似的,任何波形都可以用正弦波叠加表示,而且频率还是基频的整数倍。利用高斯混合模型进行聚类,本质上...
作者小头像 可爱又积极
918
0
0
2021-09-16 11:17:46
918
0
0
单音素GMM-HMM模型的训练
模型的训练是输入特征到音素的状态的训练,即我们并不知道哪一帧输入特征对应哪个音素的哪一个状态。训练的目的就是找到帧对应状态的情况,并更新状态的gmm参数。把每一帧都归到某个状态上,本质上是进行聚类,是无监督训练。单音素GMM-HMM模型的训练通过Viterbi训练(嵌入式训练),把“S IH K S”对应的GMM模型嵌入到整段音频中去训练。训练步骤:步骤一:初始化对齐为什么要初始化对齐?为v...
作者小头像 可爱又积极
1348
0
0
2021-09-16 13:10:36
999+
0
0
基于CNN和MFCC的语音情感识别
近年来 ,随着信息技术的飞速发展 ,智能设备正在逐渐地融入到人们的日常生活当中 ,语音作为人机交互的最为便捷的方式之一 ,得到了广泛的应用。让机器听懂人类语言的同时 ,如何实现与人类有感情的自然交流 ,是无数科研工作者的目标。语音情感识别的主要内容就是建立一种能够从语音中分析和识别人类情感的计算系统 ,实现人与机器的人性化交流。     语音情感识别的主要任务是将蕴含在语音中的情感信息提取出...
作者小头像 可爱又积极
1672
0
0
2021-09-07 14:49:28
999+
0
0
语音识别-声学模型
关于声学模型,主要有两个问题,分别是特征向量序列的可变长和音频信号的丰富变化性。可变长特征向量序列问题在学术上通常有动态时间规划(Dynamic Time Warping, DTW)和隐马尔科夫模型(Hidden Markov Model, HMM)方法来解决。而音频信号的丰富变化性是由说话人的各种复杂特性或者说话风格与语速、环境噪声、信道干扰、方言差异等因素引起的。声学模型需要足够的鲁棒性...
作者小头像 可爱又积极
1808
0
0
2021-09-07 14:46:06
999+
0
0
以kaldi中的yesno为例谈谈transition
在基于GMM-HMM的传统语音识别里,比音素(phone)更小的单位是状态(state)。一般每个音素由三个状态组成,特殊的是静音(SIL)由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态,而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示(这个GMM模型的参数是通过训练得到的)。在识别时把每帧数据对应的特征值放进每个状态的GMM里算概率,概率最大的那个就是这帧对应的...
作者小头像 可爱又积极
1540
0
0
2021-09-07 14:35:48
999+
0
0
人脸表情预测
进入ModelArts点击如下链接:https://www.huaweicloud.com/product/modelarts.html , 进入ModelArts主页。点击“立即使用”按钮,输入用户名和密码登录,进入ModelArts使用页面。创建ModelArts notebook下面,我们在ModelArts中创建一个notebook开发环境,ModelArts notebook提供网...
作者小头像 可爱又积极
2286
0
0
2021-07-18 09:55:38
999+
0
0
总条数:37
  • 1
  • 2
  • 3
  • 4
到第 页

上滑加载中

https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
作者小头像
作者小头像
快速交付
+ 关注 私信