作者小头像 Lv.3
484 成长值

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

大数据、人工智能、IOT、DevOps、微服务架构
个人勋章
TA还没获得勋章~
成长雷达
90
174
50
120
50

个人资料

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

大数据、人工智能、IOT、DevOps、微服务架构

达成规则

发布时间 2022/11/10 11:53:25 最后回复 浩泽学编程 2024/01/29 09:19:25 版块 人工智能
8395 804 34
他的回复:
我是一个持10张华为认证的人,我经常用讯飞TTS(https://www.ffkuaidu.com/)合成念白进行学习,因为一些难背的案例以及要点;或者工作中的事项我习惯合成,然后洗脑播放。根据我对讯飞的使用经验,我提出以下看法,觉得应该改进。1、body中不支持多音字机制  很多TTS对多音字的识别并不准确,问题是还没有多音修复办法。比如【重用性】chong yong xing,他发音zhong yong xing。 之所以我合成这个,因为我知道讯飞这个默认合成也是错的。但是它们可以标注 重【chong2】用性以此来正音。2、增加模型或者客户声音反馈机制  这个建议是我提给过讯飞的,咱们目前虽不涉及,但建议考虑。比如重用性,如果我作为一个客户发现错了,我回去反馈。华为运维人员可根据反馈和语言学家校正,确认后用来训练模型,使模型更精准。3、多音字风格的选择 有些词国家重新定了音,但是定音前的说法也不算错,客户应可定义策略指定多音字的识别。比如十万铁骑(qi),定音后为(qi),但是正统及诗歌还是认可(ji)。客户可定义策略,字段加载策略确定这种词具体的TTS。4、增加重读拖长音等转义符 讯飞不具备此功能,但是有时候这种功能可以时合成更丰富。不如:提这个建议的客户是天才,应给最高奖品。可以加重音转义标签包住【天才】 ,表达对客户的赞许。也可标签加在【最高奖品】,提醒受到反馈的主管做应出的决策^_^ 。此外,在单字或词拖长音、时长、音色的支持如何有标签支持,可以灵活的合成小话剧。5、加入停顿时间标签  讯飞支持,这种标签可以指定停顿【0.5秒  1秒之类】,方便指定合成文本段落的分节。6、文档对速度-500到500最好加个类别建议    比如-500为多少秒读完单字 ,500秒为以上
发布时间 2020/12/01 14:39:20 最后回复 蜡笔不辣 2020/12/30 18:51:29 版块 开发者学堂
11490 222 2