从WFST到语音识别

举报
作家小然 发表于 2020/07/09 11:01:27 2020/07/09
9.2k+ 4 1
【摘要】 在深度学习占领众多智能算法的背景下,语音识别系统中对于加权有限状态转换器(WFST)的应用仍没有过时,表明了其强大的理论基础与建模能力,那么它的基础算法与在语音识别中的应用应用是怎样的,这篇整理将告诉你更多。

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

作者其他文章

评论(4

抱歉,系统识别当前为高风险访问,暂不支持该操作
  • 作者头像

    南山百万杰出青年之一2020/07/29 09:36:201楼举报回复

    1、粘贴的图的第一页wfsa和wfst 那个权值搞错了吧 不是2.5 
    2、第5页 应该是p[pi]= p(e1) 
    3、三 合并应该注明一下是tropical semiring  两个做复合是做multiplication,对应tropical semiring 正好是做加法,如果换成probablity semiring 就是相乘
    4、第6页下方第1行 应该是(1,2) 非(1,1)
    5、确定化那里,0+2=3 令人迷惑,应该是0+3=3
  • 作者头像

    南山百万杰出青年之一2020/07/29 12:40:102楼举报回复

    我写了一段代码,可以帮助理解确定化 等等  openfst有一个python的接口
    import os
    import pywrapfst as fst

    def drawpdf(input, output):
        command = "fstdraw  " + input + " | dot -Tps | ps2pdf - " + output
        os.system(command)

    ##a 97 b 98  
    compiler = fst.Compiler(keep_state_numbering = True)
    print("0 2 97 97 1" ,file=compiler)
    print("0 2 98 98 4" ,file=compiler)
    print("0 1 97 97 3" ,file=compiler)
    print("0 1 98 98 1" ,file=compiler)
    print("1 0" ,file=compiler)

    print("2 3 98 98 1" ,file=compiler)
    print("2 3 98 98 3" ,file=compiler)
    print("1 3 98 98 3" ,file=compiler)
    print("1 3 98 98 5" ,file=compiler)
    print("3 0" ,file=compiler)

    f = compiler.compile()
    #print (f.__str__().decode("utf-8"))
    f =fst.determinize(f)
    f.write("fdet.fst")
    drawpdf("fdet.fst","fdet.pdf")

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。