【开发者空间实践指导】基于3大PaaS主流服务轻松实现文字转换语音
案例简介
开发者将在云主机中,基于CodeArts API设计语音合成接口,基于API Explorer调试接口,并利用CodeArts IDE实现数据流转换为音频。在此过程中,开发者可体验API设计、开发、调试等全生命周期,对华为云产品API体系及API开放能力有全面了解,并最终完成应用创建,全程实践约15分钟。
配置开发者空间
华为云为全球开发者打造专属开发者空间,汇聚了华为优质开发资源及工具,让每一位开发者拥有一台云主机。
在华为开发者空间,每位开发者每年可享有数百小时的云主机使用时长,5GB的云存储空间和场景化沙箱资源,以及海量的技术赋能课程与专业开发者认证内容。
1.进入开发者空间,点击“云主机(beta体验)”
2.点击“添加云主机”
3.点击“立即进入”
4.点击“下一步”
5.配置云主机,名称、描述可根据需要填写,点击“下一步”
6.点击“进入桌面”
7.界面状态显示为“已就绪”,表明领取成功。
点击 “打开桌面”,进入云主机内,预计等待1分钟
通过CodeArts API设计语音合成接口
3.1 进入CodeArts API官网,打开左边工具栏-Firefox网络浏览器,输入网页版体验地址并登录
https://developer.huaweicloud.com/develop/codeartsapi.html
3.2 创建项目
3.2.1 登录后点击页面右上角的“创建项目”按钮
3.2.2 在创建项目弹窗中输入项目名称:语音合成,并点击保存
3.2.3 提示保存成功,点击API设计页签,进入到API设计页面
3.3 设计接口
3.3.1 点击页面上的“新建API接口”卡片
3.3.2 显示新建标签页
3.3.3 输入接口的URL:/tts
3.3.4 输入接口名称:语音合成
3.3.5 下拉滚动条到请求参数区域,点击请求体“Body”页签,选择“raw”,默认选择“JSON”格式。
3.3.6 显示请求体的数据结构模板,默认根节点类型为“object”
3.3.7 点击根节点最右侧的“+”操作
3.3.8 页面上在根节点下新增一条参数(可以通过滚动条左右拖动)
3.3.9 将参数名param2修改为text,描述param2修改为待合成的文本
3.3.10 下拉页面,看到返回响应区域
3.3.11 同样点击根节点最右侧的“+”操作(可以通过滚动条拖动到最右侧),在根节点下显示一条新的参数
3.3.12 将参数名param2修改为result,将描述修改为合成结果
3.3.13 点击右上角的保存按钮
3.3.14 保存成功,设计完成
通过API Explorer调试语音合成接口,生成5段数据流
4.1 语音合成(API Explorer部分):
链接:https://console.huaweicloud.com/apiexplorer/#/openapi/SIS/debug?api=RunTts
4.1.1 生成语音格式为wav,采样率:8000,标准女音,语速0,音色0
图1.1.1 wav标准女音
4.1.2 生成语音格式为wav,采样率:16000,标准男声,语速0,音色0
图1..12 wav标准男音
4.1.3 生成语音格式为mp3,采样率:8000,标准女音,语速100,音色100
图1.1.3 mp3标准女音
4.1.4 生成语音格式为mp3,采样率:16000,标准男声,语速100,音色100
图1.1.4 mp3标准男声
4.1.5 生成语音格式为pcm,采样率:16000,标准男声,语速100,音色100
图1.1.5 标准男声
在开发者空间基于华为云自研CodeArts IDE,实现数据流转换为音频的功能
5.1 实现数据流转换为音频
5.1.1 将实验用Demo工程上传到CodeArts IDE
打开右侧工具栏-Firefox网络浏览器,输入并访问Demo工程下载链接:
https://sandbox-expriment-files.obs.cn-north-1.myhuaweicloud.com/2601/CodeArtsProject.zip
对下载好的文件进行解压(目录:主文件夹/下载),右键提取到此处
打开CodeArts IDE,左上角点击“工程”->“打开工程”,选择刚刚解压出来的文件夹,打开:
预计等待1分钟左右的时间,工程模型同步成功:
5.1.2 在华为云控制台新增访问秘钥,配置AK/SK
选择“我的凭证”->“访问秘钥”->新增访问秘钥
注:如果已经有AK/SK秘钥,不需要新增访问秘钥
创建秘钥成功后点击“立即下载”,即可获得“credentials.csv”文件,里面可以查看到AK(Access Key Id)和SK(Secret Access Key)
2)进入工程,src/main/resources下选择credentials.properties,将AK/SK配置上
5.1.3 将API Explorer上调试成功的流数据文件配置到APIResponse.json中
在2.1语音合成章节,我们在API Explorer完成接口的调试
https://console.huaweicloud.com/apiexplorer/#/openapi/SIS/debug?api=RunTts
最终生成“SIS_RunTts_ResponseBody_xxxxxxxxxxxxx.json”文件,打开json文件,复制响应体内容(如果响应体内容没有超出限制,直接点击右侧的复制按钮即可)
打开工程,进入src/main/resources中,选择APIResponse.json,将json文件的内容复制到APIResponse.json中。
5.1.4 配置pom.xml:
在pom.xml中如图所示,增加如下配置:
<properties>
<java.version>17</java.version>
<maven.compiler.source>17</maven.compiler.source>
<maven.compiler.target>17</maven.compiler.target>
</properties>
5.1.5 执行“should_return_audio_when_response_json”,生成mps格式音频文件:
找到test目录下的测试类SisServiceTest.java,点击找到方法“should_return_audio_when_response_json()”,点击执行测试,最后可以看到目录下生成的音频文件。
目录下生成“devkit.mps”文件,实验结束。
备注:
在使用过程中,遇到技术问题,可在论坛-开发者空间版块发帖提问。如需技术支持,可提交开发者工单。如有产品优化建议,欢迎来云声平台提交。
- 点赞
- 收藏
- 关注作者
评论(0)