- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【开发者空间实践指导】基于3大PaaS主流服务轻松实现文字转换语音

开发者空间小蜜蜂发表于 2024/08/29 18:28:04 2024/08/29

【摘要】案例简介开发者将在云主机中，基于CodeArts API设计语音合成接口，基于API Explorer调试接口，并利用CodeArts IDE实现数据流转换为音频。在此过程中，开发者可体验API设计、开发、调试等全生命周期，对华为云产品API体系及API开放能力有全面了解，并最终完成应用创建，全程实践约15分钟。配置开发者空间华为云为全球开发者打造专属开发者空间，汇聚了华为优质开发资源及工具...

案例简介

开发者将在云主机中，基于CodeArts API设计语音合成接口，基于API Explorer调试接口，并利用CodeArts IDE实现数据流转换为音频。在此过程中，开发者可体验API设计、开发、调试等全生命周期，对华为云产品API体系及API开放能力有全面了解，并最终完成应用创建，全程实践约15分钟。

配置开发者空间

华为云为全球开发者打造专属开发者空间，汇聚了华为优质开发资源及工具，让每一位开发者拥有一台云主机。

在华为开发者空间，每位开发者每年可享有数百小时的云主机使用时长，5GB的云存储空间和场景化沙箱资源，以及海量的技术赋能课程与专业开发者认证内容。

点此领取：https://auth.huaweicloud.com/authui/login.html?service=https%3A%2F%2Fdeveloper.huaweicloud.com%2Fspace%2Flogin-forword.html%3FforwardUrl%3Dhttps%253A%252F%252Fdeveloper.huaweicloud.com%252Fspace%252Fhome%26module%3Dhuaweideveloper&locale=zh-cn#/login

1.进入开发者空间，点击“云主机（beta体验）”

2.点击“添加云主机”

3.点击“立即进入”

4.点击“下一步”

5.配置云主机，名称、描述可根据需要填写，点击“下一步”

6.点击“进入桌面”

7.界面状态显示为“已就绪”，表明领取成功。

点击 “打开桌面”，进入云主机内，预计等待1分钟

通过CodeArts API设计语音合成接口

3.1 进入CodeArts API官网，打开左边工具栏-Firefox网络浏览器，输入网页版体验地址并登录

https://developer.huaweicloud.com/develop/codeartsapi.html

3.2 创建项目

3.2.1 登录后点击页面右上角的“创建项目”按钮

3.2.2 在创建项目弹窗中输入项目名称：语音合成，并点击保存

3.2.3 提示保存成功，点击API设计页签，进入到API设计页面

3.3 设计接口

3.3.1 点击页面上的“新建API接口”卡片

3.3.2 显示新建标签页

3.3.3 输入接口的URL：/tts

3.3.4 输入接口名称：语音合成

3.3.5 下拉滚动条到请求参数区域，点击请求体“Body”页签，选择“raw”，默认选择“JSON”格式。

3.3.6 显示请求体的数据结构模板，默认根节点类型为“object”

3.3.7 点击根节点最右侧的“+”操作

3.3.8 页面上在根节点下新增一条参数（可以通过滚动条左右拖动）

3.3.9 将参数名param2修改为text，描述param2修改为待合成的文本

3.3.10 下拉页面，看到返回响应区域

3.3.11 同样点击根节点最右侧的“+”操作（可以通过滚动条拖动到最右侧），在根节点下显示一条新的参数

3.3.12 将参数名param2修改为result，将描述修改为合成结果

3.3.13 点击右上角的保存按钮

3.3.14 保存成功，设计完成

通过API Explorer调试语音合成接口，生成5段数据流

4.1 语音合成（API Explorer部分）：

链接：https://console.huaweicloud.com/apiexplorer/#/openapi/SIS/debug?api=RunTts

4.1.1 生成语音格式为wav，采样率：8000，标准女音，语速0，音色0

图1.1.1 wav标准女音

4.1.2 生成语音格式为wav，采样率：16000，标准男声，语速0，音色0

图1..12 wav标准男音

4.1.3 生成语音格式为mp3，采样率：8000，标准女音，语速100，音色100

图1.1.3 mp3标准女音

4.1.4 生成语音格式为mp3，采样率：16000，标准男声，语速100，音色100

图1.1.4 mp3标准男声

4.1.5 生成语音格式为pcm，采样率：16000，标准男声，语速100，音色100

图1.1.5 标准男声

在开发者空间基于华为云自研CodeArts IDE，实现数据流转换为音频的功能

5.1 实现数据流转换为音频

5.1.1 将实验用Demo工程上传到CodeArts IDE

打开右侧工具栏-Firefox网络浏览器，输入并访问Demo工程下载链接：

https://sandbox-expriment-files.obs.cn-north-1.myhuaweicloud.com/2601/CodeArtsProject.zip

对下载好的文件进行解压（目录：主文件夹/下载），右键提取到此处

打开CodeArts IDE，左上角点击“工程”->“打开工程”，选择刚刚解压出来的文件夹，打开：

预计等待1分钟左右的时间，工程模型同步成功：

5.1.2 在华为云控制台新增访问秘钥，配置AK/SK

1）登录华为云控制台：https://console.huaweicloud.com/iam/?agencyId=599e2ee1492f48e9b69a0a682d435fb8&region=cn-north-4&locale=zh-cn#/mine/accessKey

选择“我的凭证”->“访问秘钥”->新增访问秘钥

注：如果已经有AK/SK秘钥，不需要新增访问秘钥

创建秘钥成功后点击“立即下载”，即可获得“credentials.csv”文件，里面可以查看到AK（Access Key Id）和SK（Secret Access Key）

2）进入工程，src/main/resources下选择credentials.properties，将AK/SK配置上

5.1.3 将API Explorer上调试成功的流数据文件配置到APIResponse.json中

在2.1语音合成章节，我们在API Explorer完成接口的调试

https://console.huaweicloud.com/apiexplorer/#/openapi/SIS/debug?api=RunTts

最终生成“SIS_RunTts_ResponseBody_xxxxxxxxxxxxx.json”文件，打开json文件，复制响应体内容（如果响应体内容没有超出限制，直接点击右侧的复制按钮即可）

打开工程，进入src/main/resources中，选择APIResponse.json，将json文件的内容复制到APIResponse.json中。

5.1.4 配置pom.xml：

在pom.xml中如图所示，增加如下配置：

<java.version>17</java.version>

<maven.compiler.source>17</maven.compiler.source>

<maven.compiler.target>17</maven.compiler.target>

</properties>

5.1.5 执行“should_return_audio_when_response_json”，生成mps格式音频文件：

找到test目录下的测试类SisServiceTest.java，点击找到方法“should_return_audio_when_response_json（）”，点击执行测试，最后可以看到目录下生成的音频文件。

目录下生成“devkit.mps”文件，实验结束。

备注：

在使用过程中，遇到技术问题，可在论坛-开发者空间版块发帖提问。如需技术支持，可提交开发者工单。如有产品优化建议，欢迎来云声平台提交。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入