【SIS服务】视频文件中的声音,怎么识别?

举报
美丽的天使 发表于 2026/02/04 09:31:30 2026/02/04
【摘要】 1、SIS语音交互参考:https://support.huaweicloud.com/api-sis/sis_03_0005.htmlSIS语音交互提供:实时语音识别、一句话识别、录音文件识别、录音文件识别极速版2、如果需要识别视频中的声音,怎么办?方案一在实时语音识别、一句话识别、录音文件识别、录音文件识别极速版中,找符合场景、语种、文件格式的API接口。比如:录音文件接口,可以识别视频...

1、SIS语音交互参考:https://support.huaweicloud.com/api-sis/sis_03_0005.html

SIS语音交互提供:实时语音识别、一句话识别、录音文件识别、录音文件识别极速版

2、如果需要识别视频中的声音,怎么办?

方案一

在实时语音识别、一句话识别、录音文件识别、录音文件识别极速版中,找符合场景、语种、文件格式的API接口。

比如:录音文件接口,可以识别视频中的声音

方案二(终极方案)

将视频中的声音转为wav或者MP3音频文件,并且设置采样率、声道等,再进行语音识别。

以Java语音为例,给出AudioExtractor.java,进行音频提取。

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;

public class AudioExtractor {
    public static void extractAudioFromMP4(String inputPath, String outputPath) throws IOException, InterruptedException {
        // FFmpeg 命令:提取音频为 .mp3
        String[] command = {
                "C:\\ffmpeg-master-latest-win64-gpl-shared\\bin\\ffmpeg.exe",
                "-i", inputPath,
                "-vn",
                "-ac", "2",                // 2 声道
                "-ar", "16000",            // 采样率 16kHz
                "-sample_fmt", "s16",             // 16bit PCM
                "-f","wav",
                outputPath
        };

        Process process = new ProcessBuilder(command).start();
        // 读取 FFmpeg 输出(可选)
        BufferedReader reader = new BufferedReader(new InputStreamReader(process.getInputStream()));
        String line;
        while ((line = reader.readLine()) != null) {
            System.out.println(line);
        }
        process.waitFor();
    }

    public static void main(String[] args) {
        try {
            extractAudioFromMP4("D:\\*****\\video.mp4",
                    "D:\\*****\\video_output.wav");
            System.out.println("音频提取完成!");
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

注意:"C:\\ffmpeg-master-latest-win64-gpl-shared\\bin\\ffmpeg.exe", 为ffmpeg.exe存放位置。

ffmpeg下载地址:https://www.ffmpeg.org/download.html

视频转化音频,速度非常快,不影响语音识别的及时性。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。