- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

FFmpeg开发笔记（五十八）把32位采样的MP3转换为16位的PCM音频

aqi00 发表于 2024/10/19 12:51:11 2024/10/19

【摘要】《FFmpeg开发实战：从零基础到短视频上线》一书的“5.1.2 把音频流保存为PCM文件”介绍了如何把媒体文件中的音频流转存为原始的PCM音频，在样例代码的转存过程中，解码后的PCM数据未经任何加工处理，就直接保存到二进制文件。也就是说，原音频的采样频率是多少，PCM文件的采样频率也是多少；原音频的声道数量是多少，PCM文件的声道数量也是多少；原音频的采样位数是多少，PCM文件的采样位...

《FFmpeg开发实战：从零基础到短视频上线》一书的“5.1.2 把音频流保存为PCM文件”介绍了如何把媒体文件中的音频流转存为原始的PCM音频，在样例代码的转存过程中，解码后的PCM数据未经任何加工处理，就直接保存到二进制文件。也就是说，原音频的采样频率是多少，PCM文件的采样频率也是多少；原音频的声道数量是多少，PCM文件的声道数量也是多少；原音频的采样位数是多少，PCM文件的采样位数也是多少。

原汁原味保存的PCM文件本来也没什么问题，可是在实际应用中，有的业务场景需要特定规格的PCM音频。比如某厂家的语音识别引擎，要求只能输入16位的PCM数据，然而标准的MP3音频都采用32位采样，如此一来，得想办法把32位的MP3音频转换为16位的PCM音频才行。
考虑到使用FFmpeg的命令行转换比较方便，于是在控制台执行下面的ffmpeg格式转换指令，在转换采样频率和声道数量的同时一起转换采样位数。

ffmpeg -i night.mp3 -ar 16000 -ac 1 -acodec pcm_s16le night.pcm

谁知控制台输出以下的报错信息“pcm_s16le codec not supported”，意思是不支持16位的PCM编码器。

pcm_s16le codec not supported

咦，FFmpeg怎么会不支持这么基本的PCM编码器呢？继续执行下面的编码器查看命令：

ffmpeg -encoders | grep pcm

发现输出的查询结果赫然出现下面的pcm_s16le信息，说明FFmpeg默认已经支持该编码器。

A....D pcm_s16le            PCM signed 16-bit little-endian

那么为啥ffmpeg命令行无法正常转换PCM音频的采样位数呢？
搜了一圈发现没有使用ffmpeg成功转换采样位数的案例，只好先把原音频转换为32位采样的PCM文件，转换命令如下所示：

ffmpeg -i night.mp3 -ar 16000 -ac 1 -acodec pcm_f32le -f f32le night.pcm

接下来另外编写转换音频采样位数的代码convertpcm.c，代码内容如下所示：

#include <stdio.h>
#include <stdlib.h>
#include <math.h>

int pcm32_to_pcm16(const char *filename)
{  
    FILE *fp =  fopen(filename, "rb");
    FILE *fp1 = fopen("output_16.pcm", "wb");
    unsigned char *sample = (unsigned char*)calloc(1, 4+1);
    while(!feof(fp))
    {
        fread(sample, 4, 1, fp);
        sample[4] = '\0';
        float *sample32 = (float*)sample;
        short sample16 = (short)floor( (*sample32) * 32767 );
        fwrite(&sample16, 2, 1, fp1);
    }
    free(sample);
    fclose(fp);
    fclose(fp1);
    return 0;  
}

int main(int argc, char **argv) {
    const char *src_name = "night.pcm";
    if (argc > 1) {
        src_name = argv[1];
    }
    pcm32_to_pcm16(src_name);
}

保存代码，然后执行下面的编译命令。

gcc convertpcm.c -o convertpcm

编译完成，再执行下面的采样位数转换命令。

./convertpcm night.pcm

现在生成的output_16.pcm就是16位采样的PCM文件，可以用作语音识别了。

更多详细的FFmpeg开发知识参见《FFmpeg开发实战：从零基础到短视频上线》一书。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

FFmpeg开发笔记（五十八）把32位采样的MP3转换为16位的PCM音频

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

FFmpeg开发笔记（五十八）把32位采样的MP3转换为16位的PCM音频

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品