SenseVoice部署指导
本方案围绕轻量高效的语音识别(ASR)模型——senseVoice展开,重点介绍其两种主流部署与服务化启动方式(API接口直连),兼顾技术灵活性与落地便捷性,助力开发者快速构建语音转文字能力。无论是智能硬件终端的实时语音交互,还是企业级系统的批量音频处理,senseVoice均能提供适配方案。
一、环境准备
安装 Anaconda(可选,如有已经安装跳过)
# 下载脚本(版本号以实际为准)
wget https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh
# 赋予执行权限
chmod +x Anaconda3-2024.10-1-Linux-x86_64.sh
# 运行安装
./Anaconda3-2024.10-1-Linux-x86_64.sh
source /root/anaconda3/bin/activate
二、安装 FFmpeg(音频处理依赖)
下载地址详见评论区
tar -zxvf ffmpeg-6.1.2.tar.gz
cd ffmpeg-6.1.2
sudo apt install nasm -y
./configure --prefix=/usr/local/ffmpeg
make -j$(nproc) && sudo make install
三、配置环境变量
vim /etc/profile
文件结尾添加
export PATH=$PATH:/usr/local/ffmpeg/bin
立即生效:
source /etc/profile
四、创建虚拟环境
conda create -n sensevoice python=3.10 -y
conda activate sensevoice(名字可以自己起)
五、克隆项目
git clone https://github.com/FunAudioLLM/SenseVoice.git
cd SenseVoice
六、安装依赖
pip install -r requirements.txt
从魔塔社区下载模型
下载地址详见评论区
创建文件夹下载预训练模型(sensevoice-small)
创建文件夹 mkdir SenseVoiceSmall
cd SenseVoiceSmall
下载模型到该文件中
modelscope download --model iic/SenseVoiceSmall --local_dir ./
创建文件夹 mkdir speech_fsmn
下载模型到该文件夹
cd speech_fsmn
modelscope download --model iic/speech_fsmn_vad_zh-cn-16k-common-pytorch --local_dir ./
进入项目目录
cd SenseVoice
修改webui.py
1. 修改模型路径,为自己机器真实路径
2. 修改启动绑定机器地址,如下写自己真实私网ip
4. 启动webui.py
python webui.py
5. 成功后界面:
七、使用xinference 部署SenseVoice
1. 创建虚拟环境
conda create -n sensevoice python=3.10
conda activate sensevoice
2. 安装xinference
pip install xinference
如果出现 torchaudio版本不匹配,更新对应版本
pip install torchaudio==2.6.0(需要更新的版本)
3. 安装 FFmpeg(音频处理依赖)
wget https://ffmpeg.org/releases/ffmpeg-6.1.2.tar.gz
tar -zxvf ffmpeg-6.1.2.tar.gz
cd ffmpeg-6.1.2
sudo apt install nasm -y
./configure --prefix=/usr/local/ffmpeg
make -j$(nproc) && sudo make install
配置环境变量:
vim /etc/profile
文件结尾添加
export PATH=$PATH:/usr/local/ffmpeg/bin
立即生效:
source /etc/profile
4. 克隆项目
git clone https://github.com/FunAudioLLM/SenseVoice.git
cd SenseVoice
安装依赖
pip install -r requirements.txt
5. 从魔塔社区下载模型
下载地址详见评论区
创建文件夹 mkdir SenseVoiceSmall
cd SenseVoiceSmall
下载模型到该文件中
modelscope download --model iic/SenseVoiceSmall --local_dir ./
(比如模型被下载到:root/SenseVoiceSmall/small)
6.启动
nohup xinference-local --host 0.0.0.0 --port 9997 > /dev/null 2>&1 &
注册模型:
xinference launch --model_path /root/SenseVoice/small --model-name SenseVoiceSmall --model-type audio
注册成功后:
postman: multipart/form-data测试
- 点赞
- 收藏
- 关注作者
评论(0)