【Datawhale IntelVINO学习笔记】OpenVINO音频和人体姿态识别
【摘要】 声音检测实验 初始化环境定义工作目录export OV=/opt/intel/openvino_2021/export WD=~/OV-300/06/Lab1/export MODELS_PATH=~/OV-300/06/Lab1/#初始化OpenVINOsource $OV/bin/setupvars.sh进入实验目录cd $WD下载并使用MO转换声音识别模型./download_aud...
声音检测实验
初始化环境
定义工作目录
export OV=/opt/intel/openvino_2021/
export WD=~/OV-300/06/Lab1/
export MODELS_PATH=~/OV-300/06/Lab1/
#初始化OpenVINO
source $OV/bin/setupvars.sh
进入实验目录
cd $WD
下载并使用MO转换声音识别模型
./download_audio_models.sh
#通过vi查看模型拓扑结构
vi $MODELS_PATH/audio_models/aclnet/FP32/aclnet.xml
注:可以看到该xml的版本以及数据精度为:FP32,input shape=“1, 1, 1, 16000”。使用“:q”指令退出该界面。
运行Demo
运行指令:
bash audio_event_detection.sh
注:屏幕上将会打印DL-Streamer的pipeline指令和该指令的全部输出结果
#运行晒选结果的指令,来查看探测到的声音种类:
bash audio_event_detection.sh | grep "label\":" | sed 's/label_id.*//' |sed 's/.*label"/==>/'
#修改aclnet.json 脚本来实现你的猜想:
vi $WD/model_proc/aclnet.json
解决方案:尝试 "Insects (flying)" 在 0.5 至0.9 之间更改,更改后保存完再次运行audio_event_detection.sh进行测试,直至检测不到昆虫噪音。
通过vi查看模型拓扑结构
vi $MODELS_PATH/audio_models/aclnet/FP32/aclnet.xml
注:可以看到该xml的版本以及数据精度为:FP32,input shape=“1, 1, 1, 16000”。使用“:q”指令退出该界面。
运行Demo
运行指令:
bash audio_event_detection.sh
注:屏幕上将会打印DL-Streamer的pipeline指令和该指令的全部输出结果
#运行晒选结果的指令,来查看探测到的声音种类:
bash audio_event_detection.sh | grep "label\":" | sed 's/label_id.*//' |sed 's/.*label"/==>/'
修改aclnet.json 脚本来实现你的猜想:
vi $WD/model_proc/aclnet.json
解决方案:尝试 “Insects (flying)” 在 0.5 至0.9 之间更改,更改后保存完再次运行audio_event_detection.sh进行测试,直至检测不到昆虫噪音。
:使用DL-streamer进行表情识别
开始实验
#进入实验目录
cd $WD
运行识别示例
#运行人脸识别和分类示例:
bash face_detection_and_classification.sh video1.mp4
#获得output.mp4,获得可播放的标准MP4格式,使用:
ffmpeg -i output.mp4 output_1.mp4
#播放结果视频:
show output_1.mp4
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)