- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

16行Python代码批量下载音频素材保存本地，非常详细！

嗨学编程发表于 2022/02/26 21:17:16 2022/02/26

【摘要】作为当代新青年，应该多少会点短视频制作吧？哈哈，那当代自媒体创作者好了~制作视频的时候，多少需要一些搞怪的声音？或者奇怪的声音？音乐等等~一个个下载多慢，我们今天就用python实现批量下载~环境/模块/目标1、目标2、开发环境兄弟们，刚学Python的话，不要安装一些其它的软件，就装这两个就可以了~Python 环境Pycharm 编辑器3、模块本次使用的模块主要是这两个...

作为当代新青年，应该多少会点短视频制作吧？

哈哈，那当代自媒体创作者好了~

制作视频的时候，多少需要一些搞怪的声音？或者奇怪的声音？音乐等等~

一个个下载多慢，我们今天就用python实现批量下载~

环境/模块/目标

1、目标

2、开发环境

兄弟们，刚学Python的话，不要安装一些其它的软件，就装这两个就可以了~

Python      环境
Pycharm     编辑器

3、模块

本次使用的模块主要是这两个

requests  # 数据请求模块
re        # 正则表达式模块

流程讲解

这次我详细写流程，小白都能看懂的那种，看完大家记得三连，给我一点创作的动力吧，嘿嘿~

首先我们打开网址后右键选择检查
选择network ，刷新页面往下滑，会出现一个 page-4 和 page-5 的页面。
这两个页面很多数据是直接在这里有的，我们随便找一个点击播放，然后点击media ，在headers里面会有一个音频文件，就是我标注的下载地址。
可以直接播放也可以直接下载
那想获得这个这个地址怎么搞呢？

我们直接复制这串数字，比如32716 ，然后点击左上角的这个搜索框，搜索一下。
搜索之后我们可以看到page-5这里就有音频的声音链接地址。
音频标题也在这里可以找到

然后我们点击headers，直接对于这个url地址发送请求。

首先导入requests模块

import requests

url就是刚刚的链接

url = 'https://手动替换一下/search/word-/page-5'

然后我们加一个headers进行伪装

这里直接复制 headers 下面的 user-agent 里面的内容就好了
记得加上引号

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36'
}

然后发送请求，打印一下看看结果

response = requests.get(url=url, headers=headers)
print(response.text)

打印出来的内容太多了，我们直接在上面搜索MP3，精准定位，它的标题就在mp3文件下面那个链接那里。
然后我们把它复制过来，用正则去匹配中间这段内容，中间的url用（.*？）代替。

首先导入re模块

import re

刚刚那段内容复制过来，.*？用括号括起来。

从 response.text 里面去匹配，匹配到的内容用play_url_list这个变量接收。

play_url_list = re.findall('<div class="ui360 ui360-vis"><a href="(.*?)"></a></div>', response.text)

然后打印一下看看有没有匹配到内容

print(play_url_list)

可以看到直接匹配到了mp3文件，它包含在一个列表里面。
那我们还需要它的标题名字，同样的复制过来。还是一样的操作，url和名字都替换为 .*？

从 response.text 里面去匹配，匹配到的内容用name_list这个变量接收。

name_list = re.findall('<a class="h6 text-white font-weight-bold" target="_blank" href=".*?" title="(.*?)">.*?</a>', response.text)

打印一下

print(name_list)

可以看到名字这些数据，都已经获取到了。
遍历一下，把获取到的数据打包到一起，然后一个个提取出来，获取它的一个二进制数据内容，用mp3_content 这个变量接收一下

for play_url, name in zip(play_url_list, name_list):
    mp3_content = requests.get(url=play_url, headers=headers).content

然后直接保存，with open 给它一个文件夹的名字，加上名字，加上 .mp3的后缀，保存方式 mode = wb , 用 f.write 这个变量接收一下 mp3_content

    with open('音效\\' + name + '.mp3', mode='wb') as f:
        f.write(mp3_content)

这里咱们没有写自动创建文件夹，所以需要手动创建一下文件夹，然后把你命名的名字写入进来。

然后我们打印一下，看看结果。

print(name)

相关的数据内容就保存在你创建的文件夹了

注：所有的url大家自己手动替换一下，我这里把它们删了，不然会误杀

全部代码

import requests
import re
url = 'https://这里大家自己替换一下/search/word-/page-5'
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
# print(response.text)
play_url_list = re.findall('<div class="ui360 ui360-vis"><a href="(.*?)"></a></div>', response.text)
name_list = re.findall('<a class="h6 text-white font-weight-bold" target="_blank" href=".*?" title="(.*?)">.*?</a>', response.text)
print(play_url_list)
print(name_list)
for play_url, name in zip(play_url_list, name_list):
    mp3_content = requests.get(url=play_url, headers=headers).content
    with open('音效\\' + name + '.mp3', mode='wb') as f:
        f.write(mp3_content)
        print(name)

兄弟们，今天的分享就到这里，溜了溜了~

记得点赞收藏，赐予我动力~

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

16行Python代码批量下载音频素材保存本地，非常详细！

环境/模块/目标

1、目标

2、开发环境

3、模块

流程讲解

全部代码

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

16行Python代码批量下载音频素材保存本地，非常详细！

环境/模块/目标

1、目标

2、开发环境

3、模块

流程讲解

全部代码

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品