B站弹幕爬虫

举报
北山啦 发表于 2021/04/20 23:54:26 2021/04/20
1.5k+ 0 0
【摘要】 python爬取B站弹幕爬虫 import requests from xmltodict import parse import pandas as pd 123 bullet_screen = [] """BV号转cid函数""" def CIDget(bvid):#获取视频cid url="https://api.bilibili.com/x/pla...

python爬取B站弹幕爬虫

import requests
from xmltodict import parse
import pandas as pd

  
 
bullet_screen = []
"""BV号转cid函数"""
def CIDget(bvid):#获取视频cid url="https://api.bilibili.com/x/player/pagelist?bvid="+str(bvid)+"&jsonp=jsonp" response=requests.get(url) dirt=json.loads(response.text) cid=dirt['data'][0]['cid'] #cid号已得到 nowDMget(cid)#调用爬取弹幕函数
"""爬取当前的弹幕函数"""
def nowDMget(cid):#获取今天的弹幕  url="https://api.bilibili.com/x/v1/dm/list.so?oid="+str(cid) response=requests.get(url) response.encoding='utf-8' data=parse(response.text)#解析xml为有序字典 liat_DM=data['i']['d'] print(len(liat_DM)) for i in range(len(liat_DM)): print(liat_DM[i]['#text']) bullet_screen.append(liat_DM[i]["#text"])

  
 
CIDget("BV1vy4y1i7bS")
data = pd.DataFrame({"弹幕":bullet_screen})
data.to_excel("bingbing.xlsx") 
  
 

展示:
在这里插入图片描述

文章来源: blog.csdn.net,作者:北山啦,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/qq_45176548/article/details/112234136

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

作者其他文章

评论(0

抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。