B站弹幕爬虫

举报
北山啦 发表于 2021/05/26 14:33:11 2021/05/26
【摘要】 python爬取B站弹幕爬虫 import requests from xmltodict import parse import pandas as pd 123 bullet_screen = [] """BV号转cid函数""" def CIDget(bvid):#获取视频cid url="https://api.bilibili.com/x/pla...

python爬取B站弹幕爬虫

import requests
from xmltodict import parse
import pandas as pd

  
 
  • 1
  • 2
  • 3
bullet_screen = []
"""BV号转cid函数"""
def CIDget(bvid):#获取视频cid url="https://api.bilibili.com/x/player/pagelist?bvid="+str(bvid)+"&jsonp=jsonp" response=requests.get(url) dirt=json.loads(response.text) cid=dirt['data'][0]['cid'] #cid号已得到 nowDMget(cid)#调用爬取弹幕函数
"""爬取当前的弹幕函数"""
def nowDMget(cid):#获取今天的弹幕  url="https://api.bilibili.com/x/v1/dm/list.so?oid="+str(cid) response=requests.get(url) response.encoding='utf-8' data=parse(response.text)#解析xml为有序字典 liat_DM=data['i']['d'] print(len(liat_DM)) for i in range(len(liat_DM)): print(liat_DM[i]['#text']) bullet_screen.append(liat_DM[i]["#text"])

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
CIDget("BV1vy4y1i7bS")
data = pd.DataFrame({"弹幕":bullet_screen})
data.to_excel("bingbing.xlsx") 
  
 
  • 1
  • 2
  • 3

展示:
在这里插入图片描述

文章来源: beishan.blog.csdn.net,作者:北山啦,版权归原作者所有,如需转载,请联系作者。

原文链接:beishan.blog.csdn.net/article/details/112234136

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。