python爬取aspx数据

举报
风吹稻花香 发表于 2021/06/06 00:13:11 2021/06/06
【摘要】 参考: https://github.com/lxl0928/ricedata_spider   # coding: utf-8 import jsonimport urllib.requestfrom datetime import datetimefrom collections import OrderedDict import requestsfrom...

参考:

https://github.com/lxl0928/ricedata_spider

 


  
  1. # coding: utf-8
  2. import json
  3. import urllib.request
  4. from datetime import datetime
  5. from collections import OrderedDict
  6. import requests
  7. from lxml import etree
  8. cnt_now = datetime.now()
  9. cnt_time = "{}{}{}{}{}".format(cnt_now.year, cnt_now.month, cnt_now.day, cnt_now.hour, cnt_now.minute)
  10. url = "http://www.ricedata.cn/gene/accessions_switch.aspx?p={}&cloned=true"
  11. user_agent = "Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)"
  12. headers = {"User-Agent": user_agent}
  13. result_path = "./doc/{}.xlsx".format(cnt_time)
  14. xls_data = OrderedDict()
  15. result_biao = []
  16. # 存储目标数据结构
  17. result_data = dict()
  18. # 确定每列的标题
  19. result_data['title'] = ["GeneID", "基因名称或注释", "基因符号", "RAP_Locus", "MSU_Locus", "cDNAs

文章来源: blog.csdn.net,作者:网奇,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/jacke121/article/details/108091163

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。