Python考核内容

举报
红目香薰 发表于 2022/08/31 15:51:35 2022/08/31
【摘要】 ​ ​编辑目录​编辑目标网站:前置环境需求爬取需求:前五页的以下内容文件保存需求:如果有异常链接:内容为空的try:except:跳过页码逻辑:page_index=[0-4]HTML-CSS拆解:示例编码:目标网站:https://www.51moot.net/main/course?search_id=0&is_free=-1&page_index=0前置环境需求pip3 config ...

 编辑

目录

​编辑

目标网站:

前置环境需求

爬取需求:前五页的以下内容

文件保存需求:

如果有异常链接:内容为空的try:except:跳过

页码逻辑:page_index=[0-4]

HTML-CSS拆解:

示例编码:



目标网站:

https://www.51moot.net/main/course?search_id=0&is_free=-1&page_index=0

前置环境需求

pip3 config set global.index-url https://repo.huaweicloud.com/repository/pypi/simple
pip3 config list
pip3 install --upgrade pip
pip3 install requests
pip3 install scrapy

爬取需求:前五页的以下内容

1、课程标题

2、主讲人

3、章节数

4、学习时长

5、学习人数

6、课程简介

文件保存需求:

将5页内容的所有课程以每门课程一个【课程名称.txt】文件的方式进行保存。

编辑

如果有异常链接:内容为空的try:except:跳过

编辑

页码逻辑:page_index=[0-4]

https://www.51moot.net/main/course?search_id=0&is_free=-1&page_index=0
https://www.51moot.net/main/course?search_id=0&is_free=-1&page_index=1
https://www.51moot.net/main/course?search_id=0&is_free=-1&page_index=2
https://www.51moot.net/main/course?search_id=0&is_free=-1&page_index=3
https://www.51moot.net/main/course?search_id=0&is_free=-1&page_index=4

所以一个循环搞定。

HTML-CSS拆解:

第一层CSS拆解

编辑

第二层CSS拆解

编辑

编辑

示例编码:

编辑

编辑

编辑可以看到有一个多添加了uuid这样简单一些,我没做set去重。

编辑

提交需求:

1、项目压缩包

2、截图,截图要求如下:

编辑


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。