Python初级案例教学,爬虫基础【第三课】

举报
南蓬幽 发表于 2022/05/17 10:39:24 2022/05/17
【摘要】 python 提取出所有学生的序号,姓名,成绩 python 敏感词过滤疫苗,疫情 张三的学号是1101,张三的成绩为84.535分 总结 python 提取出所有学生的序号,姓名,成绩# 提取出所有学生的序号,姓名,成绩str1='''<tbody><tr><td><span><span class="c-index c-index-hot1 c-gap-icon-right-small...

python 提取出所有学生的序号,姓名,成绩

# 提取出所有学生的序号,姓名,成绩
str1='''<tbody>
<tr><td><span><span class="c-index c-index-hot1 c-gap-icon-right-small">1</span>张婷婷</span></td><td class="opr-toplist-right">92<i class="opr-toplist-st c-icon c-icon-down"></i></td></tr>
<tr><td><span><span class="c-index c-index-hot1 c-gap-icon-right-small">2</span>王华</span></td><td class="opr-toplist-right">91<i class="opr-toplist-st c-icon c-icon-down"></i></td></tr>
<tr><td><span><span class="c-index c-index-hot1 c-gap-icon-right-small">3</span>张岚</span></td><td class="opr-toplist-right">90<i class="opr-toplist-st c-icon c-icon-down"></i></td></tr>
<tr><td><span><span class="c-index c-gap-icon-right-small">4</span>孙鸿峰</span></td><td class="opr-toplist-right">90<i class="opr-toplist-st c-icon c-icon-down"></i></td></tr>
<tr><td><span><span class="c-index c-gap-icon-right-small">5</span>周海栋</span></td><td class="opr-toplist-right">89<i class="opr-toplist-st c-icon c-icon-down"></i></td></tr>
<tr><td><span><span class="c-index c-gap-icon-right-small">6</span>武静</span></td><td class="opr-toplist-right">88<i class="opr-toplist-st c-icon c-icon-down"></i></td></tr>
</tbody>'''
list1 = str1.split('</tr>', 5)
for i in list1:
    no_begin = i.find('c-gap-icon-right-small">') + len('c-gap-icon-right-small">')
    no_end = i.find('</span>')
    no = i[no_begin:no_end]
    print(no, end=' ')
    name_begin = no_end + len('</span>')
    name_end = i.rfind('</span>')
    name = i[name_begin:name_end]
    print(name, end=' ')
    score_begin = i.index('class="opr-toplist-right">')+len('class="opr-toplist-right">')
    score_end = i.index('<i class="opr-toplist-st c-icon c-icon-down">')
    score = i[score_begin:score_end]
    print(score, end=' ')
    print('')


python 敏感词过滤疫苗,疫情

我们国家新冠病毒疫苗接种的基本原则是“知情、同意、自愿”。接种人群的数量和群众接种意愿是直接相关的,所以在接种工作过程中我们一直在关注这个问题,也是接种工作的重点。我们一直在跟踪研究这个问题,根据现在了解的情况看,接种意愿受到的影响因素比较多,接种意愿变化也比较大。当前看,影响接种意愿的有两个主要因素:第一是疫情防控因素,我们国家目前采取了有力得当的疫情防控措施,所以我国的疫情总体平稳,部分群众就认为感染风险比较低,暂时不需要接种疫苗来增加保护力;第二是由于新冠病毒疫苗属于新上市疫苗,部分群众希望能够看到更多关于疫苗使用效果的信息,大家非常关注安全性、有效性等方面的数据,大家考虑对疫苗有更多了解之后再接种。当前主要是这两个方面因素有较大影响作用。

过滤敏感词:疫苗,疫情

# 敏感词过滤
str = "我们国家新冠病毒疫苗接种的基本原则是“知情、同意、自愿”。接种人群的数量和群众接种意愿是直接相关的,所以在接种工作过程中我们一直在关注这个问题,也是接种工作的重点。我们一直在跟踪研究这个问题,根据现在了解的情况看,接种意愿受到的影响因素比较多,接种意愿变化也比较大。当前看,影响接种意愿的有两个主要因素:第一是疫情防控因素,我们国家目前采取了有力得当的疫情防控措施,所以我国的疫情总体平稳,部分群众就认为感染风险比较低,暂时不需要接种疫苗来增加保护力;第二是由于新冠病毒疫苗属于新上市疫苗,部分群众希望能够看到更多关于疫苗使用效果的信息,大家非常关注安全性、有效性等方面的数据,大家考虑对疫苗有更多了解之后再接种。当前主要是这两个方面因素有较大影响作用。"
str1 = str.replace('疫苗', '**')
str2 = str1.replace('疫情', '**')
print(str2)

张三的学号是1101,张三的成绩为84.535分

1.通过位置参数

2.通过关键字参数

3.映射-列表

4.映射-字典

5.保留2位小数

# 要求输出:张三的学号是1101,张三的成绩为84.535分
str = '{}的学号是{},{}的成绩为{}分'
# 1.通过位置参数
str1 = '{0}的学号是{1},{0}的成绩为{2}分'
print(str1.format('张三', '1101', 84.535))
# 2.通过关键字参数
str2 = '{name}的学号是{no},{name}的成绩为{score}分'
print(str2.format(name='张三', no='1101', score=84.535))


# 3.映射-列表
str3 = '{0}的学号是{1},{0}的成绩为{2}分'
list1 = ['张三', '1101', 84.535]
print(str3.format(*list1))

# 4.映射-字典
str4 = '{name}的学号是{no},{name}的成绩为{score}分'
item1 = {'name': '张三', 'no': '1101', 'score': 84.535}
print(str4.format(**item1))

# 5.保留2位小数
str5 = '{0}的学号是{1},{0}的成绩为{2:.2f}分'
print(str5.format('张三', '1101', 84.535))

总结

通过前两个实验,学会了字符串的切割和拼接替换为以后的爬虫打下基础!

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。