21世纪最伟大的物理学家去世了,你不来听听他说了什么?

举报
Python爱好者 发表于 2020/12/30 00:25:36 2020/12/30
【摘要】 前两天纪梵希先生刚去追随奥黛丽赫本,今天伟大的霍金先生也走向黑洞继续他的下半生。 "据外媒3.14报道,斯蒂芬·威廉·霍金(Stephen William Hawking)去世,享年76岁。” 被誉为21世纪最伟大物理学家霍金,在临死之前非常看好AI,认为AI的前途无可限量。 连霍金老先生都为我们指明了方向,我们还有什么理由不好好学习呢? 那...

640?wx_fmt=gif

前两天纪梵希先生刚去追随奥黛丽赫本,今天伟大的霍金先生也走向黑洞继续他的下半生。

"据外媒3.14报道,斯蒂芬·威廉·霍金(Stephen William Hawking)去世,享年76岁。”

640?wx_fmt=jpeg

被誉为21世纪最伟大物理学家霍金,在临死之前非常看好AI,认为AI的前途无可限量。

连霍金老先生都为我们指明了方向,我们还有什么理由不好好学习呢?

那我们先回到问题最开始的地方,要想学人工智能,选择哪门语言好呢?

当然是Python!!!!!

作为21世纪最牛逼的语言,它当然可以胜任AI的工作,那我们今天就来看看,如今Python工程师的需求又多火吧!

那我们今天就用爬虫去智联招聘看看吧!

首先我们看看用到那些模块:

640?wx_fmt=png

这里面有个tqdm的模块其实是进度条模块:

640?wx_fmt=png

可以自己尝试一下:

640?wx_fmt=png

需要进行pip安装:

pip install tqdm

OK那下面我们来了解一下我们做爬虫需要那些信息:

首先登录智联招聘官网,按F12进入开发者模式,然后在network中(需要打开过滤器)找到请求的头部:640?wx_fmt=png

首先我们要拿到信息参数如下(均再network中找):

640?wx_fmt=png

头部信息:

640?wx_fmt=png

这边我们要定义一个方法,用来获取HTML的内容:

640?wx_fmt=png

这一步很简单,下一步我们要做的就是将返回的信息进行解析,选择有用的信息:

640?wx_fmt=png

关于这边的正则表达式我说一下:

'<a style=.*? target="_blank">(.*?)</a>.*?'

根据样式来匹配职位信息

'<td class="gsmc"><a href="(.*?)" target="_blank">(.*?)</a>.*?'

匹配公司的主页的公司信息

'<td class="zwyx">(.*?)</td>'

匹配salary

最后在主函数中将信息遍历输出:

640?wx_fmt=png

运行主函数,传入参数:上海,Python工程师,10页

640?wx_fmt=png

等待输出结果:

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

.

.

.

.

由于结果太多了,这边就把依次截图了,大家可以自己动手试试,点击原文获取代码!

谢谢!

听说有气质的人都会关注这个公众号!

640?wx_fmt=jpeg

有问题尽管私聊小编!

文章来源: blog.csdn.net,作者:敲代码的灰太狼,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/tongtongjing1765/article/details/100581620

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。