Google资深工程师深度讲解Go语言-爬虫实战项目(十三)

举报
lxw1844912514 发表于 2022/03/26 23:41:57 2022/03/26
【摘要】 一.为什么做爬虫项目 有一定复杂性可以灵活调整醒目的复杂性平衡语言/爬虫之间的比重 二.网络爬虫分类 通用爬虫:baidu,google聚焦爬虫:从互联网获取结构化数据(知乎) 三.项目总体结构 四.go语言的爬虫库/框架 本课程主要: 将不适用现成爬虫库/框架使用elasticSearch作为数据存储使用go语言标准...

一.为什么做爬虫项目

  • 有一定复杂性
  • 可以灵活调整醒目的复杂性
  • 平衡语言/爬虫之间的比重

二.网络爬虫分类

  • 通用爬虫:baidu,google
  • 聚焦爬虫:从互联网获取结构化数据(知乎)

三.项目总体结构

四.go语言的爬虫库/框架

本课程主要:

  1. 将不适用现成爬虫库/框架
  2. 使用elasticSearch作为数据存储
  3. 使用go语言标准模板实现http数据展示部分

爬取内容:内容:新闻,播客,社区

爬取人:

  • qq空间,人人网,微博,Facebook;
  • 相亲网站,求职网站,出于隐私和趣味性,本课程爬取相亲网站

文章来源: blog.csdn.net,作者:lxw1844912514,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/lxw1844912514/article/details/108628766

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。