使用async批量获取博客链接

举报
拿我格子衫来 发表于 2022/03/17 23:38:07 2022/03/17
3.8k+ 0 0
【摘要】 主要使用了superagent  cheerio  async 目的获取所有的博客链接,需要的参数有 博客地址 以及 总页码   let superagent = require('superagent')let cheerio = require('cheer...

主要使用了superagent  cheerio  async

目的获取所有的博客链接,需要的参数有 博客地址 以及 总页码


      let superagent = require('superagent')
      let cheerio = require('cheerio')
      const async = require('async')
      let baseBlogLink = 'https://fizzz.blog.csdn.net/'  // 博客地址
      let articleSelector = '.article-list h4 a' // 文章选择器
      let totalPage = 9 // 总页码
      const setData = {
       'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36',
       'Referrer': 'https://fizzz.blog.csdn.net/',
       'Content-Type': 'text/html; charset=UTF-8',
      }
      // Pretend this is some complicated async factory
      var getOnePageBlogLink = function(pageIndex, callback) {
        pageIndex = pageIndex + 1
        superagent
          .get(`${baseBlogLink}/article/list/${pageIndex}`)
          .set(setData)
          .then(res => {
           let blogHrefArr = []
           let $ = cheerio.load(res.text)
           let allEle = $(articleSelector)
           let len = allEle.length
           if (len > 0) {
             console.log(`获取到${len}条博客记录`)
             for (let i = 0; i < len; i++) {
               let blogItem = {
                 name: allEle.eq(i).text().replace(/\s+/g, ''),
                 href: allEle.eq(i).attr('href'),
                }
                blogHrefArr.push(blogItem)
              }
            }
           callback(null, blogHrefArr)
          })
      };
      async.times(totalPage, function(n, next) {
       getOnePageBlogLink(n, function(err, blogs) {
         next(err, blogs);
        });
      }, function(err, blogsArr) {
       const allBlogs = blogsArr.flat()
       console.log(allBlogs)
       console.log(allBlogs.length, 123)
      });
  
 

执行效果图

文章来源: fizzz.blog.csdn.net,作者:拿我格子衫来,版权归原作者所有,如需转载,请联系作者。

原文链接:fizzz.blog.csdn.net/article/details/108999633

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

作者其他文章

评论(0

抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。