首页 > 编程语言 >NodeJS:使用 superagent 和 cheerio 爬取网页

NodeJS:使用 superagent 和 cheerio 爬取网页

时间:2023-02-19 23:12:04浏览次数:96  
标签:tex const NodeJS cheerio lst 爬取 superagent var

安装依赖:

npm install superagent cheerio --save

同步代码:

const superagent = require('superagent')
const cheerio = require('cheerio')
const fs = require('fs')

function getNews() {
  return new Promise((resolve, reject) => {
    superagent.get('https://a.b.c.cn/').end((err, data) => {
      if (err) {
        reject('error')
      } else {
        const $ = cheerio.load(data.text)
        var lst = []
        $('#blk_cjkjqcfc_011  a').each((index, item) => {
          var tex = $(item).text()
          if (tex && !tex.endsWith('|')) {
            lst.push(tex.replaceAll('\n', ''))
          }
        })
        resolve(lst)
      }
    })
  })
}

async function main() {
  var res = await getNews()
  console.log(res)
}

main()

标签:tex,const,NodeJS,cheerio,lst,爬取,superagent,var
From: https://www.cnblogs.com/engure/p/17135893.html

相关文章

  • nodejs
     Node.js/usr/local/bin/nodenpm /usr/local/bin/npm Thispackagehasinstalled:Node.jsv19.6.1to/usr/local/bin/nodenpmv9.4.0to/usr/local/bin/npm......
  • NodeJS安装(Mac版本)
    nvm,node,npm之间的区别nvm:nodejs版本管理工具。也就是说:一个nvm可以管理很多node版本和npm版本。nodejs:在项目开发时的所需要的代码库npm:nodejs包管理工具。......
  • Python爬虫-第五章-2-爬取某网站图库
    技术点  1.requests  2.beautifulSoupps:程序可扩展  1.比如翻页下载  2.下拉加载更多可以用selenium  3.多线程或者异步协程提升下载效率 ......
  • nodejs
    node环境搭建Vue-CLT项目搭建,vue相当于脚手架,可以创建vue项目。vue脚手架必须要按照nodejs解释型语言。1.nodejs是一门后端语言2.JavaScript只能运行在浏览器中,因为浏......
  • Nodejs 使用 ZooKeeper 做服务发现
    将单体服务拆分为微服务后,为了服务高可用,一般会做集群多实例。但在分布式下,怎么进行高效、便捷的进行服务访问问题,出现了各类服务注册和服务发现框架。这里使用的是Zookeep......
  • vue项目部署在nodejs+express
    一、安装node和打包vue项目就不用多说了二、安装expressExpress是一个保持最小规模的灵活的Node.jsweb应用程序开发框架,为web和移动应用程序提供一组强大的功能npmin......
  • nodejs 实现类似sleep延时执行的方法
    在Node.js中,没有类似于传统编程语言中的sleep()函数,因为Node.js是单线程的。但是可以使用setTimeout()函数实现暂停执行,从而实现类似于sleep()的效果。下面是......
  • NodeJs基础学习
    学习目标该文档为NodeJs的学习记录文档,学习目标为能够知道什么是Nodejs能够知道Node,js可以做什么能够说出Nodejs中的JavaScript的组成部分能够使用fs模......
  • Angular CLI - NodeJS 兼容版本
    |AngularCLI|Angular|NodeJS|TypeScript|RxJSVersion||-----------|----------......
  • 爬取url遇到302跳转问题怎么解决?
    最近在做爬虫项目遇到一个问题,这里简单的描述下让大家帮忙看下。目标网站需要完成一一系列登录操作,经过抓包测试只需要使用简单的post请求后收到的回包中包含cookie信息,因此......