网页抓取实例之wildberries电商平台数据抓取

时间：2023-02-09 15:33:24浏览次数：42

电商平台的数据抓取，一直是网页抓取公式的热门实战实例，之前我们通常是针对国内的电商平台进行数据抓取，昨天小编受到委托，针对一个俄罗斯电商平台wildberries做了数据抓取，抓取的主要内容是商品标题、价格及评价数量。

本文小编将给大家讲解下网页抓取的步骤及遇到的难点。

先看一下整体效果，在网址提前分析录入好的前提下，我们通过输入页数，便可自动生成商品的标题、价格和评价数量：

在对网页进行一定的分析之后，我们开始寻找其数据源。右键检查或按快捷键F12打开开发者工具，然后在NetWork选项卡下，筛选找出请求结果，当找到请求中含有的数据与网页外部显示的数据一致时，便是寻找成功了。

这里，我们将请求的网址复制下来，以便后续使用。

有了网址，我们便可以将数据源提取到表格中，通常我们使用的公式为=GetJsonSource()，但是在提取过程中我们发现，由于wildberries平台的一个页面数据量太大，导致数据源的字符数超过了表格的最大字符数限制，所以提取的内容并不完整。

为解决这一问题，我们更换为=GetJsonSourceW()公式，并对其进行改造。将网页中的源数据下载到本地文件，代替了之前的提取到表格单元格中，公式的括号内同样都是填写数据源的网址。当然，使用=GetJsonSourceW()需要打开Excel浏览器执行网页抓取任务，相信这点肯定难不倒大家。

终于将数据源搞定了，剩下的工作就简单了起来。由于数据源为JSON格式的，我们便使用=GetJsonProperty()公式提取，其中A5表示数据源所在的单元格位置，data.products.0.name为属性名称

写好公式后，重新计算下公式，很快就会出来结果。至此，我们的网页抓取任务就算结束了，后面的工作就是对表格的内容进行优化，比如我们将数据源的网址进行分析，把页数拿了出来，这样我们就可以做到仅通过修改数字，便可跳转到其他页，实现抓取任务。

标签：网页,公式,wildberries,抓取,数据源,电商
From： https://www.cnblogs.com/wlhsk/p/17105462.html

python数据抓取，抓点星星网的内容
代码：#coding=utf-8importos,sys,reimportrequestsfromwebob.excimportstrip_tagsfromxpinyinimportPinyindefstr2dict(str):dict={}groups1......
#yyds干货盘点#【愚公系列】2023年02月微信小程序-电商项目-UI设计之蓝湖的使用
前言蓝湖是一款产品文档和设计图的共享平台，帮助互联网团队更好地管理文档和设计图。蓝湖可以在线展示Axure，自动生成设计图标注，与团队共享设计图，展示页面之间的跳转关系。蓝......
Spider实战系列-抓取《一人之下第三季》
今天我们抓取的是m3u8的视频,视频有长视频和短视频之分.抓取m3u8类型视频对于短视频一般来说一个视频对应的就是一个url长视频一个视频就几百兆到几十G不等这种视频......
小程序高级电商前端第3周电商系统分类页面客服商品详情页面开发<三>----为你推荐实现
为你推荐实现：概述：接着https://www.cnblogs.com/webor2006/p/16645627.html继续往下学习，对于整个首页的功能，还差最后一个木有实现：而这块也是最麻烦的，推荐的商品是需要分......
#yyds干货盘点#【愚公系列】2023年02月微信小程序-电商项目-商品详情页面运费说明
前言vant-weapp的van-cell单元格apiCellGroupProps参数说明类型默认值title分组标题string-insetv1.7.2是否展示为圆角卡片风格booleanfalsebo......
知识付费平台,电商平台,内容平台介绍
知识付费平台,电商平台,内容平台1.知识付费平台*千聊*荔枝微课*有讲*维库*网易云课堂*腾讯课堂*得到*混沌大学*喜马拉雅*十点课程*凯叔讲故事*......
#yyds干货盘点#【愚公系列】2023年02月微信小程序-电商项目-商品详情页面的标题及价
前言vant-weapp的Layout布局apiRowProps参数说明类型默认值gutter列元素之间的间距（单位为px）string/number-ColProps参数说明类型默认值......
SpringCloud微服务电商系统在Kubernetes集群中上线详细教程
Kubernetes集群部署Springcloud微服务商务系统原文网址：https://www.wangt.cc//2021/12/springcloud%E5%BE%AE%E6%9C%8D%E5%8A%A1%E7%94%B5%E5%95%86%E7%B3%BB%E7%BB%9F%......
各省电商指数数据、各省电子商务指数数据（1990-2022）
各省电商指数数据、各省电子商务指数数据（1990-2022）各省电商指数数据、各省电子商务指数数据（1990-2022）各省电商指数数据、各省电子商务指数数据（1990-2022）最新版各省电商指数......
电商导购CPS，这是最容易上手的创业项目了吧
大家好，我是小悟前段时间写了个外卖cps小程序，并开源了代码，源码在这里零基础，搞外卖CPS小程序副业，附源码，有需要的小伙伴自取，可以结合这篇文章外卖CPS小程序部署指南......

网页抓取实例之wildberries电商平台数据抓取

相关文章

赞助商

阅读排行