首页 > 编程语言 >不用写一行Python代码,“Excel” 能直接爬虫了!

不用写一行Python代码,“Excel” 能直接爬虫了!

时间:2024-09-27 17:19:57浏览次数:3  
标签:Sheet 网址 Python 谷歌 Excel 爬虫 商品 ImportFromWeb 图片

家人们,要爬虫——现在用一个电子表格就行了。

图片

一行代码也别写,第三方软件也甭安。

只需在表格里点几下就ok。

不信,你瞧:

就这么两下,网页上的商品信息都有了。

图片

网友看完都惊呆了,码个不停。

图片

一看到这是来自谷歌的产品(Google Sheet,谷歌的“Excel”),大家就立马cue起了微软,问它慌不慌。

还有人称这是在“跨界打击”它。

图片

图片

 扫盲:“巨硬”就是微软,网友给的调侃

好不热闹。

来看具体怎么实现。

详细步骤

以爬亚马逊某个手机产品的商品页为例。

我们先打开谷歌Sheet(网友版即可),新建一个文档。

然后copy一下要爬的网址,粘进去。

图片

剩下的都在Sheet里完成。

我们先列一下要爬的元素,这里依次为:

商品图片-识别码(asin,亚马逊给每个商品生成的唯一标识)-商品名-价格-评分-图片网址。

图片

然后就可以正式开始爬了。

要诀就是一个叫做ImportFromWeb的函数。

它也是个插件,没有的需要先安装一下(安装地址放文末了),然后通过Google Sheet程序的“扩展程序”菜单导入就行。

图片

我们只需把ImportFromWeb函数放进asin那一列,然后第一个参数选中刚刚粘过来的网址,第二个参数把要爬的元素单元格拖一遍(除了“图片”)。

稍等个1~2s,价格、商品名等信息就都出来了!

图片

还差图片。

简单~基操~

用IMAGE函数把G3格子里得到的图片网址值给过去就行。

图片

至此,第一个商品页里的东西就爬到了。

唯一麻烦的是,如果还需要爬更多商品的信息,需要把商品网址挨个粘一遍。

然后就没啥了,除了给单元格地址的行标列标加一下绝对引用符“$”

这里可以不学视频,直接一个f4就行。

拖一下,全部搞定!

图片

怎么样?是不是非常方便。

图片

看完整个操作,你也发现了,其实就是谷歌写了个脚本给咱封装好了直接用。

而据官方介绍,这个ImportFromWeb功能还能自动更新爬取到的信息。

而且只要是用JS写的网站都可以爬(基本等于绝大数网站了),每个函数还可支持50个url,以及数千个数据点。

标签:Sheet,网址,Python,谷歌,Excel,爬虫,商品,ImportFromWeb,图片
From: https://blog.csdn.net/yoyo052700/article/details/142598351

相关文章

  • 给Excel 添加正则表达式regexp()函数
    WPS推出了正则表达式函数regex家族,非常好用,必须给其点赞。听说微软在最新版本的Office也要推出,但老版本Office用户就不能使用这个函数,好在用VBA可以自定义一个函数也可以实现的,此函数不仅将三种模式融合到了同一个函数中,同时还支持数组、单元格、文本等多种数据处理'**************......
  • python简易倒计时
    小伙伴们,国庆要到了,是不是很激动,几行python代码,实现倒计时。代码很简单,有几个点注意一下:①"\r":称为“回车”字符。在文本输出中,\r通常用于将光标移回到当前行的起始位置。光标会被移到这一行的最前面,从而覆盖原有的文本。简单说:就是在需要刷新的位置覆盖之前的的文本内容,广泛......
  • 10个高效的Python爬虫框架
    ​前言小型爬虫需求,requests库+bs4库就能解决;大型爬虫数据,尤其涉及异步抓取、内容管理及后续扩展等功能时,就需要用到爬虫框架了。下面介绍了10个爬虫框架,大家可以学习使用!Scrapyscrapy官网:https://scrapy.org/scrapy中文文档:https://www.osgeo.cn/scrapy/intro/oScrapy......
  • 将Python文件编译为exe可执行程序
      Python程序py格式文件的优点是可以跨平台,但运行必须有Python环境,没有Python环境无法运行py格式文件。有没有方法,用户不同安装Python就可直接运行开发的项目工程?答案是肯定的。这就涉及到需要将Python的.py格式文件编写的脚本编译成一个系统可执行文件,这可用PyInstaller来实......
  • Python自动整理文件夹
    编写一个Python脚本来遍历指定目录下的所有文件,根据文件的扩展名来创建相应的子文件夹(如果尚不存在的话),然后将文件移动到对应的子文件夹中。同时,我们需要处理重名文件的问题,通过在文件名后添加_和数字来区分。下面是一个实现这个功能的Python脚本示例:importosimportshu......
  • 数据结构编程实践20讲(Python版)—02链表
    本文目录02链表linked-listS1说明S2示例单向链表双向链表循环链表S3问题:反转单向链表求解思路Python3程序S4问题:双向链表实现历史浏览网页求解思路Python3程序S5问题:基于循环链表的玩家出牌顺序求解思路Python3程序往期链接01数组02链表linked-lis......
  • 自动化办公-python中的open()函数
    Python中的open()函数用于打开一个文件,并返回一个文件对象,您可以通过该对象对文件进行读写操作。基本语法:open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)参数说明:file:要打开的文件路径(字符串)。可以是......
  • 自动化办公-Python-os模块的使用
    os.path模块的使用在指定文件路径时,由于操作系统的差异,直接使用硬编码的路径可能会导致程序在不同平台上无法正常运行。为了解决这个问题,Python提供了os.path模块,它包含了一系列用于路径操作的函数,可以帮助您以跨平台的方式处理文件路径。为什么要使用os.path模块......
  • Python 迭代器双指针
    我们知道在cpp这种指针语言里面,双指针是这么写的:for(autoi=v.begin(),j=v.begin();j<v,end();j++){//dosomething...//updatepointeriwhile(cond){i++;}}对于py这样不带指针的,一般就只能这么写:i=0forjinrange(len(lst)):#do_something......
  • python爬虫案例——抓取三级跳转网页,实现逐页抓取,数据存入mysql数据库(10)
    文章目录1、目标任务2、网页分析3、完整代码1、目标任务目标站点:情话网(http://www.ainicr.cn/tab/)任务:抓取该网站下所有标签下的所有情话语句,并将其存入mysql数据库2、网页分析用浏览器打开网页,按F12或右键检查,进入开发者模式,在Network-Doc下找到网页的数......