首页 > 编程语言 >不用写一行Python代码,“Excel” 能直接爬虫了!

不用写一行Python代码,“Excel” 能直接爬虫了!

时间:2024-09-07 17:51:36浏览次数:7  
标签:Sheet 商品 Python Excel 爬虫 学习 网址

家人们,要爬虫——现在用一个电子表格就行了。

 

如果你正在学习Python并且找不到方向的话可以试试我这一份学习方法+籽料呀! 点击 领取(不要米米)

一行代码也别写,第三方软件也甭安。

只需在表格里点几下就ok。

不信,你瞧:

就这么两下,网页上的商品信息都有了。

图片

网友看完都惊呆了,码个不停。

 

一看到这是来自谷歌的产品(Google Sheet,谷歌的“Excel”),大家就立马cue起了微软,问它慌不慌。

还有人称这是在“跨界打击”它。

 扫盲:“巨硬”就是微软,网友给的调侃

好不热闹。

来看具体怎么实现。

详细步骤

以爬亚马逊某个手机产品的商品页为例。

我们先打开谷歌Sheet(网友版即可),新建一个文档。

然后copy一下要爬的网址,粘进去。

图片

剩下的都在Sheet里完成。

我们先列一下要爬的元素,这里依次为:

商品图片-识别码(asin,亚马逊给每个商品生成的唯一标识)-商品名-价格-评分-图片网址。

然后就可以正式开始爬了。

要诀就是一个叫做ImportFromWeb的函数。

它也是个插件,没有的需要先安装一下(安装地址放文末了),然后通过Google Sheet程序的“扩展程序”菜单导入就行。

我们只需把ImportFromWeb函数放进asin那一列,然后第一个参数选中刚刚粘过来的网址,第二个参数把要爬的元素单元格拖一遍(除了“图片”)。

稍等个1~2s,价格、商品名等信息就都出来了!

图片

还差图片。

简单~基操~

用IMAGE函数把G3格子里得到的图片网址值给过去就行。

图片

至此,第一个商品页里的东西就爬到了。

唯一麻烦的是,如果还需要爬更多商品的信息,需要把商品网址挨个粘一遍。

然后就没啥了,除了给单元格地址的行标列标加一下绝对引用符“$”

这里可以不学视频,直接一个f4就行。

拖一下,全部搞定!

图片

怎么样?是不是非常方便。

看完整个操作,你也发现了,其实就是谷歌写了个脚本给咱封装好了直接用。

而据官方介绍,这个ImportFromWeb功能还能自动更新爬取到的信息。

而且只要是用JS写的网站都可以爬(基本等于绝大数网站了),每个函数还可支持50个url,以及数千个数据点。

如果你是准备学习Python或者正在学习(想通过Python兼职),下面这些你应该能用得上: 【点击这里】领取!

 

包括:Python激活码+安装包、Python web开发,Python爬虫,Python数据分析,人工智能、自动化办公等学习教程。带你从零基础系统性的学好Python!

① Python所有方向的学习路线图,清楚各个方向要学什么东西

② 100多节Python课程视频,涵盖必备基础、爬虫和数据分析

③ 100多个Python实战案例,学习不再是只会理论

④ 华为出品独家Python漫画教程,手机也能学习

⑤ 历年互联网企业Python面试真题,复习时非常方便****

标签:Sheet,商品,Python,Excel,爬虫,学习,网址
From: https://blog.csdn.net/2401_86168842/article/details/141950730

相关文章

  • 基于Python的手势控制贪吃蛇游戏
    文章目录前言一、pygame和mediapipe是什么?二、使用步骤1.引入库2.实现游戏逻辑总结前言  随着计算机视觉技术的不断发展,手势识别成为了一种新兴的人机交互方式。通过Python编程语言结合OpenCV库,我们可以开发出基于手势识别的游戏应用。本文将详细介绍如何使用Py......
  • 计算机毕业设计推荐-基于python医院门诊预约挂号系统
    精彩专栏推荐订阅:在下方主页......
  • python学习总结之内存处理
    1.引用计数法注:类似于java,这个系统自动回收垃圾对象,明显有循环引用的弊端。代码例子importsysimportpsutilimportosimportgcprint(gc.get_threshold())defshowMemSize(tag):pid=os.getpid()p=psutil.Process(pid)info=p.memory_full_info()memory=i......
  • 基于大数据+爬虫+数据可视化的的​媒体社交与可视化平台平台设计和实现(源码+LW+部署
     博主介绍:✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围:SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs......
  • Python数学建模算法与应用例题
    2.21.aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggagg2.cggaggacaaacgggatggcggtattggaggtggcggactgttcgggga3.gggacggatacggattctggccacggacggaaaggaggacacggcggacataca4.atggataacggaaacaaaccagacaaacttcggtagaaatacagaagctta5.cggctggcggacaacggactggcggatt......
  • Python中差分进化differential_evolution的调用及参数说明
    在场景应用中,要求我们的函数计算结果尽可能的逼近实际测量结果,可转化计算结果与测量结果的残差,通过最小化残差,便可求出最优的结果。但使用最小二乘等方法来计算时,常常会使迭代的结果显然局部最优点而导致结算错误。差分进化原理差分进化(DifferentialEvolution,DE)是一种基......
  • 分享10个免费的Python代码仓库,轻松实现办公自动化!
    为了帮助大家更好地利用Python实现自动化办公,我们精心挑选了10个免费的Python代码仓库。这些仓库不仅包含了实用的脚本和示例,还涵盖了从基础到进阶的各种自动化任务解决方案。无论你是Python编程的初学者,还是希望提升工作效率的职场人士,都能在这些仓库中找到适合自己的资......
  • Python毕业设计基于Django的动漫漫画手办周边商城
    文末获取资源,收藏关注不迷路文章目录一、项目介绍二、主要使用技术三、研究内容四、核心代码五、文章目录一、项目介绍动漫周边商城分为二个模块,分别是管理员功能模块和用户功能模块。管理员功能模块包括:文章资讯、文章类型、动漫活动、动漫商品功能,用户功能模块......
  • 【Python 千题 —— 基础篇】敏感词处理
    Python千题持续更新中……脑图地址......
  • Python爬取下载m3u8加密视频,原来这么简单!
    本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。爬取视频的时候发现,现在的视频都是经过加密(m3u8),不再是mp4或者avi链接直接在网页显示,都是经过加密形成ts文件分段进行播放。今天就教大家如何通过python爬取下载m3u8加密......