首页 > 其他分享 >如果通过POWER BI爬取网页信息

如果通过POWER BI爬取网页信息

时间:2023-08-03 15:55:56浏览次数:29  
标签:网页 抓取 POWER BI 信息 Desktop 爬取

问题描述:

同事想收集电商网站上面的竞品信息,再通过使用POWER BI作为分析工具,进行相关的分析。 今天过来找我询问,是否有合适的工具可以方便抓取到页面上面的竞品信息?  

解决方案:

通过POWER BI Desktop自带功能实现抓取网页上面的信息。 优势就是出成果快。
  再给同事讲解如何操作后,总结一下也同样分享给大家参考。 举个例子,由于本人爱喝咖啡,所以我们以咖啡产品为例,如何通过POWER BI Desktop抓取网页数据作为数据源。

1,打开一个电商站点,比如打开京东,我们搜索“咖啡”, 然后拷贝web 链接地址;

 

2,打开POWER BI Desktop软件,点击功能区【Home】->【Get data】-> 【Web】;

3, 把拷贝京东web 链接地址到 URL输入框中,然后 【OK】 确认;

4,POWER BI会自动在左侧生成建议内容,你可以分别打开每一个Table表,预览其中的内容,选择适合你的Table表。 由于生成的列很多,所以点击【Transform Data】,需要对生成的信息进行数据清洗;

5,根据生成的内容,对表头进行重命名,删除不必要的列表,补充一些信息等等;

6,清洗完毕后,点击【Close & Apply】;

最后我们就可以拿到一张数据质量不错的,各个品牌咖啡价格,名称,经销商名称,评价数量等信息。作为数据源,在Power BI Desktop设计页面就可以进行相关报告开发工作了。   ​ 最后总结,通过了解和学习本文介绍,大家了解Power BI包含网页抓取信息的功能。很多时候非常适合做一些小的demo测试,验证业务逻辑。 建议大家亲自做一些练习,便于增加自己的体会和吸收。   希望本文可以帮助到大家。   * 米高的BI星球 原创文章,转载请注明出处!

标签:网页,抓取,POWER,BI,信息,Desktop,爬取
From: https://www.cnblogs.com/theseven/p/17603551.html

相关文章

  • 瓴羊QuickBI在国内bi厂商中名列前茅,并展现出色的表现。
    在大数据时代,为了更好地掌控数据并为企业业务决策提供科学依据,选择哪种商业智能(BI)工具才是关键。商业智能(BI)市场竞争异常激烈,因此我们需要如何分析众多知名品牌(例如瓴羊QuickBI、Tableau等)的优缺点,以指导企业自己做出选择。为此本期我们将对国内BI厂商进行排名,以帮助大家更深入了解......
  • 小柏实战学习FineBI(图文教程一)
    前言:一定要知道百度,必应,谷歌这个三个网站,这三个不知道的话也要会使用ChatGPT,并且要学会看报错信息,学会优雅的提问.  本节课主题:FineBI的下载,安装,配置. 零:官网填写信息,获取试用码:https://www.finebi.com/  一:下载:https://www.finebi.com/product/downlo......
  • 瓴羊QuickBI为企业提供定制化的可视化设计,满足个性化需求。
    在目前的阶段,大数据技术已经成为企业缩小与竞争对手之间差距的重要手段。许多企业选择使用瓴羊QuickBI等工具来处理和分析内部数据,以保持持续的竞争优势。在过去,国内企业更倾向于使用进口的BI工具,但随着国内数据处理工具(如瓴羊QuickBI)的兴起,特别是可视化大屏设计的全面提升,更符合国......
  • 可视化分析30天免费,瓴羊Quick BI助力企业转型
    在现代化的社会经济背景下,数字化转型正在以前所未有的速度加速,这在很大程度上推动了国内企业积极求取数字化升级的态势。在这个过程中,企业的创新和发展模式也正在不断地改变,尤其是针对数据驱动的智能决策系统,其重要性日益突出。商业BI工具市场以其活跃的态势蓬勃发展。它作为一种创......
  • 瓴羊QuickBI,助您加速企业转型,免费试用
    领羊QuickBI是阿里云专为企业设计的商业智能工具,能够迅速全面处理和分析日常运营数据,并实时满足企业用户的需求,助力企业用户做出决策,抓住发展机会。在信息技术不断发展的背景下,数据已经成为改变企业发展生态的关键因素。越来越多的企业开始尝试使用领羊QuickBI等工具,推动企业发展。......
  • FineBI连接hive出现中文乱码问题(已解决)
    出现下列情况解决方法:hive的注释(comment)中文乱码的解决方法解决后......
  • 图新说新版发布,支持航测数据、CAD、BIM高清出图及漫游视频录制
    图新说新版(V23.2.11.731)发布,更新如下:1、【新增】· 新增【高清出图】   · 新增【高清漫游视频录制】· 新增视点漫游· 新增图层添加2、【优化】· 优化在线案例加载速度3、【修复】· 修复已知bug,增强软件稳定性图新说新版下载:https://fs80.cn/fmw45t图新说,三......
  • Kafka - Kafka v.s. NATS v.s. RabbitMQ
     Kafkav.s.RabbitMQ 优先选择Kafka的条件·严格的消息顺序·延长消息留存时间,包括过去消息重放的可能·传统解决方案无法满足的高伸缩能力 优先选择RabbitMQ的条件·高级灵活的路由规则·消息时序控制(控制消息过期或消息延迟)·高级的容错处理能力,在消费者更......
  • SQLFlow——除了 Google 的 BigQueryML,微软基于 SQL Server 的 AI 扩展,以及 Teradata
    蚂蚁金服开源机器学习工具SQLFlow,技术架构独家解读2019-05-15· SQLFlow · #SQLFlow5月6日,在 QCon全球软件开发大会(北京站)2019 上,蚂蚁金服副CTO胡喜正式宣布开源机器学习工具SQLFlow,他在演讲中表示:“未来三年,AI能力会成为每一位技术人员的基本能力。我们希望通过开......
  • rabbitmq安装
     按照官网步骤安装1.执行成功sudoapt-getinstallcurlgnupgapt-transport-https-y2.下面三个都执行失败##TeamRabbitMQ'smainsigningkeycurl-1sLf"https://keys.openpgp.org/vks/v1/by-fingerprint/0A9AF2115F4687BD29803A206B73A36E6026DFCA"|sudogpg-......