首页 > 其他分享 >电子商务平台市场动向的数据分析平台:阿里商品指数,包括淘宝采购指数,淘宝供应指数,1688供应指数。

电子商务平台市场动向的数据分析平台:阿里商品指数,包括淘宝采购指数,淘宝供应指数,1688供应指数。

时间:2023-07-28 11:46:02浏览次数:35  
标签:purchase word index 供应 指数 阿里 淘宝 1688

电子商务平台市场动向的数据分析平台:阿里商品指数,包括淘宝采购指数,淘宝供应指数,1688供应指数。

1.项目介绍

1、阿里指数 是了解电子商务平台市场动向的数据分析平台,2012年11月26日,阿里指数正式上线。根据阿里巴巴网站每日运营的基本数据包括每天网站浏览量、每天浏览的人次、每天新增供求产品数、新增公司数和产品数这5项指标统计计算得出。
2、阿里指数对于收录的商品关键词,在指数方面提供阿里商品指数抓取,包括淘宝采购指数,淘宝供应指数,1688供应指数三个指数,基于三个指数,可以在一定程度上反映出该商品的供需行情,与商品的价格相比,能够得出一些相关性的结论。

2.项目举例

以‘连衣裙’这一商品关键词为例,要求获取连衣裙的三个指数数据。由于阿里指数至提供近一年的指数数据,因此,只能采集一年的数据,原始结果如下:

3.实现流程

 def index_main(self, word):
        print('step1, open page....')
        #使用selenium,打开页面,获取指数数据所在页面
        page_source = self.search_index(word)
        print('step2, get data....')
        #解析原网页,获取purchase_index_1688, supply_index, purchase_index_tb
        purchase_index_1688, supply_index, purchase_index_tb = self.data_parser(page_source)
        #以本地文件的方式保存结果,分别写入到purchase_index_1688, supply_index, purchase_index_tb三个文件中
        self.output_data(word, purchase_index_1688, supply_index, purchase_index_tb)
        print('step3, %s finished....'% word)

4.执行

 def demo():
         ali = AliIndex()
         search_word = '连衣裙'
         ali.index_main(search_word)
     demo()
     

5.效果展示

将得到的数据文件,进行本地可视化,效果如下:

7.总结

1、阿里指数的采集较为简单,1)阿里指数直接将历时数据写在前端页面中,可以直接解析获得。2)无需用户登录。
2、阿里指数与百度指数不同,其对应的关键词实体需要对应到具体的行业或商品上,而用户查询的关键词具有多样性,这样会导致可能无法正确获取严格的关键词商品指数,如搜索iphone,会得到电子产品的指数。
3、比较遗憾的是,阿里指数只提供以查询当日为结束如日,往前推一年为开始日期的数据,对于历时数据的构建来说,不是太方便。

项目码源见文末

项目链接跳转

更多优质内容请关注公号:汀丶人工智能;会提供一些相关的资源和优质文章,免费获取阅读。

标签:purchase,word,index,供应,指数,阿里,淘宝,1688
From: https://www.cnblogs.com/ting1/p/17587178.html

相关文章

  • 基于新浪微博海量用户行为数据、博文数据数据分析:包括综合指数、移动指数、PC指数三个
    基于新浪微博海量用户行为数据、博文数据数据分析:包括综合指数、移动指数、PC指数三个指数项目介绍微指数是基于海量用户行为数据、博文数据,采用科学计算方法统计得出的反映不同事件领域发展状况的指数产品。微指数对于收录的关键词,在指数方面提供微博数据层面的指数数据,包......
  • python批量计算多站点多年标准化降水指数SPI
    前面提过如何计算单站点多年的标准化降水指数SPI,但是在现实中不仅只计算一个站点的标准化降水指数,有时要计算多个站点的。原始数据是11个站点1961年至2022年每个月的降水值: 编程思路是:1、先需要进行站点分类:   此处的难点在于需要写个for循环,根据站点名称遍历数据 ......
  • H指数介绍与查询
    学术影响力的评价是国内外科研管理与评价领域中的一项重要工作。H指数(H-index)可以作为研究机构科研影响力的评价指标。H指数又称H因子,是一个用于评估科研学者学术水平与学术影响力的混合量化指标,由美国加利福尼亚大学圣地亚哥分校物理学家乔治·希尔施(J.E.Hirsch)于2005年提出。......
  • 重磅来袭 | 2023数字供应链安全大会邀请函(DSS 2023)
    2023数字供应链安全大会(DSS2023)将于8月10日在北京·国家会议中心隆重开幕。本次大会由悬镜安全主办,ISC互联网安全大会组委会、中国软件评测中心(工业和信息化部软件与集成电路促进中心)、中国信息通信研究院云计算与大数据研究所、CCF计算机安全专业委员会联合发起,OpenSCA开源社区、......
  • 什么是美股道琼斯指数?美股道琼斯指数简介
    美股道琼斯指数最早是在1884年由道琼斯公司的创始人查尔斯·亨利·道(CharlesHenryDow1851-1902年)开始编制的,是一种算术平均股价指数。美股道琼斯指数是世界上历史最为悠久的股票指数,它的全称为美股股票价格平均指数。除此之外,美股道琼斯指数还有哪些内容需要进一步了解的?一、美......
  • 什么是供应链金融?定义集
    定义一利用融资和风险缓释的措施和技术,对投放到供应链进程和交易中的营运资本和流动资金进行优化管理。供应链金融通常用于供应链活动触发的赊销交易。贸易流对融资提供者的可见性,是达成该项融资安排的必要因素,这可以通过一个技术平台来实现[1]。定义二供应链金融是指人们......
  • 饮冰三年-人工智能-Django淘宝拾遗-85-常用的Python格式化工具
       Python代码格式化对于团队协作、代码质量、错误预防以及与Python社区的契合都具有重要意义。好的代码格式化不仅是一种编码规范,更是一种良好的编码习惯,有助于提高整个项目的质量和可维护性。   在团队中,可能有不同的编码规范和自定义的格式化规则。尽管有一些格式......
  • 如何解决电网峰谷差大、局部电力供应紧张等问题
    安科瑞虞佳豪壹捌柒陆壹伍玖玖零玖叁今年以来,多份政策文件相继出台,支持虚拟电厂、新型储能项目建设。7月11日,中央深改委会议审议通过《关于深化电力体制改革加快构建新型电力系统的指导意见》,强调要深化电力体制改革,加快构建清洁低碳、安全充裕、经济高效、供需协同、灵活智能的新......
  • 矩阵乘法指数的基域不变性
    昨天意识模糊的时候突然想到了这个东西如何证明,重新发明了一遍.对于域\(F\),我们记\(\omega(F)\)为在域\(F\)上的矩阵乘法的张量秩给出的\[\omega(F)=\inf_{n}\frac{\logR(\langlen,n,n\rangle)}{\logn},\]我们知道,对于无限域\(F\)来说,这本质刻画了矩阵乘......
  • python, 画图,指数坐标轴
    Python中的指数坐标轴绘图介绍绘图是数据分析和可视化的重要工具之一,而Python提供了多种绘图库供我们使用。在这篇文章中,我们将重点介绍如何在Python中使用Matplotlib库来绘制指数坐标轴的图形。指数坐标轴可以有效地展示非线性数据,特别是当数据点之间的差异很大时。Matplotlib......