原文链接:https://tecdat.cn/?p=37273
原文出处:拓端数据部落公众号
分析师:Jiayi Deng
本文展示如何用灰色关联度分析的直播带货效用及作用机制研究,并结合一个分析神经退行性疾病数据实例的代码数据,为读者提供一套完整的实践数据分析流程。
一、研究难点
直播带货作为新兴产业,缺少成熟系统的量化研究,因此从 0 到 1 地对直播带货成交额的影响因素及其影响效应的探索存在许多难点:
-
数据收集与体系构建
需要收集大量数据,建立综合评价指标体系。 -
影响因子处理
需要对直播带货的众多影响因子进行降维、排除无效信息,保证准确度是难点。 -
行业异质性解释
回归的结果呈现出行业异质性,需要结合经济现实加以解释。
二、数据相关
1. 数据来源问题
通过淘宝销售数据对接的数据网站,手工整理 2021 年 1 月 - 2 月的淘宝直播数据进行实证研究,并对商品进行按美妆、美搭、食品、电子产品四个不同行业进行分类。
2. 通过综合评价对数据进行降维
首先将影响直播带货成交额的因素分为:直播、品牌、商品三类,利用 Topsis 熵权法,计算各二级指标所占权重,如下表所示:
利用该权重得到三个影响因素,其中直播关联度代表直播对商品成交额的影响,价格代表商品的影响,品牌影响力代表品牌的影响。
3、探究上述因子是否与直播带货成交额有相关性:
首先,利用灰色关联度探究直播方面各因子与各类商品直播带货成交额的相关性,如下表所示:
其次,利用Matlab拟合各类商品直播带货成交额与品牌影响力的相关性:
可以发现不同类型的商品的品牌影响力与其成交额有不用程度的正相关关系。
最后,通过经典经济学原理,直接论述价格对于商品成交额的影响。
4、实证分析:
利用Stata进行多元回归,得到结果如下:
项目结果
研究发现,在实用性较强的行业之中,销量与关联主播数和关联直播数关联程度较高;在快销型行业,销量与观看人数以及粉丝数相关联程度很高;在存在直播带货的条件下,品牌自身的影响力小于直播的影响力。
5.分析神经退行性疾病数据
本研究旨在通过量化步态动力学参数,增进对帕金森病、亨廷顿病及肌萎缩侧索硬化症等神经退行性疾病病理生理学的理解,并提升评估治疗干预效果的能力。我们构建了一个包含64条记录的数据库,其中包括15名帕金森病患者、20名亨廷顿病患者、13名肌萎缩侧索硬化症患者及16名健康对照受试者的步态数据。
数据收集与预处理:
数据通过力敏电阻器采集,该设备能够输出与受试者脚下力成正比的信号。从原始信号中,我们提取了脚步接触时间、步幅间隔、摆动间隔及站立间隔等关键步态参数,并计算了左右脚各自的比例值。每条记录均标记有受试者组别(hunt、park、als或control)及唯一ID号,并配套有四种类型的文件(.hea、.lef、.rig、.ts),分别用于存储页眉信息、左右脚信号及派生时间序列。
-
成对关系可视化:利用Seaborn库的pairplot函数,我们绘制了数据集中变量之间的成对关系图,并通过不同颜色区分神经退行性疾病类型,直观展示了各变量间的相互作用模式。
- sns.pairplot(small_df, hue="Neurodegenerative Disease", palette="husl")
-
相关系数矩阵热图:通过计算并可视化数据集的相关系数矩阵,我们进一步量化了各步态参数之间的相关性,为理解疾病对步态动力学的具体影响提供了量化依据。
sns.heatmap(small_df.corr(), annot=True, vmin=-1, vmax=1)
灰色关联分析
鉴于传统统计方法可能存在的局限性,我们还引入了灰色关联分析(GRA)方法,通过计算灰色关联系数(GRC)和灰色关联度(GRG),评估了不同因素之间的关联程度。我们成功绘制了平均灰色关联系数的图表,并尝试通过调整标签参数进一步细化分析。
- cors = model.get_calculate_relational_coefficient()
- mean_cors = cors.mean(axis=0)
- columns = small_df.columns
- plot_average_grey_relational_coefficient(mean_cors, columns)
热图展示:为了进一步直观展示各步态参数之间的相关性,利用seaborn
库的heatmap
函数绘制了相关系数矩阵的热图。
plot_average_grey_relational_coefficient(mean_cors, columns, label=columns[1])
plot_average_grey_relational_coefficient(mean_cors, columns, label=columns[2])
plot_average_grey_relational_coefficient(mean_cors, columns, label=columns[3])
sns.heatmap(correl, annot=True, xticklabels=small_df.columns, yticklabels=small_df.columns) # cmap="YlGnBu"
结果
-
通过灰色关联分析,我们成功量化了不同步态参数之间的关联程度,并发现某些参数组合在特定疾病状态下表现出更强的关联性。
-
绘制的平均灰色关联系数图表仍能有效展示各步态参数对整体关联性的贡献。
-
热图进一步揭示了步态参数之间复杂的相互关系,为深入理解神经退行性疾病对步态动力学的影响提供了有力支持。
参考文献
[1] Deng, J. L. (1982). Control problems of grey systems. Systems & Control Letters, 1(5), 288-294.
关于分析师
在此,我们对Jiayi Deng表示诚挚的感谢,她为本文所作的贡献是不可或缺的。她在西南财经大学完成了保险学专业。她在Python、Matlab等编程语言方面具有扎实的编程能力,并且对数据采集、多元统计、计量经济学等领域有着深入的研究和实践经验。
标签:退行性,灰色,Python,步态,直播,带货,数据,columns From: https://www.cnblogs.com/tecdat/p/18347992