首页 > 其他分享 >R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

时间:2023-10-23 23:22:06浏览次数:47  
标签:信度 检验 绩效 因子分析 数据 聚类分析

全文链接:http://tecdat.cn/?p=32747

原文出处:拓端数据部落公众号

随着我国经济的快速发展,上市公司的经营绩效成为了一个备受关注的话题。本文旨在探讨上市公司经营绩效的相关因素,并运用数据处理、图示、检验和分析等方法进行深入研究,帮助客户对我国45家上市公司的16项财务指标进行了因子分析与聚类分析。

分析脉络如下:

  • 数据预处理(包括缺失值,异常值,标准化这些)
  • 数据图示
  • 相关性检验正态性检验
  • 做因子分析和聚类分析

查看数据

image.png

读取到r软件中:

image.png

数据预处理(包括缺失值,异常值,标准化

首先,在进行数据分析前,需要对数据进行预处理。数据预处理包括缺失值的处理、异常值的排除、标准化处理等。另外,为了减少数据误差,需要对数据进行标准化处理。

   
data=na.omit(data)

标准化和可视化

其次,在数据处理完成后,需要对数据进行图示。通过绘制散点图等图示,可以直观地了解各项指标的数值分布和趋势变化。同时,图示也有助于发现数据中的异常点和趋势漂移等问题。

image.png

image.png

数据的标准化及适用性检验

然后,进行相关性检验和正态性检验等统计方法。相关性检验可以通过计算相关系数的方法来判断各项指标之间的联系程度。而正态性检验则可以通过绘制概率图、矩阵图等方法,来判断数据是否符合正态分布。通过这些检验方法,可以更准确地分析数据,并确定适当的分析方法。

相关性检验

image.png

image.png

正态性检验

   
shapiro.test(data[,2])

image.png

信度检验结果

信度检验结果是指对某种测量工具(例如问卷、测试等)进行信度检验后得到的结果。信度检验是一种评估测量工具稳定性和一致性的方法,通常使用统计学方法来计算测量工具的内部一致性或者重测信度。通过信度检验,可以确定测量工具的可靠性和准确性,从而确定测量结果的可信度。信度检验结果可以帮助研究者评估测量工具的质量,以确保研究结果的可靠性和有效性。 image.png

image.png

KMO检验:

KMO检验是一种用于评估数据是否适合进行因子分析的统计方法。KMO(Kaiser-Meyer-Olkin)检验的主要目的是测量数据集中各个变量之间的相关性,以确定是否存在足够的共性方差,从而确定是否适合进行因子分析。KMO值介于0和1之间,通常认为KMO值大于0.6表示数据适合进行因子分析。如果KMO值低于0.6,则表明数据不适合进行因子分析,需要重新考虑数据收集和分析方法。

   
kmores=kmo(data\[,2:17])\
kmores\$overall
   
## [1] 0.5985173

因子分析和聚类分析

接下来,进行因子分析和聚类分析。因子分析旨在寻找出反映上市公司经营绩效的主要因素,并通过统计方法进行因素提取和旋转。而聚类分析则是将样本进行分类,以便于对不同类别的上市公司进行比较分析。

因子分析

因子分析是一种统计方法,用于确定多个变量之间的关系。它将一组相关变量分解为更少的未观察到的变量,称为因子,这些因子可以解释原始变量的方差。因子分析可用于数据降维、变量选择和构建模型等应用。它在社会科学、市场研究和心理学等领域得到广泛应用。 image.png

image.png

旋转成份矩阵

image.png

因子得分排名

image.png

K-means聚类分析上市公司经营绩效

K-means聚类分析是一种常用的无监督学习方法,用于将一组数据分成K个不同的类别。该算法通过迭代的方式将数据点分配到不同的类别中,并且通过计算每个类别的中心点来更新类别的位置。K-means聚类分析的目标是最小化每个数据点到其所属类别中心点的距离平方和,从而使得每个类别内部的数据点尽可能的相似,不同类别之间的数据点尽可能的不同。该算法的优点是简单易懂,计算速度快,适用于大规模数据集的聚类分析。

在上市公司经营绩效的分析中,可以将公司的各项经营指标作为输入数据,通过K-means聚类算法将公司分成若干类别,同一类别内的公司具有相似的经营绩效表现。这样可以帮助投资者或经营者更好地了解市场上不同公司的经营状况,从而做出更明智的投资或经营决策。

   
memb <- hmod\$cluster

image.png

群集成员

   
cludata

image.png

image.png

   
plot(data[,2:17],mem

1111.png 综上所述,我国上市公司经营绩效实证研究涉及到数据预处理、图示、检验和分析等多个方面。其中,数据预处理和图示为分析提供了基础和依据,检验和分析则为研究提供了科学性和可靠性保障。通过本文的研究,可以更深入地了解上市公司经营绩效的相关因素,为政府部门和企业提供决策参考。


QQ截图20220302134012.png

最受欢迎的见解

1.matlab偏最小二乘回归(PLSR)和主成分回归(PCR)

2.R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析

3.主成分分析(PCA)基本原理及分析实例

4.R语言实现贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归

5.使用LASSO回归预测股票收益数据分析

6.r语言中对lasso回归,ridge岭回归和elastic-net模型

7.r语言中的偏最小二乘回归pls-da数据分析

8.R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化

9.R语言主成分分析(PCA)葡萄酒可视化:主成分得分散点图和载荷图

标签:信度,检验,绩效,因子分析,数据,聚类分析
From: https://www.cnblogs.com/tecdat/p/17783736.html

相关文章

  • golang validator 检验工具的使用指北
    golangvalidator包的使用指北原创阿兵云原生阿兵云原生2023-09-1009:27发表于广东看到validator咱们第一反应会想起啥?见名知意我就可以知道他是一个验证器,如果用过ginweb框架的同学,自然是用过gin里面的validator,只不过gin中使用的关键字是binding去做标识 ......
  • 据类方法之:KMeans聚类分析
    书接上回,在上一篇博客中完成了数据的降维分析,这里在降维后的基础上继续进行聚类分析,使用前2个PC进行KMeans据类并可视化。fromsklearn.clusterimportKMeansfromcollectionsimportCounter#语言定义颜色和画布colors=['b','g','r','y','k','c','m�......
  • Python自激励阈值自回归(SETAR)、ARMA、BDS检验、预测分析太阳黑子时间序列数据
    全文链接:https://tecdat.cn/?p=33896原文出处:拓端数据部落公众号这篇文章展示了自激励阈值自回归SETAR的使用,用于分析经常被客户研究的太阳黑子数据集。具体而言,研究SETAR模型的估计和预测。我们在这里考虑原始的太阳黑子序列以匹配ARMA示例,尽管文献中许多来源在建模之前对序......
  • 戴森美发科技,呵护头皮水分0流失 戴森Supersonic™吹风机的头皮功效试验结果经中轻日用
    作为头发护理行业的领军品牌,戴森多年来一直持续研究头发科学,不断探知消费者对头发损伤的困扰与认知,致力于以创新科技为消费者提供健康科学的护发造型体验。自2016年戴森Supersonic™吹风机面世以来,戴森即以创新科技颠覆了传统的护发造型方式,也使健康护发的造型理念逐渐深入人心。日......
  • Python贝叶斯高斯混合模型GMM聚类分析数据和混合密度可视化
    全文链接:https://tecdat.cn/?p=33821原文出处:拓端数据部落公众号混合模型是另一种生成模型,它将数据点的分布建模为多个单独分布的组合("混合")。客户常见的混合模型类型是高斯混合模型,其中数据生成分布被建模为多个高斯分布的组合。  importnumpyasnpimportmatplo......
  • C# Model 自定义检验
    使Model实现IValidatableObject接口并重写Validate方法即可publicclassAuditIPKeepRecordApply_In:IValidatableObject{///<summary>///IP备案申请表主键id///</summary>[Required(ErrorMessage="IP备案申请表主键id不可为空"......
  • 两种方法获取电话区号,检验我们对Excel基础知识储备的反应能力!
    1职场实例小伙伴们大家好,今天我们专门拿出一个篇幅讲解一下如何在Excel中提取座机电话的区号。如下图所示:是一张各个单位的联系信息,其中的B列为座机电话号码,座机电话号码有一个特点:就是有一个间隔符“-”将一串数字分成了左右两段,左段数字为区号,右段数字为号码。现在我们需要在C列......
  • LIS实验室(检验科)信息系统源码 C# +.Net+Oracle
    LIS实验室(检验科)信息系统,一体化设计,与其他系统无缝连接,全程化条码管理。集申请、采样、核收、计费、检验、审核、发布、质控、查询、耗材控制等检验科工作为一体的网络管理系统。技术细节:体系结构:Client/Server架构客户端:WPF+WindowsForms服务端:C#+.Net数据库:Oracle接口技术:RESTf......
  • R语言文本挖掘:kmeans聚类分析上海玛雅水公园景区五一假期评论词云可视化|附代码数据
    全文链接:http://tecdat.cn/?p=32307原文出处:拓端数据部落公众号互联网时代,大量的新闻信息、网络交互、舆情信息以文本形式存储在数据库中,如何利用数据分析和文本挖掘的算法,将海量文本的价值挖掘出来,成为我们团队近期的一个研究方向,本案例就是我们的一个尝试。文本聚类其实也就......
  • 2023-09-25 配对卡方设计的非劣效检验的SAS实现
    近期的工作过程中,需要对配对设计的数据进行非劣效检验,因为SAS中目前没有现成的模块可以使用,因此负责的同事查询了很多文献资料来进行参考,最后选定的是Tango法来计算置信区间,以实现非劣效检验。对同事提供的培训分享中的参考文献进行了比较粗浅的学习,在此记录分享一下。1示例导入......