首页 > 其他分享 >R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

时间:2024-05-24 20:53:04浏览次数:27  
标签:信度 检验 绩效 因子分析 数据 聚类分析

全文链接:http://tecdat.cn/?p=32747

原文出处:拓端数据部落公众号

随着我国经济的快速发展,上市公司的经营绩效成为了一个备受关注的话题。本文旨在探讨上市公司经营绩效的相关因素,并运用数据处理、图示、检验和分析等方法进行深入研究,帮助客户对我国45家上市公司的16项财务指标进行了因子分析与聚类分析。

分析脉络如下:

  • 数据预处理(包括缺失值,异常值,标准化这些)
  • 数据图示
  • 相关性检验正态性检验
  • 做因子分析和聚类分析

查看数据

image.png

读取到r软件中:

image.png

数据预处理(包括缺失值,异常值,标准化

首先,在进行数据分析前,需要对数据进行预处理。数据预处理包括缺失值的处理、异常值的排除、标准化处理等。另外,为了减少数据误差,需要对数据进行标准化处理。

   
data=na.omit(data)

标准化和可视化

其次,在数据处理完成后,需要对数据进行图示。通过绘制散点图等图示,可以直观地了解各项指标的数值分布和趋势变化。同时,图示也有助于发现数据中的异常点和趋势漂移等问题。

image.png

image.png

数据的标准化及适用性检验

然后,进行相关性检验和正态性检验等统计方法。相关性检验可以通过计算相关系数的方法来判断各项指标之间的联系程度。而正态性检验则可以通过绘制概率图、矩阵图等方法,来判断数据是否符合正态分布。通过这些检验方法,可以更准确地分析数据,并确定适当的分析方法。

相关性检验

image.png

image.png

正态性检验

   
shapiro.test(data[,2])

image.png

信度检验结果

信度检验结果是指对某种测量工具(例如问卷、测试等)进行信度检验后得到的结果。信度检验是一种评估测量工具稳定性和一致性的方法,通常使用统计学方法来计算测量工具的内部一致性或者重测信度。通过信度检验,可以确定测量工具的可靠性和准确性,从而确定测量结果的可信度。信度检验结果可以帮助研究者评估测量工具的质量,以确保研究结果的可靠性和有效性。 image.png

image.png

KMO检验:

KMO检验是一种用于评估数据是否适合进行因子分析的统计方法。KMO(Kaiser-Meyer-Olkin)检验的主要目的是测量数据集中各个变量之间的相关性,以确定是否存在足够的共性方差,从而确定是否适合进行因子分析。KMO值介于0和1之间,通常认为KMO值大于0.6表示数据适合进行因子分析。如果KMO值低于0.6,则表明数据不适合进行因子分析,需要重新考虑数据收集和分析方法。

   
kmores=kmo(data\[,2:17])\
kmores\$overall
   
## [1] 0.5985173

因子分析和聚类分析

接下来,进行因子分析和聚类分析。因子分析旨在寻找出反映上市公司经营绩效的主要因素,并通过统计方法进行因素提取和旋转。而聚类分析则是将样本进行分类,以便于对不同类别的上市公司进行比较分析。

因子分析

因子分析是一种统计方法,用于确定多个变量之间的关系。它将一组相关变量分解为更少的未观察到的变量,称为因子,这些因子可以解释原始变量的方差。因子分析可用于数据降维、变量选择和构建模型等应用。它在社会科学、市场研究和心理学等领域得到广泛应用。 image.png

image.png

旋转成份矩阵

image.png

因子得分排名

image.png

K-means聚类分析上市公司经营绩效

K-means聚类分析是一种常用的无监督学习方法,用于将一组数据分成K个不同的类别。该算法通过迭代的方式将数据点分配到不同的类别中,并且通过计算每个类别的中心点来更新类别的位置。K-means聚类分析的目标是最小化每个数据点到其所属类别中心点的距离平方和,从而使得每个类别内部的数据点尽可能的相似,不同类别之间的数据点尽可能的不同。该算法的优点是简单易懂,计算速度快,适用于大规模数据集的聚类分析。

在上市公司经营绩效的分析中,可以将公司的各项经营指标作为输入数据,通过K-means聚类算法将公司分成若干类别,同一类别内的公司具有相似的经营绩效表现。这样可以帮助投资者或经营者更好地了解市场上不同公司的经营状况,从而做出更明智的投资或经营决策。

   
memb <- hmod\$cluster

image.png

群集成员

   
cludata

image.png

image.png

   
plot(data[,2:17],mem

1111.png 综上所述,我国上市公司经营绩效实证研究涉及到数据预处理、图示、检验和分析等多个方面。其中,数据预处理和图示为分析提供了基础和依据,检验和分析则为研究提供了科学性和可靠性保障。通过本文的研究,可以更深入地了解上市公司经营绩效的相关因素,为政府部门和企业提供决策参考。


QQ截图20220302134012.png

最受欢迎的见解

1.matlab偏最小二乘回归(PLSR)和主成分回归(PCR)

2.R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析

3.主成分分析(PCA)基本原理及分析实例

4.R语言实现贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归

5.使用LASSO回归预测股票收益数据分析

6.r语言中对lasso回归,ridge岭回归和elastic-net模型

7.r语言中的偏最小二乘回归pls-da数据分析

8.R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化

9.R语言主成分分析(PCA)葡萄酒可视化:主成分得分散点图和载荷图

标签:信度,检验,绩效,因子分析,数据,聚类分析
From: https://www.cnblogs.com/tecdat/p/18211653

相关文章

  • Kaplan-Meier检验和Log-Rank检验
    1.在做生存分析的时候我们实际上是在做一些什么?(1)描述一个组内个体的生存时间在此目标下有两种方法:寿命表法(Lifetablesmethods)&  非参数Kaplan-Meier曲线但在临床研究中使用寿命表法的文章日益减少,使用Kaplan-Meier越来越多(2)比较两个或多个组的生存时间Log-r......
  • 数据分享|SAS与eviews用ARIMA模型对我国大豆产量时间序列预测、稳定性、白噪声检验可
    全文链接:http://tecdat.cn/?p=31480最近我们被客户要求撰写关于ARIMA的研究报告,包括一些图形和统计输出。我国以前一直以来都是世界上大豆生产的第一大国。但由于各国的日益强大,导致我国豆种植面积和产量持续缩减。因此,预测我国的大豆产量对中国未来的经济发展有着极其重要的作......
  • 1.验整码的发送与检验
    通过restTemplate.exchage()来发送验证码,需要4个参数,url,请求方式,请求内容,需要相应类型)响应的结果为map结合,我们需要取出key值,用俩次map取值可以取出key检验验证需要输入验证码和keyrestTeMPLATE.exhcange(url,....);//发送请求获得验证码请求内容为空判断是否一样mapstrac......
  • Devexpress GridView 单元格输入检验
    实现效果打开设计器找到CellValueChanged事件编写代码privatevoidgvmain_CellValueChanged(objectsender,DevExpress.XtraGrid.Views.Base.CellValueChangedEventArgse){stringseq=gvmain.GetRowCellValue(e.RowHandle,colQaSeq).......
  • 数字化变革探索:检验检测行业转型思路揭秘
    行业背景随着科技的不断进步和实验室管理需求的不断发展,传统实验室管理方式面临着许多问题,如采用纸质记录和手工操作、数据易丢失和难以追溯、效率低下、流程复杂以及质量管理不规范等。这些问题已经成为制约实验室发展和提升运行效能的瓶颈。与此同时,检验检测行业也面临以下挑战......
  • 复杂网络社区发现算法聚类分析全国电梯故障数据和可视化:诊断电梯“安全之殇”|附代码
    参考原文:http://tecdat.cn/?p=2186最近我们被客户要求撰写关于复杂网络社区发现算法的研究报告,包括一些图形和统计输出。物业工程肩负着维持项目各类设施设备的正常运作,保障全体业主的正常生活,令物业保值升值,是项目的心脏部门。拓端数据(tecdat)研究人员根据全国电梯故障上报汇总......
  • R语言Stan贝叶斯回归置信区间后验分布可视化模型检验|附数据代码
    全文链接:https://tecdat.cn/?p=35899原文出处:拓端数据部落公众号贝叶斯回归是一种统计方法,它使用贝叶斯定理来估计回归模型的参数。与传统的频率派回归方法不同,贝叶斯回归提供了参数的后验分布,而不仅仅是点估计。这意味着我们可以得到参数的不确定性度量,而不仅仅是单一的估计值......
  • 2.4 比较检验 机器学习
    目录常见比较检验方法总述2.4.1假设检验2.4.2交叉验证T检验2.4.3McNemar检验接我们的上一篇《性能度量》,那么我们在某种度量下取得评估结果后,是否可以直接比较以评判优劣呢?实际上是不可以的。因为我们第一,测试性能不等于泛化性能,第二,测试性能会随着测试集的变化而......
  • t检验原理
    t检验是一种常用的统计方法,用于比较两个样本均值是否有显著差异。它的基本原理是通过计算样本均值之间的差异,以及这种差异相对于样本误差的大小来判断差异是否显著。t检验的基本步骤如下:1.假设两个样本是独立、随机抽取的,并且符合正态分布。2.计算两个样本的均值和标准差......
  • SPSS大学生网络购物行为研究:因子分析、主成分、聚类、交叉表和卡方检验
    全文链接:https://tecdat.cn/?p=35377原文出处:拓端数据部落公众号随着互联网的普及和电子商务的快速发展,网络购物已成为大学生日常生活中不可或缺的一部分。大学生作为网络购物的主体力量,其消费观念、行为特征以及影响因素对于电子商务行业的发展具有重要的研究价值。因此,本文旨......