Stata是一款集数据分析、数据管理以及绘制专业图表的整合性统计软件,它提供许许多多功能,包括线性混合模型、均衡重复反复及多项式普罗比模式,用Stata绘制的统计图形相当精美。【功能特点】统计功能:Stata的统计功能很强,除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多类结果与有序结果的logistic回归,Poisson回归,负二项回归及广义负二项回归,随机效应模型等。具体说,Stata具有如下统计分析能力:数值变量资料的一般分析:参数估计,t检验,单因素和多因素的方差分析,协方差分析,交互效应模型,平衡和非平衡设计,嵌套设计,随机效应,多个均数的两两比较,缺项数据的处理,方差齐性检验,正态性检验,变量变换等。分类资料的一般分析:参数估计,列联表分析(列联系数,确切概率),流行病学表格分析等。等级资料的一般分析:秩变换,秩和检验,秩相关等相关与回归分析:简单相关,偏相关,典型相关,以及多达数十种的回归分析方法,如多元线性回归,逐步回归,加权回归,稳键回归,二阶段回归,百分位数(中位数)回归,残差分析、强影响点分析,曲线拟合,随机效应的线性回归模型等。其他方法:质量控制,整群抽样的设计效率,诊断试验评价,kappa等。
[下载地址]:后台私信我
【软件功能】
一、统计功能
1、统计功能很强,除了传统的统计分析方法外,还收集了近 20 年发展起来的新方法,如 Cox 比例风险回归,指数与 Weibull 回归,多类结果与有序结果的 logistic 回归, Poisson 回归,负二项回归及广义负二项回归,随机效应模型等。具体说, 具有如下统计分析能力:
2、数值变量资料的一般分析:参数估计,t检验,单因素和多因素的方差分析,协方差分析,交互效应模型,平衡和非平衡设计,嵌套设计,随机效应,多个均数的两两比较,缺项数据的处理,方差齐性检验,正态性检验,变量变换等。
3、分类资料的一般分析:参数估计,列联表分析 ( 列联系数,确切概率 ) ,流行病学表格分析等。
4、等级资料的一般分析:秩变换,秩和检验,秩相关等
5、相关与回归分析:简单相关,偏相关,典型相关,以及多达数十种的回归分析方法,如多元线性回归,逐步回归,加权回归,稳键回归,二阶段回归,百分位数 ( 中位数 ) 回归,残差分析、强影响点分析,曲线拟合,随机效应的线性回归模型等。
6、其他方法:质量控制,整群抽样的设计效率,诊断试验评价, kappa 等。
二、作图功能
1、作图模块,主要提供如下八种基本图形的制作 : 直方图 (histogram) ,条形图 (bar), 百分条图 (oneway) ,百分圆图 (pie) ,散点图 (twoway) ,散点图矩阵(matrix) ,星形图 (star) ,分位数图。这些图形的巧妙应用,可以满足绝大多数用户的统计作图要求。在有些非绘图命令中,也提供了专门绘制某种图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提供了残差图等。
2、矩阵运算功能
矩阵代数是多元统计分析的重要工具, 提供了多元统计分析中所需的矩阵基本运算,如矩阵的加、积、逆、 Cholesky 分解、 Kronecker 内积等;还提供了一些高级运算,如特征根、特征向量、奇异值分解等;在执行完某些统计分析命令后,还提供了一些系统矩阵,如估计系数向量、估计系数的协方差矩阵等。
三、程序设计功能
1、一个统计分析软件,但它也具有很强的程序语言功能,这给用户提供了一个广阔的开发应用的天地,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。事实上, 软件的 ado 文件 ( 高级统计部分 ) 都是用软件中自己的语言编写的
2、统计分析能力远远超过了 SPSS ,在许多方面也超过了 SAS !由于在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此计算速度极快(一般来说, SAS 的运算速度要比 SPSS 至少快一个数量级,而软件的某些模块和执行同样功能的 SAS 模块比,其速度又比 SAS 快将近一个数量级!) 程序也是采用命令行方式来操作,但使用上远比 SAS 简单。其生存数据分析、纵向数据(重复测量数据)分析等模块的功能甚至超过了 SAS 。用程序绘制的统计图形相当精美,很有特色。
四、功能列表
1、数据管理 (Data management)
资料转换、分组处理、附加档案、 ODBC 、行 - 列转换、数据标记、字符串函数…等
2、基本统计 (Basic statistics)
直交表、相关性、 t- 检定、变异数相等性检定、比例检定、信赖区间…等3、线性模式 (Linear models)稳健 Huber/White/sandwich 变异估计,三阶最小平方法、类非相关回归、齐次多项式回归、 GLS4、广义型线性模式 (Generalized linear models)
十连结函数、使用者 - 定义连结、 ML 及 IRLS 估计、九变异数估计、七残差…等
5、二元、计数及有限应变量
(Binary,count,and limited dependent variables)
罗吉斯特、 probit 、卜松回归、 tobit 、 truncated 回归、条件罗吉斯特、多项式逻辑、巢状逻辑、负二项、 zero-inflated 模型、 Heckman 选择模式、边际影响
6、Panel 数据 / 交叉 - 组合时间序列
(Panel data/cross-sectional time-series)
随机及固定影响之回归、 GEE 、随机及固定 - 影响之卜松及负二项分配、随机 - 影响、工具变量回归、AR(1) 干扰回归
7、无母数方法 (Nonparametric methods)
8、多变量方法 (Multivariate methods)
9、因素分析、多变量回归、 anonical 相关系数
模型检定及事后估计量支持分析
(Model testing and post-estimation support)
10、Wald 检定、 LR 检定、 线性及非线性组合、非线性限制检定、边际影响、修正平均数 Hausman 检定11、群集分析 (Cluster analysis)
加权平均,质量中心及中位数联结、 kmeans 、 kmedians 、 dendrograms 、停止规则、使用者扩充12、图形 (Graphics)
直线图、散布图、条状图、圆饼图、 hi-lo 图、回归诊断图…
13、调查方法 (Survey methods)
抽样权重、丛集抽样、分层、线性变异数估计量、拟 - 概似最大估计量、回归、工具变量…
14、生存分析 (Survival analysis)
Kaplan – Meier 、 Nelson – Aalen, 、 Cox 回归 ( 弱性 ) 、参数模式 ( 弱性 ) 、危险比例测试、时间共变项、左 - 右检查、韦柏分配、指数分配…
15、流行病学工具 (Tools for epidemiologists)比例标准化、病例控制、已配适病例控制、 Mantel – Haenszel,药理学、 ROC 分析、 ICD-9-CM
16、时间序列 (Time series)
ARIMA 、 ARCH/GARCH 、 VAR 、 Newey – West 、 correlograms 、 periodograms 、白色 - 噪音测试 ,17、最小整数根检定、时间序列运算、平滑化
最大概似法 (Maximum likelihood)
18、转换及常态检定 (Transforms and normality tests)
Box – Cox 、次方转换 Shapiro – Wilk 、 Shapiro – Francia 检定
其它统计方法 (Other statistical methods)
样本数量及次方、非线性回归、逐步式回归 、统计及数学函数
包含样本范例 (Sample session)
19、再抽样及模拟方法 (Resampling and simulation methods)
bootstrapping 、 jackknife 、蒙地卡罗模拟、排列检定
五、网络功能
安装新指令、网络升级、网站档案分享、最新消息
Stata15功能介绍
基本统计(basic statistics)
stata把成百个统计工具放到您的指边,从高级的技术,比如带有frailty,动态面板数据(dpd)回归的幸存模型,广义评估方程式(gee),多层混合模型,带样本选择的模型,arch,和带有复杂幸存样本的评估;对于标准模型,比如线性和广义线性模型(glm),带有计数和二元结果的回归,anova/manova,聚集分析,比率标准化,案例控制分析,基本表格和汇总统计。
完整的数据管理工具(data management)
stata的数据管理命令让您可以完整对所有类型的数据进行控制; 您能够组合和重新规划数据集,管理变量,和跨组或重复搜集统计信息。您能够处理字节型,整数型,长整型,浮点型,双字节型和字符型变量。stata同样也拥有管理特殊数据,比如幸存/连续数据,时间序列数据,面板/longitudinal数据,分类数据和调查数据。
可以将分组变量转换成指示变量(哑变量),将字符串变量映射成数字代码。
可以对数据文件进行横向和纵向链接,可以将行数据转为列数据,或反之。
可以恢复、修改执行过的命令。
可以利用数值函数或字符串函数产生新变量。
可以从键盘或磁盘读入数据。
线性模式(linear models)
稳健huber/white/sandwich 变异估计, 三阶最小平方法、类非相关回归、齐次多项式回归、gls
广义型线性模式(generalized linear models)
十连结函数、使用者-定义连结、ml及irls估计、九变异数估计、七残差…等
模型检定及事后估计量支持分析(model testing and post-estimation support)
wald检定、lr 检定、 线性及非线性组合、非线性限制检定、边际影响、修正平均数hausman检定。
二元、计数及有限应变量(binary,count,and limited dependent variables)
罗吉斯特、probit、卜松回归、tobit、truncated回归、条件罗吉斯特、多项式逻辑、巢状逻辑、负二项、zero-inflated 模型、heckman 选择模式、边际影响(panel data/cross-sectional time-series)随机及固定影响之回归、gee、随机及固定-影响之卜松及负二项分配、随机-影响、工具变量回归、ar(1)干扰回归
群集分析(cluster analysis)
加权平均, 质量中心及中位数联结、kmeans、kmedians、dendrograms、停止规则、使用者扩充
调查方法(survey methods)
抽样权重、丛集抽样、分层、线性变异数估计量、拟-概似最大估计量、回归、工具变量…
出版级质量的图形
stata能很容易的生成出版级质量,清晰风格的图形,包括回归拟合图形,分布图形,时间序列图形和幸存图。通过完整的图形编辑器,您可以点击修改图形上的任意部分或添加标题,注释,线条,箭头和文本。您可以选择已有的图形样式,或创建您自己的样式。
生存分析(survival analysis)
kaplan–meier、nelson–aalen,、cox 回归(弱性)、参数模式(弱性)、危险比例测试、时间共变项、左-右检查、韦柏分配、指数分配…
时间序列(time series)
arima、arch/garch、var、newey-west、 correlograms、periodograms、白色-噪音测试,最小整数根检定、时间序列运算、平滑化。
流行病学工具(tools for epidemiologists)
比例标准化、病例控制、已配适病例控制、mantel–haenszel, 药理学、roc 分析、icd-9-cm
译文
整日里,昏昏沉沉,醉梦人世间,忽然听说春日将尽,于是打起精神勉强登上了镇江南山。
经过古竹院,遇见了方丈大师,与其攀谈许久,方觉得心无挂碍才是人生真正的清闲啊。
注释
强:勉强。
因:由于。
过:游览,拜访。
竹院:即寺院。
此处“偷”在有的诗歌版本中作“又”字
赏析
这是唐代诗人李涉的一首题壁诗。
“鹤林寺”,是江苏镇江南郊最古老、寺院规模最大,古迹、典故最多的寺院。始建于东晋元帝大兴四年(321),距今已有1700多年历史。相传南朝宋武帝刘裕幼年家贫,青少年时代到黄鹤山砍柴时,头顶常有黄鹤翩翩飞舞。称帝后,遂改寺名为鹤林寺。唐玄宗开元、天宝年间,僧人元素任该寺住持,名为古竹院。这就是诗中称其“竹院”的缘故。
“终日昏昏醉梦间,忽闻春尽强登山。”这两句是说,整日里,昏昏沉沉,醉梦人世间,忽然听说春日将尽,于是打起精神勉强登上了南山。
举报/反馈