Stata 16是一款集数据分析、数据管理以及绘制专业图表的整合性统计软件,它提供多种数据模型,包括线性混合模型、均衡重复反复及多项式普罗比模式,用Stata绘制的统计图形相当精美,它的分析功能也是比较出众的,可利用命令快速完成数据整理、导入导出等工作。
主要内容
一、统计功能
Stata 的统计功能很强,除了传统的统计分析方法外,还收集了近 20 年发展起来的新方法,如 Cox 比例风险回归,指数与 Weibull 回归,多类结果与有序结果的 logistic 回归, Poisson 回归,负二项回归及广义负二项回归,随机效应模型等。具体说, Stata 具有如下统计分析能力:
数值变量资料的一般分析:参数估计,t检验,单因素和多因素的方差分析,协方差分析,交互效应模型,平衡和非平衡设计,嵌套设计,随机效应,多个均数的两两比较,缺项数据的处理,方差齐性检验,正态性检验,变量变换等。
分类资料的一般分析:参数估计,列联表分析 ( 列联系数,确切概率 ) ,流行病学表格分析等。
等级资料的一般分析:秩变换,秩和检验,秩相关等
相关与回归分析:简单相关,偏相关,典型相关,以及多达数十种的回归分析方法,如多元线性回归,逐步回归,加权回归,稳键回归,二阶段回归,百分位数 ( 中位数 ) 回归,残差分析、强影响点分析,曲线拟合,随机效应的线性回归模型等。
其他方法:质量控制,整群抽样的设计效率,诊断试验评价, kappa 等。
二、作图功能
Stata 的作图模块,主要提供如下八种基本图形的制作 : 直方图 (histogram) ,条形图 (bar), 百分条图 (oneway) ,百分圆图 (pie) ,散点图 (twoway) ,散点图矩阵(matrix) ,星形图 (star) ,分位数图。这些图形的巧妙应用,可以满足绝大多数用户的统计作图要求。在有些非绘图命令中,也提供了专门绘制某种图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提供了残差图等。
Stata 的矩阵运算功能
矩阵代数是多元统计分析的重要工具, Stata 提供了多元统计分析中所需的矩阵基本运算,如矩阵的加、积、逆、 Cholesky 分解、 Kronecker 内积等;还提供了一些高级运算,如特征根、特征向量、奇异值分解等;在执行完某些统计分析命令后,还提供了一些系统矩阵,如估计系数向量、估计系数的协方差矩阵等。
三、程序设计功能
Stata 是一个统计分析软件,但它也具有很强的程序语言功能,这给用户提供了一个广阔的开发应用的天地,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。事实上, Stata 的 ado 文件 ( 高级统计部分 ) 都是用 Stata 自己的语言编写的
Stata 其统计分析能力远远超过了 SPSS ,在许多方面也超过了 SAS !由于 Stata 在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此计算速度极快(一般来说, SAS 的运算速度要比 SPSS 至少快一个数量级,而 Stata 的某些模块和执行同样功能的 SAS 模块比,其速度又比 SAS 快将近一个数量级!) Stata 也是采用命令行方式来操作,但使用上远比 SAS 简单。其生存数据分析、纵向数据(重复测量数据)分析等模块的功能甚至超过了 SAS 。用 Stata 绘制的统计图形相当精美,很有特色。
四、功能列表
数据管理 (Data management)
资料转换、分组处理、附加档案、 ODBC 、行 - 列转换、数据标记、字符串函数…等
基本统计 (Basic statistics)
直交表、相关性、 t- 检定、变异数相等性检定、比例检定、信赖区间…等
线性模式 (Linear models)
稳健 Huber/White/sandwich 变异估计 , 三阶最小平方法、类非相关回归、齐次多项式回归、 GLS
广义型线性模式 (Generalized linear models)
十连结函数、使用者 - 定义连结、 ML 及 IRLS 估计、
九变异数估计、七残差…等
二元、计数及有限应变量
(Binary, count, and limited dependent variables)
罗吉斯特、 probit 、卜松回归、 tobit 、 truncated 回归、条件罗吉斯特、多项式逻辑、巢状逻辑、负二项、 zero-inflated 模型、 Heckman 选择模式、边际影响
Panel 数据 / 交叉 - 组合时间序列
(Panel data/cross-sectional time-series)
随机及固定影响之回归、 GEE 、随机及固定 - 影响之
卜松及负二项分配、随机 - 影响、工具变量回归、
AR(1) 干扰回归
无母数方法 (Nonparametric methods)
多变量方法 (Multivariate methods)
因素分析、多变量回归、 anonical 相关系数
模型检定及事后估计量支持分析
(Model testing and post-estimation support)
Wald 检定、 LR 检定、 线性及非线性组合、非线性限制检定、边际影响、修正平均数 Hausman 检定
群集分析 (Cluster analysis)
加权平均 , 质量中心及中位数联结、 kmeans 、 kmedians 、 dendrograms 、停止规则、使用者扩充
图形 (Graphics)
直线图、散布图、条状图、圆饼图、 hi-lo 图、
回归诊断图…
调查方法 (Survey methods)
抽样权重、丛集抽样、分层、线性变异数估计量、拟 - 概似最大估计量、回归、工具变量…
生存分析 (Survival analysis)
Kaplan – Meier 、 Nelson – Aalen, 、 Cox 回归 ( 弱性 ) 、参数模式 ( 弱性 ) 、危险比例测试、时间共变项、
左 - 右检查、韦柏分配、指数分配…
流行病学工具 (Tools for epidemiologists)
比例标准化、病例控制、已配适病例控制、 Mantel – Haenszel, 药理学、 ROC 分析、 ICD-9-CM
时间序列 (Time series)
ARIMA 、 ARCH/GARCH 、 VAR 、 Newey – West 、 correlograms 、 periodograms 、白色 - 噪音测试 ,
最小整数根检定、时间序列运算、平滑化
最大概似法 (Maximum likelihood)
转换及常态检定 (Transforms and normality tests)
Box – Cox 、次方转换 Shapiro – Wilk 、 Shapiro – Francia 检定
其它统计方法 (Other statistical methods)
样本数量及次方、非线性回归、逐步式回归 、统计及数学函数
包含样本范例 (Sample session)
再抽样及模拟方法 (Resampling and simulation methods)
bootstrapping 、 jackknife 、蒙地卡罗模拟、排列检定
五、网络功能
安装新指令、网络升级、网站档案分享、 Stata 最新消息
功能介绍
1、Stata官方版的数据访问功能除了直接读取自身格式的数据集外,Stata支持导入/导出很多其他格式的数据集,如常用的Excel格式、XML格式、SAS XPORT格式、文本格式及ODBC接口。如果数据很少,可以直接将数据手工录入至Stata软件。
2、Stata的数据管理功能
Stata官方版为用户提供了完善的数据管理功能,举例如下:①Stata支持最多达32个字符的变量名,字符变量值支持长达20亿字节(Stata区分字符大小写);②利用数值函数或字符函数产生新变量;③自动由分组变量生成哑变量,自动将字符变量映射成数字代码;④对数据文件进行横向和纵向链接、行列变换等;⑤重复测量数据的长型格式和宽型格式相互转换;⑥数值变量和字符变量相互转换。
3、Stata的作图功能
Stata可生成可供发表的高质量的图形输出。本书主要介绍最常见的几种基本图形的制作:散点图、线图、面积图、条图、方向图等
4、Stata的统计分析功能
Stata的统计功能很强,除了传统的统计分析方法外,还收集了近年来发展起来的新方法,其分析功能紧跟国际上数理统计方法学的最新进展。Stata 13增加了许多特性,如处理效应、多水平广义线性模型、功效和样本量、广义结构方程模型、预测、效应量、删失的连续性结局、单变量时间序列模型。更为令人称赞的是,Stata在统计分析命令的设置上结构极为清晰,它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可以使用相同功能的选项,这使得用户学习时极易上手。
5、Stata的矩阵运算功能
矩阵代数是多元统计分析的重要工具,Stata不但提供了多元统计分析中所需的基本矩阵运算,如矩阵的加、积、逆、Cholesky分解、Kronecker内积等,还提供了一些高级运算,如特征根、特征向量、奇异值分解等。在执行完某些统计分析命令后,还提供了一些系统矩阵,如估计系数向量、估计系数的协方差矩阵等。Stata 9.0以后版本完美地整合了执行矩阵计算的矩阵编程语言Mata,可进行强大的矩阵运算。
6、Stata的程序设计功能
Stata是一个统计分析软件,但它也具有很强的程序语言功能,给用户提供了一个广阔的开发应用的天地。和矩阵运算功能相结合,用户就能够充分发挥自己的聪明才智,熟练应用各种技巧,对Stata的功能进行扩展(详见第11章)。如Stata自身并无Meta分析命令,但是用户们开发了一整套优秀的Meta分析命令集(详见第12章),对Stata的功能进行了进一步扩展,使之成为当前最优秀的Meta分析软件之一。