STATA常用命令汇集


均值t检验

ttest:即 t tests (mean-comparison tests),简单来说,在t检验的假设都满足的前提下,如满足正态分布,如同方差假定,比较不同的数据的均值,以判断数据之间是否存在差异。

常用两样本t检验命令:ttest varname,by(groupvar),即检验不同分组下,观察值的均值是否存在显著差异。若无同方差假定,或数据本身不同方差,则要加上unequal 选项。

至于上面t检验怎么看,主要是看p值,若p值较小,则拒绝原假设,差异是显著的;若p值较大,则接受原假设,差异并不显著。

结果导出:

esttab

参考:

1、用好 esttab,导遍表格都不怕

2、用好esttab,导遍表格都不怕[进阶操作]

3、Stata 回归表格输出之 esttab 详解

logout2

基本使用形式:

logout2 [m1 m2 m3] using filename , word/excel replace +[other options]
sysuse nlsw88,clear 
tab race,gen(d_race)
 drop d_race1
tab occu,gen(d_occu)
 drop d_occu1         //分别生产人种、职业虚拟变量
reg wage hours ttl_exp married
  est sto m1 
reg wage hours ttl_exp married d_race* 
  est sto m2 
reg wage hours ttl_exp married d_race* d_occu*
  est sto m3 

outreg2 [m1 m2 m3] using out1,replace excel      ///
  drop(d_occu*) sortvar(married hours)           ///
  tdec(2) rdec(3) adjr2 e(F) tstat               ///
  nonote                                         ///
  addnote("注:(1)。。。                        ///
                         (2)。。。")

述命令中,excel表示输出excel文件,drop(d_occu*)表示不再表中展示职业虚拟变量的回归结果(太多了),sortvar可以调整回归表中变量的顺序,tdec、rdec分别表示设定t统计量与R2 保留的小数位数,adjr2,e(F)分别表示表中展示调整后的R2 、F统计量,tstat表示估计系数下方展示 t 统计量,相应的若改为pvalue可以呈现显著性水平;nonote表示不展示默认的英文注释,addnote可以自己加入自己的回归结果注释。

同时,outreg2还可以通过append选项继续追加回归结果。
下面将logit回归结果加入上文out1估计结果中:

logit union wage married wage d_race* d_occu*
 est sto logit 
outreg2 [logit] using out1,excel append

相关系数

  • 皮尔逊相关系数:corr x y z(从整体上计算);pwcorr x y z(两两计算)
  • 斯皮尔曼相关系数:spearman x y z(从整体上计算);spearman x y z, pw(两两计算)

Pearson 相关系数

corr price weight length mpg
pwcorr var1 var2
pwcorr price weight length mpg,sig
pwcorr price weight length mpg,star(0.01)
* pwcorr 的缺陷在于,默认保留小数点后四位小数,且无法调整,不符合一般期刊的格式要求

Spearman 相关系数

sysuse auto,clear
spearman mpg rep78
//Two variables; output displayed in tabular form by default
spearman mpg rep78, matrix
//Two variables; output displayed in matrix form
spearman mpg price rep78, pw
//Use all nonmissing observations between a pair of variables
spearman mpg price rep78, pw star(0.05)
// Star all correlation coefficients significant at the 5% level or lower

Pearson &Spearman 系数合并显示

corsp mpg price rep78,format(%7.3f)
corsp mpg price rep78

Pearson &Spearman 系数的区别
如果变量同时满足以下三个条件,Pearson &Spearman 系数都可以使用,此时使用Pearson 系数更好
①连续变量
②正态分布
③ 线性关系
以上任意一个条件不满足,只能使用spearman 相关系数,不能用 Pearson 相关系数.


文章作者: 夏汉林
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 夏汉林 !
评论
  目录