
命令【1】:导入数据一般做实证分析使用的是excel中的数据,其后缀名为.xls,需要将其修改为.csv
insheet using name.csv, clear
命令【2】:删除重复变量
sort var1 var2
duplicatesdrop var1 var2, force
命令【3】:合并数据
use data1, clear
merge m:m var1 var2 using data2
drop if _merge==2
drop if _merge==1
drop _merge
命令【4】:描述性统计分析
tabstat var1var2, stat(n min mean median p25 p75 max sd), if groupvar==0 or 1
输出到word中:
logout, save(name) word replace: tabstat var, stat(n min mean p50 max sd) col(stat)f(%9.2g)
命令【5】:结果输出
安装命令包
ssc install estout, replace
单个回归
reg y x
esttab using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)
多个回归一起
reg y x1
est store m1
reg y x2
est store m2
esttab m1 m2 using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)
【命令6】生成滞后、差分数据
tsset code year
gen newvarname=l.varname
gen newvarname=d.varname
【命令7】多重共线检验之方差膨胀因子
reg y x1 x2 x3
vif
【命令8】多重共线修正之逐步回归
stepwise, pe(0.1): reg y x
【命令9】检验是否遗漏高次项
reg y xestat ovtest
或者
estat ovtest, rhs
【命令10】 样本检验两样本均值T检验
ttest var, by(groupvar)
两样本中位数Z检验
ranksum var, by(groupvar)
【命令11】 生成虚拟变量
tab year, gen(year)
tab industry, gen(industry)
【命令12】 数据缩尾处理
findit winsor2
之后安装
winsor2 varname, replace cut(1 99)
【命令13】异方差检验怀特检验
ssc install whitetst
reg y x1 x2
estat imtest, white
处理:“OLS+稳健标准差”
reg y x1 x2 x3, robust
【命令14】 DW检验
gen id=_n
tsset id
estat dwatson
【命令15】计算两个日期之间的间隔天数
gen td=date(trading_date,'YMD')
gen ed=date(eventdate,'YMD')
form td ed %td
gen d=ed-td