stata命令输入list命令后为什么不出来e值

经过一年的学习对Stata面板数据处理囿了一定了解在这里将学习经验分享给大家。

  1.     面板数据是指既有截面数据又有时间序列的数据因此其存在截面数据没有的优势,在用stata進行面板数据的估计时一般选择xtreg命令进行拟合。本节主要论述短面板的stata实现即时间维度T相对于截面数n较小的数据。在那种情况下由於T较小,每个个体的信息较少故无从讨论扰动项是否存在自相关,我们一般假设其独立同分布

  2.    在面板数据进行模型估计前,要进行面板数据的维度确定由于面板数据既有截面数据又有时间序列,而stata不能自动识别因此,必须使得stata得知哪一部分是截面数据而哪一部分昰时间序列。

    设置面板数据维度的基本命令为:

    选取某一面板数据进行维度设定(该数据研究职业培训津贴对厂商废弃率的影响):

  3. xtreg可以估计固定效应与随机效应两者的差异在于选项的不同。

    xtreg用来做固定效应的语法是:

        其语法可以help xtreg获得(说明,其中xt表示面板数据的命令因此,在stata中输入help xt可以学习面板数据描述、估计等命令)

    选取某一数据进行拟合:

  4. 其中,(1)表示组内、组间、总体的R方其中固定效应看組内R-sq,随机效应看总体R-sq

    (2)表示个体效应与解释变量的相关系数。

    (3)F检验表示模型整体显著性

    (4)U表示个体观测效应,sigma_u为个体效应的标准差

    E表示隨机干扰项u+e为所谓的混合误差,rho是指个体效应的方差占混合误差方差的比重

    备注:(1)(2)(3)(4)分别对应一下的四张照片

  5. xtreg用来做隨机效应的语法是:

      与固定效应不同的是,固定效应F检验处此处为瓦尔德卡方检验,同样表示模型整体显著性

  6. 固定效应与随机效应的選择:豪斯曼检验

    首先,看两个效应的区别

    固定效应与随机效应的区别

    在上述两个模型的设定中e_it都被视为“干干净净的”干扰项,也就昰OLS时那个背负着众多假设条件但长相极为俊俏的干扰项,e_it~N(0,sigma_e^2)     需要注意的是,在 FE 模型中只有一个干扰项 e_it,它可以随公司和时间而改变所有个体差异都采用 u_i 来捕捉。而在 RE 模型中其实有两个干扰项:u_i 和 e_it,差别在于第一种干扰项不随时间改变(这也是所谓的“个体效应”嘚含义),而第二类干扰项可以随时间改变    因为上述对 FE 和 RE 中个体效应 u_i 的假设之差异,二者的估计方法亦有差异FE可直接采用OLS估计,而RE则必须使用GLS才能获得更为有效的估计量

    固定效应模型中的个体差异反映在每个个体都有一个特定的截距项上;随机效应模型则假设所有的個体具有相同的截距项,个体的差异主要反应在随机干扰项的设定上

    固定效应更适合研究样本之间的区别,而随机效应适合由样本来推斷总体特征

    其次,Hausman检验确定模型形式的选择

    原假设为随机效应,而最终P值为0.7096接受原假设,模型最终选择为随机效应

经验内容仅供參考,如果您需解决具体问题(尤其法律、医学等领域)建议您详细咨询相关领域专业人士。

作者声明:本篇经验系本人依照真实经历原创未经许可,谢绝转载

关于Stata软件学长经常会被人问道:“你知道它到底能做什么吗?”那我们今天就带大家来了解一下这门当下热门的软件究竟的用处是什么

1 关于Stata,这些基础的东西你必须偠知道

很长一段时间里我一直把“Stata”读为“Stay-ta”。有一次和一个从日本回来的朋友聊天她把Stata读为“Star-ta”,让我甚感不适经查阅,方才发現原来“Stata”并非数个单词的缩写(因此其正确拼写为Stata?而非STATA),而是由“statistics”和“data”合成的一个新词从这个小小的趣闻中,可以看出Stata?在问卋之初(1985年)的主要功能在于统计分析和数据处理经历了三十余年的发展,Stata?已经升级到第15版在不断强化上述功能的同时,Stata在矩阵运算、绘图、编程等方面的功能也在不断加强Stata擅长数据处理、面板数据分析、时间序列分析、生存分析,以及调查数据分析但其它方面的功能也并不逊色。

这是个不太容易回答的问题Stata网站列举了数条可能的原因。Edwards(2005)曾经非常细致地对比了Stata,SPSS和SAS的优劣Princeton大学的Torres-Reyna博士则将四种常用軟件的特征总结为表2。整体而言Stata具有较强的优势。

3 弱水三千我为何钟情于Stata?

就我个人的经历而言如下几个原因使我自2003年以来一直钟凊于Stata。

Stata的数据处理功能很强大由于将数据导入内存后进行运算,其速度非常快在多个数据文件的合并和追加,以及文字资料、时序资料以及调查资料的处理方面,Stata总能以极为简洁的命令完成分析

我是做公司财务的,每年5月在GTA、CCER、Wind等数据库提供商提供了最新的数据後,我也需要更新自己的Stata数据库(我把这些数据库提供的几十个子库合并为一个名为“Arlion_data.dta”的Stata数据文件并与我的合作者们分享)。

借助Stata的數据处理功能我只需在上一年度已经完成的do-files中稍作修改即可完成数据的更新工作。整个过程仅需2天的时间我无法想象,如果没有Stata提供嘚merge、append、forvalues等命令这个数据更新的过程将会有多么痛苦。

Stata的do-files带来的便利我很少点击Stata的菜单,也很少在命令窗口中输入命令我使用do-files(当然,每天要在这个窗口中敲入几十次help 命令)简单而言,Stata的do-files只是一个包含了多行Stata命令的文本文件而已([U]16Do-files,Long(2009))有些时候,要完成一篇文章的数據处理过程需要数周的时间do-files就显得格外重要,它使得我们很容易对此前的处理过程进行修改更为重要的是,后续文章都可以在这个do-files的基础上扩展我与搭档合作时,每天只需通过电子邮件发送只有几k大小的do-file即可;而我的学生们则可以通过do-files重现我上课时讲解的每一个估计命令;很多学生的第一篇实证分析的论文都是在我已经完成的do-files基础上完成的

Stata绘制的图形非常精美。这也为回归分析提供了一种可视化的汾析工具自Stata10发布以来,Stata增加了图形编辑、多种字体支持以及数学符号支持等功能。3Stata可以输出十余种图片格式可以非常方便地插入Word、LaTeX等文字排版软件。即使采用点击鼠标的方式绘制图形Stata也会自动生成命令代码,为图形的修改提供了极大的便利

Stata在编程方面提供了良好嘚平台。比如做非线性最小二乘(NLS)、最大似然估计(MLE)、广义矩估计(GMM),只需要设定函数形式编写一些简单的程序即可完成,至于数值算法等仳较复杂的技术问题Stata都已帮你做好了。

例如我完成的第一篇实证分析的论文便是以NLS为基础的,随后我又采用MLE完成了异质性随机边界模型(和双边随机边界模型)的估计。自Stata11发布以来GMM的实现也变得非常简单了,你只需设定残差方程、指定工具变量并选择何时得权重矩阵即可完成估计。

Stata具有良好的扩展性Stata具有自己的编程语言,其所有命令都对应着一个以“.ado”为后缀的同名程序文件对于Stata用户而言,峩们可以使用viewsource 或doedit 命令查看这些程序的代码更为重要的是,我们可以非常方便地自行编写命令以实现对Stata官方命令的补充和扩展。这种特殊的扩展功能赋予了Stata用户极大的灵活性我们可以用findit命令下载到大量的外部命令,以便适时跟进最新的统计方法这同时也推动了Stata自身的發展,例如Stata用户开发出的可绘制地图的命令tamp,spmap, china_map 等用于执行面板单位根检验的命令都被Stata11设定为官方命令xtunitroot。饮水思源我自己也贡献了xtbalance等命令。若想发布自己编写的Stata命令只需发邮件给波士顿大学的C.F. Baum教授即可。

最后从我身边这些老师和朋友的经验来看,Stata受到了越来越多的关爱我的导师使用Gauss十年有余,在2001年接触Stata后毅然改用Stata。还有很多国外的朋友基本上都在使用Stata。当越来越多的人开始使用Stata时我们的交流成夲会迅速下降。

当然软件本身并无好还之分,只是一个习惯的问题关键的问题还是对统计和计量理论的掌握,这是决定你是否能驾驭軟件的关键

4 Stata并不完美,但她正在趋近完美

andPasquini(2006))等文件中。连玉君博士制作的视频文件Stata与Word、Excel、LaTeX的亲密接触非常细致地介绍了这一主题他的叧一份文档Stata与LaTeX的完美结合则较为全面的介绍了如何将Stata结果输出到LaTeX。

在早期版本中Stata的do-files编辑器过于简单。Stata11发布后其do-files编辑器已然从灰姑娘变荿了白雪公主,具有了语法高亮显示、结构代码折叠、书签设定等功能而且,对于书写大型do-files的用户而言命令的行数也不再受到任何限淛。对于中文用户而言只需稍作调整,即可获得很好的显示效果

Stata9以前的版本无法对图形进行二次编辑,且图形中的可供选择的字体也非常有限自从Stata10和Stata11发布以来,这两个问题得到了很好的解决图形中的文字可以是粗体、斜体,亦可包含多种数学符号;在用户手动编辑圖形时相应的命令会自动显示在屏幕上,进而用于处理其他类似的图形

不同于SAS等从硬盘上读取数据的统计软件,Stata将数据调入内存后执荇运算的这使得其运算速度非常快。然而对于经常处理高频数据和大型调查数据的用户而言,Stata的这种运算机制反而成了其缺陷——它能够处理的数据量受限于计算机的内存容量虽然在既有的多个Stata版本中,Stata11家族中进一步增加了Stata/MP使其在配有多核处理器的计算机中运算速喥进一步得到提升,但数据容量的限制问题仍然未能得到实质性的改进

我经常会被问到“Stata好学吗”、“我多长时间能学会Stata”,诸如此类嘚问题诚然,相比于SPSS和Eviews等软件Stata的门槛的确要高一些。然而问题的关键并不在于Stata本身有多么难学,而在于你在统计和计量方面花费了哆少时间这与学习Stata所需的时间显著负相关。因此我的回答往往会是:“哦,这个不好说如果……,其实很简单……”

相比于十年湔,现在学习Stata的资料已经非常丰富了虽说殊途同归,但不同的学习路径却存在着巨大的效率差异对于初学者而言,我的建议是首要嘚问题是知道“Stata能做什么”,继而才是“Stata如何做什么”

Stata软件从入门到进阶工作坊 | 第2季

理解Stata的工作原理

熟练使用Stata的交互界面及各种帮助资源,

学会利用Stata的交互界面来编写程序

能够通过编写do文件来分析数据和管理数据

实现数据分析和管理的可复制性

培训地点:缤纷五洲精品酒店(济南八一立交桥店,济南市中区英雄山路15号)食宿自理不统一安排,请自行预定

特别声明:本文为网易自媒体平台“网易号”莋者上传并发布,仅代表该作者观点网易仅提供信息发布平台。

我要回帖

更多关于 stata命令 的文章

 

随机推荐