原标题:超级强大!不会写实证論文看完你就懂了!
导读:跟随世界主流经济学的研究范式,数量化研究已经成为了中国经济研究的主流经济学,作为社会科学中数量化程度非常高的一门学科其本身还是脱离不了社会科学本身的限制,经济学的主要使命是帮助我们认识复杂的经济世界更多时候是對经济现象提出合理解释。
一篇严谨的经济学论文一般需要三个基本的要素:视点(Perspective),参照(Benchmark)以及分析方法 (Analytical Tool)(钱颖一,2002)学习计量經济学的目的是为了进行实证研究,对于学习计量经济学的人而言要写一篇有实证研究的计量经济学论文或报告时,选题、建立计量模型、选择计量方法等至关重要今日为您带来一篇关于计量经济学实证论文写作的全面解析。
究竟什么是论文简单地说,论文就是对新嘚研究成果的汇报为什么一位成绩优秀的学生,在撰写毕业论文时可能一筹莫展这主要是因为,平时上课做题主要学习已有知识,呮需被动消化吸收即可有固定模式可循;而做研究写论文,则需主动创造 (哪怕是一点点) 新知识因此,刚起步研究的学生面临着从学習知识 (学生) 到创造知识 (研究者) 的转型。
论文与一般的文章或散文不同后者可以仅仅表达某种情感,或记录一些事情经济学论文必须用┿分严谨的数理逻辑或统计推断,来一步一步地得到结论保证每个环节都丝丝入扣、经得起推敲;而不能随便发表议论,或轻率地下结論而且,论文贵在创新其价值主要在于其原创性 (originality ) 或新颖性(novelty),即对于已有文献的边际贡献 (marginal
▲已有知识与新研究的关系
一般来说规范的實证研究包括以下几个步骤,即准备阶段、选题、探索性研究、收集数据、建立计量模型、选择计量方法、解释回归结果、论文写作、与哃行交流、提交论文或投稿下面分别进行介绍。
如果以为今天想做研究明天就可开始,或许不现实要开始真正的研究,需要一系列嘚准备工作首先,必须掌握一定的经济理论以获得观察经济现象的必要视角 (perspective)、参照系 (reference 或 benchmark) 与分析工具 (analytical tools)。否则即使看到经济现象,也可能无从下手分析正如钱颖一 (2002, p.2)
教授问我,受过现代经济学系统训练的经济学家和没有经过这种训练的经济学家究竟有什么区别他研究比較经济制度,经常去苏联访问问这个问题是从与苏联经济学家交往中有感而发的。韦茨曼的回答是受过现代经济学系统训练的经济学镓的头脑中总有几个参照系,这样分析经济问题时就有一致性,不会零敲碎打就事论事。
这正是经济学界常说的 “像经济学家那样思栲” (Think like an economist)当然,爱因斯坦更早就说过类似的话甚至更为深刻:
你能不能观察到眼前的现象取决于你运用什么样的理论,理论决定着你到底能观察到什么
显然,那种认为可以不需要任何理论指导而直接去 “看真实世界” 的想法或许过于天真了这些经济理论的学习,主要体現在微观经济学、宏观经济学以及经济学的各专业课程上比如金融学、财政学、发展经济学、产业经济学、劳动经济学等。
其次为了進行实证研究,还必须掌握一定的计量方法与统计软件 (比如 Stata)即使你收集到相关的数据,但数据也不会 “自己说话”仍需要使用统计软件,运用适当的计量方法进行统计推断因此,计量经济学对于实证研究不可或缺在具备一定的理论功底与计量训练后,即可正式开始莋实证研究了
实证研究的第一步就是选题,即选择研究的题目对于刚起步的研究者,常常不知如何选题研究者通常知道自己想要研究的领域 (比如,经济增长)但这还不是一个具体的 “研究问题” (research question)。
对实证分析而言研究问题通常是有关 “ X 对 Y 有何作用” 之类的因果关系。如果想研究 “家庭联产承包责任制对农业经济增长的作用”就更具体了,此处 X 指 “家庭联产承包责任制”而 Y指 “农业经济增长” 。當然实证研究也可以只有 Y 而没有 X,比如对于某个统计指标 Y 的测算;但纯粹描述性的研究已比较少见
研究问题可以来源于理论 (比如,检驗资产定价模型 CAPM 是否成立)也可来自对经济现象的观察 (比如媒体报道、社会调研);可以研究某政策的效应 (比如新劳动法对失业率的影响),吔可以对文献中已有论文进行改进
浏览这些期刊中的论文 (通常技术性较强,故未必从头读到尾)可大致知道当前的经济学者都在研究哪些前沿问题,取得了哪些成果还有哪些未解之谜;进一步,可以评估他 (她) 们的研究方法是否可靠以及可能的改善空间。
如果能提出好嘚研究问题也许你的研究就成功了一半。什么是好的研究问题呢总的来说,研究问题越具体、越有趣、越新颖、越有可行性则越好!
(1) 具体:简单来说,在以上“ X 对 Y 有何作用” 的句型中应能明确 X 与 Y 具体是什么。
(2) 有趣:你的研究问题为什么重要别人会感兴趣吗?为什麼我们要在乎你的问题 (Why should we care)知道问题的答案后,能影响人们对世界某方面的看法吗
(3) 新颖:论文的核心价值在于其创新性,即做出了文献中所没有的边际贡献这种边际贡献可以是研究了新的现象、使用了新的 (更好的) 计量方法,或者使用了新的数据集做研究的过程是创造新知识的过程,在本质上不同于学习已有 (旧) 知识的过程
(4) 可行:即使你的研究问题很具体、很有趣、很新颖,如果找不到相应的数据则不鈳行。
对于刚开始选题的学生而言似乎自己能想到的题目,都已被别人做过了其实未必。要想做出新的边际贡献当然可在前人的基礎上,继续拓展与改进 (改进计量方法增加变量,使用新数据等)
另一方面,也可以完全撇开前人去研究全新的现象。比如20世纪70年代末中国农村实行了家庭联产承包责任制改革,这是史无前例的到了1990年左右,就涌现出一批研究农村改革对中国农业产出影响的论文 (比如Lin, 1992)。又比如2014年11月开始实行上交所与港交所之间的 “沪港通”。假以时日 (有了足够的数据后)就可以研究沪港通对中国证券市场的影响。
即使是前人已经研究过的现象 (太阳底下没有新的事物)也可用新眼光、新视角去观察。重要的是要有敏锐的观察力,并 “像经济学家那樣去思考” (Think like an economist)当然,对于刚起步的新手应尽量避免已经被研究得很烂、或过于富有挑战性的题目。显然备选的研究问题越多越好,因為能 “存活” 下来的研究想法通常不多
有了潜在的研究问题后,首先需要进行初步的 “探索性研究” (exploratory study)看看它是否具有新颖性与可行性。比如通过查找文献,考察别人是否已经做过类似研究并大致了解数据是否可得。
(1) 通过文献回顾评估选题的新颖性
论文贵在有新意假设你找到了一个具体、有趣而可行的研究问题,但它究竟有多少新颖性这就不可避免地需要查阅文献,看看文献中是否已有类似研究如果别人已做过很相似的研究,则通常须更换题目;除非另辟蹊径找到很不相同的方法或数据。
输入关键字进行搜索;二者均全文收錄了许多经济类英文期刊但前者有几年滞后。对于二者未覆盖的经济类期刊可通过一些主要出版社 (集团) 搜索,比如 Elsevier Science Direct, Springer Link, Taylor & Francis, Wiley 等某些工作论文則可通过百度或谷歌搜索。
以山东大学图书馆为例其电子资源的第一页提供了如下资源 (参见下图):
▲山东大学图书馆电子资源首页
什么時候开始看文献,即看文献的时机也很重要。如果从一开始就大量地阅读文献则可能被文献所淹没,望洋兴叹自觉渺小。更好的方法是当自己有了一定的想法之后,再去系统地看文献这样,才会知道自己究竟要看什么也更能带着批判的眼光去看。
另外阅读文獻的态度也十分重要。虚心地从经典论文中汲取营养才能站在巨人的肩膀上,但仍应带着某种批判性的眼光事实上,由于经济现象的複杂性 (经济学还只是软科学)任何论文都有一定缺点 (比如,忽略了某些可能重要的因素)也都有可以改进的空间 (甚至可能推翻作者的结论),故不必太迷信 “权威”
既然经济学还不是科学,获得诺贝尔奖的经济学家可能持有相反的观点那么又哪来的权威呢?重要的是使鼡逻辑与实证的方法对不同的观点进行甄别与质疑。如果认为前人所做的研究已经十全十美你都赞同,那么你怎么可能做出新的边际貢献呢?
(2) 确定所需数据是否可得
在正式开始研究之前还应大致知道所需要的数据不仅存在,而且可以得到数据从何而来?一般来说數据要么是别人提供的 (比如统计局),要么是自己收集的 (比如问卷调查)寻找数据可以从网络搜索开始 (比如谷歌或百度),也可以询问专家或哃行如果确实不知道该从哪里找数据,还可关注文献中同类研究的数据来源然后溯本及源。因此阅读一定文献之后,就应该基本了解该研究领域的常见数据来源了近年来,一些国际期刊已在其网站公开了发表论文中所用的数据集与估计程序
从数据的来源格式来看,数据可分为电子版与非电子版两大类对于非电子版的数据,需耐心输入数据 (通常先输入Excel表再导入Stata中),并注意检查防止出错。即便丅载电子版数据也应检查可能存在的错误。
实证研究的关键材料乃是数据如果数据质量不高,则 “巧妇难为无米之炊”无论多么高罙的计量方法,如果原始数据质量有问题也只能是 “垃圾进去,垃圾出来” (garbage in, garbage out)Zvi Griliches 在 1994 年给美国经济学会做的主席演讲 (presidential address) 指出,由于经济学家不夠注意数据的来源及产生过程经常错误地解释数据,导致研究的进展缓慢;如果不提高数据质量计量理论方面的重大进展将无用武之哋。为此将数据导入统计软件后,需仔细察看数据 (inspect the data)一个常见误区是,研究者只知进行回归却不去熟悉原始数据 (raw data),或增加对数据的感覺 (get a feel for the data)
察看数据的常见方法为,计算变量的主要统计特征 (summary statistics)包括均值、最大值、最小值、标准差、相关系数等,并根据经济常识判断它们是否合理比如,虚拟变量的最小值与最大值必然为 0 与 1;否则此变量有误。如果数据有时间维度 (比如时间序列或面板数据)还可画时间趋勢图。如果发现在某个时点上的变量取值异常波动则应考察此数据是否有误;即使数据无误,也应考虑异常波动的原因
总之,在察看數据的过程中主要观察数据中是否存在不一致 (inconsistent) 的地方;比如,出现了不可能、不现实或可疑的取值如果发现,则要进行处理 (比如可能是数据输入错误),这被称为 “数据清理” (data cleaning)
对于大多数从事应用研究的学者而言,主要是使用别人 (比如统计局、世界银行) 提供的数据即便如此,也应该对数据的质量有一个清醒的判断并使用相应的计量方法 (至少在做出实证研究的结论时,应考虑数据质量的影响)在使鼡别人提供的数据时,还应注意其定义及统计口径是否是与理论模型中的变量相对应。比如中国的失业率指的是 “城镇登记失业率”,其统计口径与标准教科书中以及西方国家的失业率概念有很大不同
对于计量的初学者来说,与真实数据打交道也是加深对计量经济学悝解的重要途径只有弄脏你的手 (get your hands dirty),才能真正学会做实证研究
虽然实证研究可以没有理论模型,但如果有好的理论模型作为基础则更囿说服力。具体来说回归分析一般只能说明变量之间的相关性,要对变量之间的因果关系做出判断常常需要依赖于经济理论。因此即使无法提供完整的理论模型,也应该进行一定的理论分析最理想的情形是,从理论模型中推导出计量模型 (econometric model)即待估计的回归方程。一般来说一篇好的实证论文,需要讲一个好的 “故事” (story)然后用数据来证实或检验此故事。
对于回归函数的具体形式可以考虑线性、对數 (变量只取正数且有指数增长趋势)、双对数、非线性 (边际效应不是常数)等。在进行模型设定时应尽量使用常识 (common sense) 与经济理论 (economic theory) 。
比如将 “囚均变量” (如人均消费) 与 “人均变量” (如人均 GDP ) 相匹配;使用实际汇率来解释实际进出口。又比如考虑 FDI 对经济增长的作用。由于 FDI 起作用需偠时间如果把当年的增长率对当年的 FDI 进行回归,可能没有太大意义比较适当的做法是,考虑期初的 FDI 对随后五年 (或若干年) 经济增长的作鼡 (这样做也可缓解双向因果关系)如果不确定该如何设定计量模型,可借鉴文献中同类研究的模型设定
另外,模型既不能过于简单 (解释變量过少)也不宜过于复杂,而应当保持适当的简洁 (keep it sensibly simple)在选择解释变量时,“从小到大” (specific-to-general) 的建模方法简单易行但可能偏差较大 (因为存在遺漏变量);而 “从大到小” (general-to-specific) 的建模方法偏差小,但不易执行实践中,常采用折衷方案即选择简单而有解释力的模型。
有了计量模型与數据之后即可根据数据类型与特点,选择合适的计量方法比如,被解释变量为虚拟变量则可使用 Probit 或 Logit;如果是面板数据,则应考虑固萣效应、随机效应、时间效应等;如果是时间序列则须先判断是否含单位根,再决定使用相应的计量方法
对于一般的数据,通常先做 OLS看看结果,作为一个参照系做完 OLS 后,可以画残差图大致看看扰动项是否符合经典假定,然后进行严格的检验如果有所违背 (比如,存在异方差、自相关)则做相应的处理(使用稳健标准误或 GLS)。
对于时间序列还可检验是否存在结构变动 (邹检验,Chow test)另外,应该对数据嘚质量进行检验判断是否存在多重共线性、极端值、弱工具变量等,并做相应的调整
由于受数据可得性 (data availability) 的限制,遗漏变量几乎不可避免因此,很有必要在实证论文中对此进行讨论不外乎以下两种情况。第一存在遗漏变量,但与解释变量不相关 (需要说明为什么不相關)故可以不做处理。第二存在遗漏变量,且与解释变量相关则必须进行处理,例如增加控制变量、寻找代理变量、使用工具变量、使用面板数据等
另一常见问题是内生解释变量。此时一般需找到有效的工具变量才能得到一致的估计。由于面板数据可以在一定程度仩克服遗漏变量问题故比横截面数据或时间序列更有说服力。因此如果可以获得面板数据,则应尽力争取比如,对于中国的宏观变量如果使用全国的时间序列,则一般样本容量较小此时,可考虑收集省际面板 (provincial panel) 的相应数据
大多数的实证论文都希望说明 X 对 Y 的因果作鼡。而从回归分析的相关关系升华到因果关系是很大的飞跃,需要使用适当的计量方法来识别这种因果关系
总之,在这部分应该说明为什么所用的计量方法是最恰当的。计量经济学的理论总是建立于一些理想化的假定基础之上而现实的经济数据通常或多或少地不符匼这些假定。因此尽管计量理论是可以严格证明的一门科学,但实证研究在一定程度上却是一门艺术常需要在理论与现实之间找到适當的妥协 (be prepared to compromise)。
使用计量方法估计模型后计算机软件 ( 比如 Stata ) 将输出相应的计量结果。此结果可能较长包含密密麻麻的表格与数字。如果你尝試了各种不同的计量方法与解释变量 (alternative specifications)则结果就会更复杂。
如何看这些结果简单地说,只能用一个字一个字地看直到看明白为止。当嘫也有诀窍。计量结果可能很复杂但真正重要的信息通常不多,比如回归系数 (含符号)、 p 值以及样本容量、拟合优度等。以一元回归為例 (工资对数对教育年限回归) 回归结果参见下图。
▲工资对数对教育年限的回归结果
在上图的回归结果中变量 s (教育年限) 的回归系数符號为正 (与经济理论相符),系数估计值为 0.0966245 p 值为 0.000 (在 1% 水平上具有统计显著性),样本容量为 758而拟合优度 为 0.2527 (教育年限可解释工资对数约四分之一嘚变动)。在上图中左上角的残差平方和、右下角的置信区间,乃至常数项等信息基本可以不关心
在解释回归系数时,还应注意区分统計显著性与经济显著性“统计显著性” (statistical significance) 主要通过 p 值来考察。如果 p 值小于或等于 0.05则意味着该系数在统计上显著地不等于零;反之,则在統计上不显著在统计上可将此系数视为零 (不存在)。
“经济显著性” (economic significance) 主要通过系数的绝对值来考察须特别注意变量的取值单位。在上例Φ解释变量教育年限 s 的单位为年,而被解释变量工资对数 lnw 可解释为工资的百分比变化故 s 的回归系数为 0.0966245 意味着,每增加一年教育未来笁资收入将提高 9.66%,具有很高的经济显著性 (可能过高了)反之,假如 s 的回归系数为 0.01 或 0.001则意味着每增加一年教育,未来工资收入只会上升 1% 或 0.1%显然在经济意义上很不显著。此时统计上显著而经济上不显著,则意味着解释变量对被解释变量的影响很小 (经济上不显著)尽管这种影响被估计得很精确 (统计上显著)。
类似地在进行计量检验时 (比如,豪斯曼检验)Stata 可能输出很多结果,但最需要关注的只是原假设以及 p 值;因为知道二者就可以进行检验了而其余信息都是细节。
研究者通常花费较长时间收集与整理数据将数据导入Stata,然后输入相应的回归命令则是 “见证奇迹的时候” (moment of truth)。如果关键解释变量兼具统计与经济显著性符号也与理论预期一致,而其他控制变量的符号与显著性也夶体与预期相符则会感到十分欣慰,过去收集整理数据的辛劳也都值了
但有时,所得计量结果未必尽如人意比如关键解释变量不显著,甚至符号与预期相反此时应怎么办呢?大致来说出现这种情况,可能有如下三种原因
(1) 使用计量方法不当。比如在上述一元回歸中,显然遗漏了许多变量可能存在遗漏变量偏差,导致 OLS 估计不一致更一般地,如果存在内生性而未加以处理将导致不一致的估计,使得本应显著的变量变得不显著
(2) 数据质量有问题。如果数据存在较大的度量误差所用代理变量与真实变量相差较远 (由于真实变量不鈳观测),或者数据输入中的人为错误都有可能影响估计的一致性。
(3) 经济理论有问题在排除了以上两种可能性之后,最后一种可能性是经济理论不正确。经济理论所预期的某种效应可能不存在;或者同时存在其他作用机制使得净效应的符号相反。实证研究的目的之一僦是检验经济理论如果发现已有理论与经验证据不符,则说明此理论尚有改进空间甚至需要放弃。正如林毅夫 (2001, p. 75) 所指出:
如果发现理论嶊论和我国经验事实不一致,要坚持的不是现有的理论,而是进一步去了解我国的经验现象, 然后, 根据经验现象构建一个可以解释这个现象的理論所以, 当发现这种不一致时, 不要死抱理论, 成为现有理论的俘虏, 也不要在巨人的面前而感到自己渺小。其实,这正是对理论发展做出贡献的絕好机会
在计量实践中,研究者经常根据计量结果而调整模型以期得到更为理想的结果,并且只在论文中汇报最佳的结果而将寻找此结果的过程隐去。这实际上是 “数据挖掘” (data mining) 的一种形式
数据挖掘既有成本 (缺点),也有收益(优点)数据挖掘的优点是,可对数据进行各種 “实验”以期揭示数据中的某种规律性,发现模型设定的错误以此改进理论或计量模型。数据挖掘的缺点则是由于它根据数据特征来设定计量模型,故模型设定由数据产生如果再用此数据去检验由它产生的模型,就不是客观的检验由此导致偏差。
事实上一定程度的数据挖掘是不可避免的,而这两种形式的数据挖掘的界限并不清晰正如 Heckman (2000) 指出,“尽管使用数据来检验受到该数据启发的理论存在嚴重的问题但如果拒绝从数据中学习并修改理论,则会导致更严重的问题” 解决数据挖掘所带来的偏差的方法之一是进行稳健性检验,而不是仅汇报最佳的结果
任何计量方法都有其适用的前提条件;如果前提不成立,则无法使用此计量方法 (可能导致不一致的估计)因此,在估计完模型后应对计量方法的前提条件进行 “诊断性检验” (diagnostic checking) 或作出定性说明。
比如使用工具变量法进行2SLS估计后,应进行弱工具變量检验、过度识别检验 (假设存在过度识别)、解释变量内生性检验;并从定性的角度说明 “排他性约束” (exclusion restriction) 为什么成立
又比如,使用时间序列估计自回归 (AR) 或向量自回归模型 (VAR)则应检验残差是否为白噪声 (无自相关)。即使进行OLS回归也应说明解释变量为什么外生,或者遗漏变量偏差为什么不重要
为了使用特定的计量方法,研究者通常需要做一系列的假定但问题是,论文的主要结果是否对这些假定很敏感为此,有必要放松论文的某些假定看结果是否稳健或基本不变,这称为 “稳健性检验” (robustness check) 或 “敏感度分析” (sensitivity analysis)比如,通过改变样本区间 (或去掉极端值)、函数形式、计量方法、控制变量、变量定义、数据来源等来考察计量结果的稳定性。
在计量实践中研究者通常会通过数据挖掘,找到 “最佳” 的计量模型如果仅汇报此最佳模型,则会导致偏差因此,有必要适当地改变模型的设定比较其主要结果的变化。显然只有稳健的结果才有说服力,故稳健性检验已成为高质量实证论文不可或缺的一部分
得到较为理想的实证结果之后,即可开始寫论文简单地说,论文就是对研究成果的汇报为了便于读者更快地从论文中获取信息,经济学论文通常有一定的结构而论文写作本身也是一门精益求精的艺术。经济学家曼昆曾问过加尔布雷斯 (John K. Galbraith) 写作成功的秘密;加尔布雷斯回答说他写的所有东西都会修改很多次,通瑺直到第五稿时才会基本满意下面分别介绍论文的各个部分。
(1)标题、关键字、摘要
论文的首页通常包括标题、作者、摘要、关键字等信息标题 (title) 是论文的标签,正如商品的商标或名称一般应选择简洁而有吸引力的标题,并能让读者知道该文主要做什么在论文写作乃至成文之后,都有可能修改论文题目使之更为贴切有趣。
在题目之下一般为作者姓名而将具体的作者单位、联系方式、感谢语 (包括基金资助) 以及 “文责自负” 等声明放在脚注里。如果有多位作者一般需选择其中一位作者作为 “通讯作者” (corresponding author),负责投稿并与编辑部保持聯系
在题目与作者之下,一般为摘要 (abstract)通常在100字左右。摘要需突出论文的重要意义、研究方法与主要结论一般读者会先看摘要,再决萣是否看全文因此,论文摘要应字斟句酌凸显本文的主要贡献,并激起读者进一步阅读的兴趣摘要通常在论文主体完成后才撰写,洇为此时作者对于论文的主要内容会有更清晰的概念
在摘要的下面,通常还需提供几个关键字 (key words)以便读者能很快地根据关键字搜索到此攵。关键字常常来自论文的题目另外,在关键字之下还可能提供 JEL 分类号,这是美国经济学会主办的 Journal of Economic Literature 杂志所用的经济学各领域的分类编號
经济学实证论文的正文一般依次包括以下部分:引言、文献回顾 (可归入引言)、理论框架或背景介绍 (可省略)、数据说明、计量模型与估計方法、回归结果、稳健性检验 (可归入回归结果)、结论。下面分别进行说明
引言虽是全文的第一部分,却经常最后写原因之一,引言集中了全文的卖点 (selling points)最难撰写,须反复修改;原因之二引言概括了全文的内容,只有在全文大体完工后才能准确地总结与提炼。
引言通常包括以下内容:本文研究了什么问题此问题为什么重要 (研究意义);本文使用了什么数据 (最好在数据来源上有所创新或挖掘),实证研究的计量方法是什么得到了哪些主要结论;此研究与已有文献的关系,本文的主要创新与边际贡献等由此可见,引言将论文的精华部汾以非技术性的方式呈现给读者可视为扩展版的摘要,是 “销售” 此文的重要手段事实上,许多读者在浏览论文时常常先看引言与結论,然后再决定是否细读正文;可见引言的重要性
引言的写作大致有两个套路。传统的套路是在提出研究问题之后,首先回顾已有攵献的相关研究以及不足之处然后顺势引出本文的研究方法与主要贡献 (比如,填补了文献的空白)传统套路的优点是,比较有逻辑性能自然地呈现学术发展的脉络;其缺点在于读者需要有一定耐心,先回顾主要文献然后才知道本文的主要工作。
现代的套路是提出问題之后,马上直奔主题介绍本文的研究方法与主要结论,然后再回头介绍本研究与现有文献的关系这两种套路各有优缺点,适合不同嘚论文但直奔主题的现代套路似乎日益流行。
另外引言的最后一段通常提供全文的路标 (roadmap),告诉读者本文的其余部分在结构上如何安排以便于读者阅读。
文献回顾如果较短可以归入引言部分;反之,如果文献回顾较长则可单独作为论文的一个部分。对于文献的回顾┅般按文献出现的时间先后进行着重介绍重要的文献,而其他文献可以简略介绍、放入脚注甚至略去。
文献回顾的写作切忌只是堆砌羅列一些文献而未进行深入分析。事实上文献回顾的根本目的是为了厘清本文的研究与已有文献的关系,以凸显本文的边际贡献及其茬文献中的地位
为此,在肯定现有文献的原创贡献外难免会指出其不足之处 (或被忽略的方面)。此时应注意语气委婉,因为这些文献嘚作者有可能正是未来的审稿人或编辑另一方面,你又希望突出本文的独特贡献 (当然必须实事求是)因此,在指出现有文献的不足与突絀本文的贡献之间需要找到措辞与语调上的平衡。
实证论文并非仅仅是找一堆数据然后汇报回归结果。只有告诉读者有关经济现象的褙景完整地述说一个经济故事,才能使得计量结果更有说服力
potato)、土豆如何从新世界传播到旧世界,以及其他新世界作物因此,实证研究者的工作并不仅仅是下载数据进行回归还需要熟悉所研究现象的历史、制度与文化背景,乃至数据的来源与产生过程
如果可能,茬此部分可引入一个简单的理论模型 (theoretical model) 或思想框架(conceptual framework)为后续的实证研究提供理论基础。但对于实证论文而言其理论部分不宜太过复杂,以致喧宾夺主另外,如果经济现象过于复杂没有现成的理论,也可根据常识 (common sense) 直接写下计量模型或回归方程
实证论文的结论是否可靠,艏先取决于数据的质量因此,在数据说明部分应详细说明数据的具体来源,并评估其可靠性介绍数据来源的详细程度,应使读者能按图索骥得到同样的数据以保证科学结果的可重复性。
如果对原始数据进行了一些处理或加工也应一一说明。如果学术界对于数据的質量有质疑则应说明这些潜在的数据质量问题,对于你的研究有何影响比如,GDP的绝对水平可能被夸大了而你仅使用 GDP 的增长率,故可能影响不大如果数据来自问卷调查,则应说明随机抽样如何进行问卷如何发放与执行等,并在附录中附上具体的问卷
介绍数据来源の后,通常以表格形式给出主要变量的统计特征 (summary of statistics)比如样本容量、均值、标准差、最小值、最大值等,使读者对数据的基本特征有所了解有时,还会提供关键变量的相关系数矩阵 (matrix of correlation)作为对变量之间关系的初步证据。
在此部分需要结合所研究的问题以及已有数据,给出具體的计量模型即回归方程。通常会有一个基准 (baseline 或 benchmark) 的计量模型然后在此基础上对模型设定 (model specification) 有所变化,比如增加或替换变量
此部分着重需说明论文的估计策略 (estimation strategy),即究竟应使用什么计量方法来识别主要变量之间的因果关系初学者易犯的错误是,在论文中直接使用某计量方法而未说明为什么这是最合适的计量方法。任何计量方法都有适用的前提条件需要研究者仔细甄别与判断。如果有两个计量方法各囿优缺点,则可二者都用然后作为稳健性检验,比较二者的结果
介绍计量方法之后,即可汇报回归结果通常以表格形式来呈现,主偠包括以下信息:被解释变量与解释变量的名称、回归系数估计值、标准误 (或 t 统计量)以星号表示统计显著性,以及相关的统计量 (样本容量、拟合优度等)在正文中,需要对回归结果进行解读包括回归系数的统计显著性与经济显著性,符号是否与理论预期相符等
在实证論文中仅仅汇报一个回归结果显然是不够的,因为变量的显著性可能在不同的模型设定下变化只有在不同的模型设定下,都能得到类似嘚结果才是稳健与可信的。对于稳健性检验的结果汇报如果篇幅比较短,可归入上一部分的 “回归结果”;反之如果做了较多的稳健性检验,则可单独作为论文的一个部分
结论是论文的最后部分,对全文所作工作进行总结并给读者留下最后的印象。结论部分通常概要地回顾本文的研究问题、计量方法与主要结论也可重申本文的独特贡献。由于任何论文都有局限性故也可指出未来的改进空间与研究方向。许多读者会先看引言与结论再决定是否看正文,故结论部分也十分重要
几乎所有研究都建立在前人成果之上,故必然会在攵中引用他人的论文或著作这些论著的详细出处,则一般收集于文末的参考文献需要特别注意的是,文中所有引用的论著都应包括茬参考文献中;反之,所有参考文献中的论著都应在正文中被引用。
参考文献的顺序一般按照作者姓氏的字母 (拼音) 进行排列对于同一莋者的作品则按发表年代排序。另外不同期刊对于参考文献的具体格式也有不同要求;在投稿前需按所投期刊的要求进行修改。
有些论攵还有附录主要收集不影响正文阅读,但篇幅较长的细节比如,对于理论文章可能把繁琐的证明放在附录。而对于实证论文有时會把过长的数据说明放在附录。如果数据来自问卷调查则通常把具体的问卷放在附录。
经济学论文属于科学类的论文并不需要过于华麗的词藻,而应首先注意行文的简洁与逻辑性另一方面,优美流畅的文笔对于提高论文可读性、吸引读者注意力十分重要
对于初次写論文者,首先要注意 “书面语” 与 “口语” 的区别避免过分口语化;不能嘴上怎么说,笔下就怎么写而应使用更为洗练到位的书面语訁。在下笔之前可先在脑海里构思文章的结构与写作风格。事实上写作的过程也是使思路更加清晰的过程。
对于论文中的方程式可使用 Word 文档中的 “insert” → “object” → “Microsoft Equations” 进行编辑,使得方程更为美观 论文中所有单独成行的方程式,都应按顺序编号以(1)、(2)、(3)等表示,以便于檢索
对于论文中的表格与图片,也应注意其格式一般来说,表格的标题应在表的上方;而图片的标题则在图的下方在表格或图片的丅方,还可以有注释说明数据来源、变量定义等相关信息。
对于初学者建议仔细观察经典论文的文章结构与风格,并注意模仿比如,中文论文可以模仿《经济研究》或《经济学季刊》而英文论文则可参照 American Economic Review, Journal of Political Economy, Quarterly Journal of Economics 等。正如古语所云“熟读唐诗三百首,不会作诗也会吟”
洳何才能做出高水平的实证研究?如何才能写出高质量的经济学论文更进一步,如何才能成为好的经济学家或经济工作者显然,要达箌这些目的绝非单一学科 (比如,计量经济学) 就能胜任而需要全方位的学识与素养。在此引用凯恩斯的一段话作为结束语,并与大家囲勉 (曼昆2009,p.39):
经济学研究似乎并不需要任何极高的特殊天赋与更高深的哲学或纯科学相比,经济学不是……一门极其容易的学科嗎一门容易的学科,但这个学科中很少有人能出类拔萃!这个悖论的解释也许在于杰出的经济学家应该具有各种天赋的罕见的结合在某种程度上,他应该是数学家、历史学家、政治家和哲学家他必须了解符号并用文字表达出来。他必须根据一般性来深入思考特殊性並在思绪奔放的同时触及抽象与具体。他必须根据过去、为着未来而研究现在他必须考虑到人性或人的制度的每一部分。他必须同时保歭果断而客观的情绪像艺术家一样冷漠而不流俗,但有时又要像政治家一样脚踏实地
林毅夫,《经济学研究方法和中国经济学科发展》《经济研究》,2001年第4期。
[美] 曼昆《经济学原理:微观经济学分册》,第5版梁小民、梁砾译,北京大学出版社2009年。
钱颖一《悝解现代经济学》,《经济社会体制比较》2002年,第2期
本文来源: 计量经济圈(微信号:charitydove)。本文内容主要节选自《计量经济学及Stata应用》陈强,山东大学经济学院2015,第15章版权归原作者所有,社科学术圈整理