实证论文写作分为哪几个阶段?
首先,让我们来看看什么是实证分析。它是通过测量模型和数据来识别和推断解释变量和被解释变量之间的因果关系。这种因果关系也可以称为需要测试的假设。实证研究有四个阶段: 第一阶段:检查准备。本准备工作主要包括:描述性统计和诊断检查。 第二阶段:检验假说。这通常被称为基准回归部分。 第三阶段:保护假说。这种保护是针对可能困扰第二阶段检验假说的问题,主要工作如下:①处理一些复杂的测量问题,如内生问题。②稳定性检查。 第四阶段:进一步讨论。根据估计结果,结合相关文献排除其他竞争性理论解释。 1.检验准备 让我们来看看检查的准备工作。第一个准备检验的是描述性统计。描述性统计是什么?描述性统计是对样本进行整理,计算变量的基本统计(平均值、百分比等)、制作变量交互列表,做一些初步的图解分析等。描述性统计有两个基本功能: ①介绍样本数据的基本情况,提供实证分析的基本事实背景,为需要检验的因果关系铺平道路。 ②利用分组、列联表、散点图、相关系数表等分析工具,对待检验假设的“雏形”进行初步调查,即核心自变量与因变量的相关性。二是诊断性检查。诊断检查主要是为了证明样本数据的选择是合理的,至少从数据统计分布的角度来看是合理的。 任何测量方法都有其适用的先决条件,例如,我们通常使用的OLS模型要求数据符合正态分布。若前提条件不成立,则不能采用此测量方法,否则可能导致估计结果不一致。在使用模型进行估计之前,应对测量方法的前提进行诊断性检查。例如,在使用工具变量法进行估计后,应进行弱工具变量检查、过度识别检查、解释变量内生性检查等。 2.检验假说 检验假说在给出检验结果并为测量模型提供选择依据后,进入了检验假说的正式阶段。这一环节主要是根据基准回归结果来检验假设是否成立。在研究设计中明确了假设是否通过检验的判断标准。假设能否通过,首先要注意模型对数据的整体拟合,这是模型估计整体性能的统计,如R2、F检验统计量,Durbin-Watson检验统计等。 对核心自变量的估计结果要注意和调查: ①显著性是关注的焦点,包括统计显著性和经济显著性。 ②详细讨论了主要回归系数(或由回归系数引起的弹性、乘数等)的估计值和符号。还应注意:核心变量回归系数不明显,正确的做法是保持谨慎的态度,积极讨论原因。 不能过度解释不显著的估计值,特别是不能声称不显著的估计值支持或不支持某些特定的结论。我们应该知道,估计值是否显著意味着所使用的数据不能提供足够的信息。如果没有足够的信息,我们就不能或做出任何确切的结论。 另外,对于核心自变量不显著,甚至符号与预期相反的情况,可以从以下三个方面进一步检查: ①检查所采用的测量方法是否合理。 ②检查数据质量是否有问题。 ③检查经济理论是否存在问题。 3.保护假说 保护假说中的“保护”是指解除干扰假说使其难以通过测量检验而无法建立的潜在威胁。假设有两条防线:第一条防线是考虑和处理相关的测量问题,第二条防线是稳定性检验。在实证分析中,由于数据、研究设计和估计方法等原因,往往难以实现有效的识别和推断。以上两条防线是为了消除识别、推断和假设检验的疑虑而设置的。第一道防线是将未考虑的相关测量问题重新纳入分析框架,并参照处理后的估计结果重新审视假设检验;第二道防线是通过改变情况重新审视检查的假设。 保护假说需要注意两个问题,一是处理相关的测量问题。需要处理相关的计量问题: ①认真了解数据的生成过程; ②探讨计量问题的原因,从而判断所采用的改进方法是否有效; ③将自己处理这个问题的想法和做法与类似的研究进行比较,思考自己是否有竞争力。相关测量问题的产生一般来自数据与估计方法以及两者之间的矛盾。从根本上说,通常遇到的测量问题可以归因于遗漏变量问题。 在非实验数据中,遗漏变量问题几乎是不可避免的,主要包括以下两种情况: ①有遗漏变量,但与解释变量无关,此时只需说明为什么不相关,不能处理。 ②有遗漏变量,与解释变量有关,必须进行处理,包括增加控制变量、寻找代理变量、使用工具变量、使用面板数据等。 二是稳定性检查。稳定性检查是通过改变样本区间(或去除极端值)来进行的、调查主要估计结果的变化和稳定性,包括函数形式、测量方法、控制变量、变量定义、数据源等。在正常的训练过程中,初学者经常跑数据,反复跑,一定程度的数据挖掘是不可避免的,但我们必须注意数据挖掘可能带来的偏差,以及跑数据的正确态度。 数据挖掘不应被视为唯一的,也不应排除识别隐患的其他可能性;同时,在反复尝试和比较分析各种想法和相应数据回归结果的过程中,还需要将数据导入计量软件,尝试不同的研究思路,反思理论。稳定性检查不同于敏感性检查。前者强调功能机制的再检查、功能方向和显著性;后者强调核心变量考虑变量功能大小的稳定性,估计系数大小及其变化是关注的焦点。 4.讨论假说 大多数实证研究都希望揭示x对y的因果作用,从回归分析到因果关系的升华是一个巨大的飞跃,这也是识别和推断的真正意义。回归分析通常只能确认变量之间的相关性。为了判断变量之间的因果关系,我们通常需要依靠经济理论。讨论假设是试图从假设、数据、估计结果、经验解释和理论等方面进行综合审查的假设。 两个问题需要进一步解决: ①估计结果不能统一、模棱两可,甚至自相矛盾。 ②根据相关估计结果,可能会有各种竞争理论解释。 相对而言,数据引起的测量问题在保护假说中得到了解决,因此理论分析是讨论假说的关键。