您的位置:新文秘网>>毕业论文/文教论文/教育/>>正文

论文:出生排行、教育和教育回报率

发表时间:2015/7/20 21:44:19

论文:出生排行、教育和教育回报率

摘要
教育回报率的讨论和研究在中国已经有近20年了,尽管学者们普遍赞同中国教育回报率在逐年增加,但是由于教育与收入之间存在的内生性问题,教育回报率的大小尚未有定论。在本文当中,我们将使用difference-in-difference 的方法,应用2002年家庭动态社会调查数据估计教育回报率的大小。笔者发现在母亲非文盲的子样本当中,出生排行低的子女教育水平显著高于出生排行高的子女。通过使用出生排行与母亲教育水平的交叉相乘项作为工具变量做两阶段最小二乘法估计的教育回报率大于传统的Mincer方程的估计值。而后者由于内生性问题,会低估教育回报率 。同时,本文发现父亲晚婚对于后代的教育有正向影响,相反母亲晚婚对于子女的教育呈负向影响。

关键词:出生排行 教育回报率 Difference-in-Difference

1.导言
出生排行已经作为一个重要的因素被越来越多研究教育回报的经济学家所注意。经济学家发现在家庭中对于儿童无论是经济或是照料上的投入都会影响到孩子今后的成就。Black 等(2005) 发现出生排行对于教育回报起到了负向相关关系;同时考虑出生排行的因素后,家庭规模因素可以被忽略。另一方面,Steelman 和Powell (1985) 在探讨出生排行与学业成就的文章中发现,在出生排行和学业成就方面没有明显的相关性,但是出生排行在其他社会交往方面的能力有着明显的正相关性,比如外向、合群、受欢迎程度以及与朋友相处和谐等方面。直观的来讲,因为家庭资源的分配在儿童教育方面起着及其关键的作用,尤其是对于低收入家庭或家庭拮据的时期,所以父母对不同出生排行子女的偏好和时间的投入不同。短期会直接影响到孩子的营养水平和教育水平;而长期则会影响到孩子的其他社会经济成就包括收入等。这些结果已经被现有的相关文献所证实,如Lindert(1977),Kessler (1991)等。这一点同时与Becker和Lewis(1973),Becker和Tomes(1976)提出的子女数量与质量的平衡理论相关。

……(新文秘网https://www.wm114.cn省略1400字,正式会员可完整阅读)…… 
高时,由于生育能力的衰退,容易导致生育的孩子体重偏轻,从而使排行靠后的子女出生时的禀赋较差,进一步对成年后的教育水平产生不利影响。所以在该因素的作用下,排行效应将有负向影响。最后,出生排行还可能源于文化因素[ 该观点在Horton (1988)中有详细论述]。在中国文化中,长子在父母养老中担当着重要的角色,特别是在偏远的农村地区,这种角色尤为重要。在此种情况下,父母往往会把更多的家庭资源用来培养长子从而保证他们年老以后的养老。如果是这样的话,男性出生排行靠前的孩子将会得到较多的资源同时具有较高的教育水平。在另外一些文化当中,家庭当中最小的孩子会得到父母更多的关心和照顾,在该种文化背景中,出生排行靠后的子女通常会因为家庭资源的投入更多而拥有更高的教育水平。综上所述,出生排行作用对于孩子未来的教育水平有着重要的影响作用。但是因为上述多重复杂的因素都可能对“排行效应”产生影响,从而导致不同地区、不同时期“排行效应”的大小和方向有所不同,这取决于各种因素综合作用的结果。因此,如前所述,不同研究者对不同时期不同国家的数据进行研究,得到的“排行效应”也各有不同。

尽管国内学者也越来越重视出生排行对于子女教育水平、心理状态和成年之后的性格、收入等方面的影响。然而,由于两个方面的原因,国内对排行效应的研究仍然不足。一方面,由于我国在70年代末之后实行计划生育政策,使大多数家庭为一孩或者二孩家庭,使得出生排行在家庭内部的变化较小,以至于很少有数据能够用来进行相关的研究;令一方面,即使少数特殊数据集中包含较多的多孩家庭的样本信息,这些家庭当中的多数子女都还没有成年,仍然处在接受教育的时期,仅用当前的教育水平估计出生排行的效果也容易造成偏差。本文将使用2002年家庭动态社会调查数据集,利用“排行效应”对于教育的影响进行估计。由于该数据集中的样本均为成年样本,且包含较为详细的兄弟姐妹的信息以及父母相关信息,使得本研究可以弥补国内对于出生排行研究的不足,同时利用“排行效应”对教育回报率的估计。一直以来由于教育和收入之间的内生性问题很难得到有效的解决,使得对教育回报率的估计容易有偏。尽管出生排行对于儿童早期的影响较大,然而出生排行往往同时具有生理作用,这样的生理作用可能会影响到劳动力市场的表现,比如智力、能力等因素同时影响教育和工作中的表现。同时,教育水平受到很多家庭因素的影响,其中影响最大的是父母的偏好,父母的偏好不仅会影响到孩子的教育水平而且会影响到之后的工作状况。因此有学者使用双胞胎数据研究来克服可能因为家庭背景和生理影响等遗漏变量而导致的内生性问题。双胞胎的研究似乎很好地解决了内生性的问题,因为双胞胎的生育次序是一个外生的结果,同时这种外生的冲击会影响家庭内部资源和父母照料的分配,使得对家庭内部的相关因素的进一步研究成为可能。由于双胞胎数据具有上述优点,近年来有大量相关研究来使用双胞胎数据来研究生育排行的效应,尽管这个方法的合理性仍存在争议,而且结果也并不具备代表性。然而,双胞胎数据往往难以获得并且样本量通常较小,造成了该方法在可行性上的问题。这里我们考虑另外一种相对简便易行的方法,即是否能够考虑通过引入交叉相乘项克服可能存在的遗漏变量的内生性问题,从而得到无偏、一致的估计。

本文使用2002年家庭动态社会调查数据,采用difference-in-difference的方法,利用出生排行和母亲教育交叉相乘项估计出生排行对于教育的影响。我们发现显著的负相关关系,即出生排行靠前的子女教育水平显著高于出生排行靠后的子女,该结论对于母亲非文盲的子女来说尤其显著。进一步地,利用出生排行与母亲教育的交叉相乘项作为教育的工具变量估计子女的教育回报率。结果显示,2002年的教育回报率大约为9%左右。两阶段最小二乘法回归得到的结果比普通最小二乘法估计的教育回报率高。上述结论都与国内外相关文献的结果一致。

本文将分为以下几个部分进行论述:第二部分,我们将简单的介绍一下本文使用的数据和采用的估计方法;第三部分,在不同的模型设定下,估计出生排行对于教育水平的影响;第四部分,我们使用出生排行和父母教育交叉项作为工具变量,估计教育回报率,同时将估计结果与普通最小二乘法的回归结果进行对比分析和探讨,并将估计结果与之前相关文献对于教育回报率的估计结果进行比较。第五部分,文章的结论和扩展。

2.数据和估计策略
2.1 数据
本文所使用的数据来自2002年第三次中国健康长寿因素跟踪调查的补充子女数据,即2002年家庭动态社会调查数据。中国健康长寿因素跟踪调查(CLHLS)是由北京大学家庭与老年健康研究中心发起的、旨在研究高龄老人健康长寿因素的跟踪调查。该调查从1998年开始首次调查,并在2000、2002、2005年进行了三次跟踪调查。每次调查随机抽取全国22个省当中一半的县,基本对于全国高龄老人具有代表性。该数据当中包含了丰富的人口统计学信息、家庭社会经济信息、家庭支持、健康相关信息以及详细的生育信息,是国内研究老年问题的重要数据来源之一。中国家庭动态社会调查(FHDS)是由中国社会科学院人口与劳动经济研究所负责进行的调查。作为中国健康长寿因素跟踪调查的补充子女问卷,该调查最初旨在提供长寿调查[ 简称,即上述中国健康长寿因素跟踪调查]中老年人的部分子女信息,从而更好的帮助学者研究长寿人群的家庭、遗传的因素。FHDS当中的所有样本均来自于CLHLS所调查的22个省当中的9个省的老年人样本所对应的子女。对于每个被选中的老人的家户,随机抽取老人的一个子女进行调查,用该调查数据匹配相应的老年人数据。

虽然FHDS最初的用途是高龄老人的研究,但是幸运的是,这套数据中包含了诸多详细的个人和家庭信息,不仅包括了人口特征,社会经济等方面的内容比如教育,工作现状,收入等,还包括了其他关于父母兄弟姐妹的信息,包括父母的教育,退休前的工作,兄弟姐妹的数目和他们的出生排行。这套数据中提供给我们很多对于我们研究非常重要的信息,使得本文研究出生排行的影响成为可能。更为重要的是,这个数据样本的年龄结构为35到65岁,表明他们都是在1978年以前出生的,并未受到计划生育政策的影响,这给我们提供了一个很好的机会去考虑出生排行对于教育的影响。另外,该数据当中的所有样本都已经完成教育,使得对教育回报率的估计更加准确可靠。

同时,这套数据也有自身的不足之处——因为数据中每个家庭只包含了一个子女的数据,所以我们在文章中无法考虑家庭内的比较,从而可能因为无法完全控制家庭因素而造成估计结果的偏误。具体地讲,我们不能对比相同家庭中的不同子女的教育水平之间的差异,因此无法直接对比家庭内部特征对于出生排行和教育的影响,但是我们可以利用difference-in-difference的方法来改进我们的估计结果。

在本文中,我们将采用“你有几个仍在世的兄弟姐妹”,“有几个比你大,有几个比你小”等问题定义出生排行。当然,由于数据因素的局限,我们这里的估计也可能出现些微的误差——在调查前去世的兄弟姐妹,在我们定义的排行中将被忽略。这意味着,相对于真实值来讲,在部分的数据点可能定义值要低于真实值。为了保证估计的可靠性,我们从CLHLS的对应老年人所回答的问题“你一共生过多少小孩”以及“每个小孩的排行、年龄”等信息重新定义生育排行,结果显示两种定 ……(未完,全文共21869字,当前仅显示3934字,请阅读下面提示信息。收藏《论文:出生排行、教育和教育回报率》