考虑一个雇员水平的模型 其中无法观测变量f是在一个给定的企业i内,对每个雇员的“企业效应”。误
考虑一个雇员水平的模型
其中无法观测变量f是在一个给定的企业i内,对每个雇员的“企业效应”。误差项vi,e是企业i中雇员e所独具的。诸如方程(8.28)中的综合误差就是ui,e=fi+ui,e.
(iv)讨论第(ii)部分对于利用企业层次的平均数据进行WLS估计的意义,其中第i次观测所用的权数就是通常的企业规模。
考虑一个雇员水平的模型
其中无法观测变量f是在一个给定的企业i内,对每个雇员的“企业效应”。误差项vi,e是企业i中雇员e所独具的。诸如方程(8.28)中的综合误差就是ui,e=fi+ui,e.
(iv)讨论第(ii)部分对于利用企业层次的平均数据进行WLS估计的意义,其中第i次观测所用的权数就是通常的企业规模。
本题使用JTRAIN.RAW中的数据。
(i)考虑简单回归模型
其中,scrap表示企业的废品率,grant表示是否得到工作培训津贴的一个虚拟变量。你能想到u中的无法观测因素可能会与grant相关的原因吗?
(ii)利用1988年的数据估计这个简单的回归模型。(你应该有54个观测。)得到工作培训津贴显著地降低了企业的废品率吗?
(iii)现在增加一个解释变量log(scrap87)。这将如何改变grant的估计影响?解释grant的系数。相对于单侧备择假设它在5%的显著性水平上统计显著吗?
(iv)相对双侧备择假设,检验log(scrapg)的参数为1的虚拟假设。报告检验的P值。
(v)利用异方差-稳健标准误,重复第(iii)步和第(iv)步,并简要讨论任何明显的差异。
为了检验工作培训项目对工人以后工资的有效性,我们设定了模型
其中,train表示的虚拟变量,在工人参与这个项目时取值1.想象误差项包括了无法观测的工人能力。如果能力越低的工人被选派去参加这个项目的机会就越大,而且你使用了一个OLS分析,那么你认为β1的OLS估计量可能有什么样的偏误?
A.K-Means算法
B.Apriori算法
C.最大期望算法
D.KNN算法
本题利用AIRFARE.RAW中的数据。在一个联立方程非观测效应模型中, 需求方程为:
其中我们把航线距离变量放到ait中。
(i)利用固定效应模型估计需求函数,为了解释不同的截距,必须包括年度虚拟变量。弹性估计值是多少?
(ii)利用固定效应模型估计如下约简型方程:
进行适当的检验, 以保证concenit 可用作log(fareit ) 的一个工具变量。
(iii)现在,就像在方程(16.42)中一样,利用固定效应变换和工具变量法估计这个需求函数。现在的估计弹性是多少?它在统计上显著吗?
(i)考虑静态非观测效应模型
其中,enrolit表示学区总注册学生人数,lunchit表示学区中学生有资格享受学校午餐计划的百分数。(因此lunchit是学区贫穷率的一个相当好的度量指标。)证明:若平均每个学生的真实支出提高10%,则math4it约改变β1/10个百分点。
(ii)利用一阶差分估计第(i)部分中的模型。最简单的方法就是在一阶差分方程中包含一个截距项和1994~1998年度虚拟变量。解释支出变量的系数。
(iii)现在,在模型中添加支出变量的一阶滞后,并用一阶差分重新估计。注意你又失去了一年的数据,所以你只能用始于1994年的变化。讨论即期和滞后支出变量的系数和显著性。
(iv)求第(iii)部分中一阶差分回归的异方差-稳健标准误。支出变量的这些标准误与第(iii)部分相比如何?
(v)现在,求对异方差性和序列相关都保持稳健的标准误。这对滞后支出变量的显著性有何影响?
(vi)通过进行一个AR(1)序列相关检验,验证差分误差rit=Δuit含有负序列相关。
(vii)基于充分稳健的联合检验,模型中有必要包含学生注册人数和午餐项目变量吗?
响。帕普克还使用了一个容许每个城市都有其时间趋势的模型:
其中,αi和ci都是非观测效应,这样就可以考虑城市之间更多的异质性。
(i)证明:如果对上述方程取差分便得到
注意在此差分方程中包含一个固定效应ci。
(ii)用固定效应法估计差分方程。β1的估计值是什么?它和教材例13.8中的估计值有很大差别吗?企业园区的作用仍是统计显著的吗?
(iii)在第(ii)部分的估计中添加全部年度虚拟变量,β1的估计值有何变化?
令d表示一个(--值)虚拟变量,并令:表示一个定量变量。考虑模型
这是含有一个虚拟变量和一个定量变量之交互作用的一般性模型[方程(7.17)中有一个例子]。
(i)由于没有重大变化,所以取误差为u=0.于是,当d=0时,我们可以把y和z之间的关系写成函数 。当d=1时,同样写出y和z之间的关系,其中左边应该使用f1(z),以表示Z的线性函数。
其中所有系数和标准误都保留到小数点后三位。利用这个方程, 求出使得男女log(zo age) 的预测值相等的totcoll值。
(iv)基于第(iii)部分中的方程,女人能现实地获得足够多的大学教育而赶上男人的工资吗?请解释。
考虑一个简单模型,来估计选择一门先修课程对大学入门考试最终成绩的影响(其中course是一个学生选择先修课程的二值变量):
score=β0+β1course+u
(i)为什么course可能与u相关?
(ii)course有可能与父母的年收入相关吗?如果相关,这是否意味着父母的收入是course的好的IV?为什么?
(ii)假设每个学校有20%的学生可以获得该课程的学费减免,而获得学费减免的学生是随机挑选的。仔细解释你如何利用这一信息为course构造一个工具变量。
(i)用混合OLS估计一个以学期GPA(trmgpa)为因变量的模型。解释变量是sprng,sat,hsperc,feale,black,white,frestsem,tothrs,crsgpa和season。试解释season的系数。它统计显著吗?
(ii)在仅参与秋季运动项目的运动员中,大多数是足球运动员。假定足球运动员的能力水平和其他运动员的能力水平有系统差异。如果SAT分数和中学成绩百分位数不能很好地反映一个人的能力水平,那么混合OLS估计量将是有偏误的。试解释。
(iii)现在,取两个学期数据的差分,问哪些变量将随之消失?现在检验赛季效应。
(iv)你能想象一个或多个有潜在重要性而又不随时间而变化的变量,在此分析中被我们忽略了吗?
利用WAGEPAN.RAW中的数据。
(i)考虑非观测效应模型
(ii)用FD估计第(i)部分中的方程,并检验不同时期的教育回报没有变化的原假设。
(iii)利用一个足够稳健的检验,也就是容许FD误差Δuir中存在任何形式的异方差和序列相关的检验,检验第(ii)部分中的假设。你的结论有变化吗?
(iv)现在,容许是否加入工会的差别(与受教育水平一起)在不同时期有所变化,用FD估计这个方程。1980年加入工会与不加入工会的估计工资差别是多少?1987年呢?这个差别在统计上显著吗?
(v)检验工会关系差别在不同时期没有发生变化的原假设,并根据你对第(iv)部分的回答讨论你的结论。