在Simmons模型中假设问题B为“你喜欢红色吗?”,而且调查者不知道喜欢红色的学生的比例,调查方法是将被调查者分成两批,做两次独立调查,且选答问题A的概率不同,试设计具体的调查方案并建立模型,估计有过作弊行为学生的比例。
本题利用ATTEND.RAW中的数据。
(i)在例6.3的模型中,推出
(iii)假设你用(priGPA-2.59)·(atndrte-82)取代priGP4(atndrte-82)。你将如何解释atndrte和priGPA的系数。
(i)写出一个方程,使之在控制其他因素的情况下,能让你估计出使用大麻对工资的影响。你应该能得出这样的结论:“每个月多抽5次大麻,估计会使工资改变x%。”
(ii)写出一个模型,使你能检验女性和男性在使用大麻对工资的影响上是否存在差异。你将怎样检验男女使用大麻的影响是没有差异的?
(iii)假设你认为最好按大麻使用量将人分为四类:不用者、浅尝者(每月1~5次)、适度者(每月6~10次)和重用者(每个月10次以上)。写出一个模型,使你能估计出使用大麻对工资的影响。
(iv)利用第(iii)部分的模型,详细解释如何检验使用大麻对工资没有影响的原假设。既要具体,又要包括对自由度的一个仔细列表。
(v)利用你搜集来的调查数据做因果推断会有哪些潜在的问题?
A.开塞露通便
B.口服缓泻剂
C.灌肠
D.导尿
E.多吃蔬菜、水果、粗粮
A.算出被正确分类为垃圾邮件/非垃圾邮件的邮件数量(或部分)
B.给看到的邮件贴上垃圾邮件的标签
C.将电子邮件分类为垃圾邮件或非垃圾邮件
D.以上都不是-这根本就不是一个机器学习问题
利用FERTIL1.RAW中的数据。
(i)对教材例13.1所估计的方程中,检验16岁时的生活环境是否对生育率产生影响(以大城市为基组)。报告F统计量的值及其p值。
(ii)检验16岁时所在区域(以南方为基组)是否对生育率产生影响。
(iii)令u为总体方程中的误差项。假设你认为u的方差随时间而变(但不随educ,age等而变)。那么刻画这一特点的一个模型是
利用这个模型去检验u的异方差性。(提示:你的F检验应有6和1122个自由度。)
(iv)在教材表13-1所估计的方程中增加交互项y74-educ,y76educ,···,y84-educ。解释这些项代表了什么?它们是联合显著的吗?
(1)如果真实的模型是Yi=β1Xi+μi,但你却拟合了一个带截距项的模型Yi=α0+α1Xi+νi,试评述这一设定误差的后果。
(2)在(1)中,假设真实的模型是带截距项的模型,而你却对过原点的模型进行了普通最小二乘回归。请评述这一模型误设的后果。
利用APPLE.RAW中的数据。这些电话调查数据是为了得到(假想的)“环保”苹果需求。调查者向每个家庭都(随机地)介绍了正常苹果和环保苹果的一组价格,并询问他们愿意购买每种苹果的磅数。
(i)对于样本中的660个家庭,有多少家庭报告称在预定价格上不愿意购买环保苹果?
(ii)变量ecolbs看上去在严格正值上具有连续分布吗?你的回答对ecolbs托宾模型的适当性有何含义?
(iii)以ecoprc、regprc、famic和hhsize作为解释变量,估计一个托宾模型。哪些变量在1%的水平上显著。
(iv)faminc和hhsize联合显著吗?
(v)第(iii)部分中价格变量系数的符号与你的预期一致吗?请解释。
(vi)令β1和β2为ecoprc和regprc的系数,相对一个双侧备择假设,检验假设H0:-β1=β2。报告检验的p值。(如果你的回归软件不能很容易地计算这种检验,你可能还要参考教材4.4节
(vii)对样本中的所有观测求E(ecolbslx)的估计值[见方程(17.25)],称之为ecolbsi。最大和最小拟合值是多少?
(viii)计算ecolbs,和ecolbsi之相关系数的平方。
(ix)现在,利用第(iii)部分中同样的解释变量,估计ecolbs的一个线性模型。为什么OLS估计值比托宾估计值小那么多?从拟合优度来看,托宾模型比线性模型更好吗?
(x)评价如下命题:“由于托宾模型的R,如此之小,所以估计的价格效应可能是不一致的。”
A.认知概念化
B.箭头向下技术
C.假设求证法
D.认知建构法
利用INTQRT.RAW中的数据。
在教材例18.7中,我们估计了六月期国库券持有期收益率的一个误差修正模型,其中三月期国库券持有期收益率的一阶滞后为解释变量。我们假定在方程中的协整参数为1。现在,添加Δhy3t-1的先导变化Δhy3t、同期变化Δhy3t-1和滞后变化Δhy3t-2。即估计方程
并用方程形式报告结果。相对于双侧备择假设,检验H:β=1.假定方程中已经有了足够多的先导和滞后,使得{hy3t-1}在这个方程中是严格外生的,我们不必担心序列相关。
(ii)在教材(18.39)中的误差修正模型中,添加{hy3t-1}和{hy6t-2-hy3t-3}。这两项是联合显著的吗?你认为怎样才是适当的误差修正模型?
(i)假设你可以搜集到1985年和1990年两个州驾龄人口的随机样本。令arrest表示一个二值变量, 如果一个人在当年曾因酒后驾车而被捕,它就等于1。在不控制任何其他因素的情况下,写下一个线性概率模型,以检验开瓶酒精饮料法是否降低了因酒后驾驶而被捕的概率。在你的模型中,哪个系数度量了这项法律的影响?
(ii)你为什么还想在模型中控制一些其他因素?这些因素有哪些?
(iii)现在假设你只能搜集到这两个州在1985年和1990年县一级水平上的数据。因变量是有驾照人员在本年度因酒后驾驶而被捕的比例。这个数据结构与第(i)部分中描述的个人水平上的数据结构有何不同?你将使用哪种计量经济方法?