在生物统计中,显著性检验常用的两种显著水平分别为:()、()。
利用BARIUM.RAW中的数据。
(i)在方程(10.22)中增加一个线性时间趋势。除了趋势变量以外的其他变量是统计上显著的吗?
(ii)在第(i)部分估计的方程中,检验除了时间趋势以外所有其他变量的联合显著性。你能得到什么结论?
(iii)在这个方程中添加月度虚拟变量,以检验季节性。增加月度虚拟变量对其他估计值及其标准误有重要影响吗?
使用GPA1.RAW中的数据。
(i)在估计方程(7.6)中增加变量mothcoll和fathcoll,并以通常的形式报告结果。拥有PC的估计影响会怎么样?PC还是统计显著的吗?
(ii)检验第(i)部分方程中mothcoll和fathcoll的联合显著性,不要忘记报告p值。
(iii)在第(i)部分的模型中增添hsGPA,并判断是否有必要进行这种扩展。
利用MEAP00 O1中的数据回答本题。
(i)使用OLS估计模型
并用通常的格式报告你的结论。在5%的显著性水平上,每个解释变量都是统计显著的吗?
(ii)求出第(i) 部分中回归的拟合值。拟合值的取值范围是多少?它与math4的实际数据取值范围相比如何?
(iii)求出第(i)部分中回归的残差。哪类学校具有最大的(正)残差?对这个残差给予解释。
(iv)在方程中增加所有解释变量的平方项,检验它们的联合显著性。你会把它们放到模型中吗?
(v)回到第(i)部分中的模型,将因变量和每个解释变量都除以各自的样本标准差,并重新进行回归。(除非你还将每个变量分别减去了各自的均值,否则还应该包括一个截距项。)以标准差为单位,哪个解释变量对数学考试通过率具有最大的影响?
利用BWGHT.RAW中的数据,可估计出如下方程:
变量定义和教材例4.9中一样,但我们增加了两个虚拟变量:一个虚拟变量表明孩子是不是男孩,另一个虚拟变量则表明这个孩子是不是白人。
(i)在第一个方程中,解释变量cigs的系数。具体而言,每天多抽10根烟对婴儿出生体重有何影响?
(ii)在第一个方程中,保持其他因素不变,预计一个白人孩子的出生体重比一个非白人孩子重多少?这个差异是统计显著的吗?
(iii)评价motheduc的估计影响和统计显著性。
(iv)从这些给定信息中,为什么不能计算出检验motheduc和fatheduc联合显著性的F统计量?为了计算这个统计量,还需要做些什么?
利用PNTSPRD.RAW中的数据。
(i)变量favwin是一个二值变量,在拉斯维加斯所押的球队胜出了预定的分数差时取值1。估计所押球队获胜概率的线性概率模型为
如果分数差包括了所有相关的信息,那我们预期β0=0.5。请解释。
(ii)用OLS估计第(i)部分的模型。相对于双侧备择假设检验H0:β0=0.5。同时使用通常的标准误和异方差一稳健的标准误。
(iii)spread在统计上显著吗?当spread=10时,被押球队获胜的估计概率是多少?
(iv)现在对P(favwin=Ilspread)估计一个概率单位模型。解释和检验截距项为0的虚拟假设。[提示:注意Φ(0)=0.5。]
(v)利用概率单位模型估计当spread=10时被押球队获胜的概率。并与第(iii)部分的LPM估计值相比较。
(vi)在概率单位模型中增加变量fuvhome、fav25和und25,并用似然比检验来检验这些变量的联合显著性。(x2分布中的自由度是多少?)解释这个结果,注意分数差是否包括了赛前可观测到的全部信息这个问题。
利用APPLE.RAW来验证命题。
(i)做ecolbs对ecoprc和regprc的回归,并以常用形式报告结论,包括R2和调整R2解释价格变量的系数,并评论它们的符号和大小。
(ii)价格变量统计显著吗?报告个别t检验的P值。
(iii)ecolbs拟合值的范围是什么?样本报告ecolbs=0比例是什么?请评论。
(iv)你认为价格变量很好地解释了ecolbs中的变化吗?请解释。
(v)在第(i)部分的回归中增加变量faminc,hhsize(家庭规模),educ和age。求它们联合显著的P值。你得到什么结论?
(i)变量train是工作培训指标变量。样本中有多少人参与了工作培训项目?一个男人实际参加工作培训最多达几个月?
(ii)将train对unem74,unem75,age,educ,black,hisp和married等几个人口统计和培训前变量做一个线性回归。这些变量在5%的显著性水平上联合显著吗?
(iii)估计第(ii)部分中线性模型的一个概率单位形式。计算所有变量联合显著性的似然比检验。你得到什么结论?
(iv)基于第(ii)部分和第(iii)部分的答案,为解释1978年的失业状况,参与工作培训可视为外生变量吗?请解释。
(v)做unem78对train的简单回归,并以方程形式报告结果。估计参与工作培训项目对1978年失业的概率有何影响?它统计显著吗?
(vi)做unem78对train的概率单位模型。将train的概率单位系数与第(v)部分线性模型中得到的系数相比较有意义吗?
(vii)求出第(v)部分与第(vi)部分的拟合概率。解释它们为什么相同。为了度量工作培训项目的效果和统计显著性,你将采用哪个方法?
(viii)在第(v)部分与第(vi)部分模型中将第(ii)部分中的所有变量作为额外控制变量。现在拟合概率还相同吗?它们之间有何关系?
本题要用到MLB1.RAW中的数据。
(i)使用方程(4.31)中所估计的模型,并去掉变量rbisyr。hrunsyr的统计显著性会怎么样?hrunsyr的系数大小又会怎么样?
(ii)在第(i) 部分的模型中增加变量runsyr(每年垒得分),fldperc(防备率)和sbasesyr(每年盗垒数) 。这些因素中,哪一个是个别显著的?
(iii)在第(ii)部分的模型中, 检验bavg, fldperc和sbasesyr的联合显著性。
A.检验两个变量间是否存在线性相关关系的问题便是对回归方程的显著性检验问题
B.建立回归方程的目的是表达两个具有线性相关的变量间的定量关系,因此只有当两个变量间具有线性关系,即回归是显著的,这时建立的回归方程才是有意义的
C.求两个变量间相关系数,对于给定的显著水平α,当相关系数r的绝对值大于临界值r1-α/2(n-2)时,便认为两个变量间存在线性相关关系,所求得的回归是显著的,即回归方程是有意义的
D.为了推广到多元线性回归场合,另一种检验方法是方差分析的方法
E.当SR、SE、fA、fE已知,对于给定的显著性水平α,当F<F1-α(fR,fE)时,认为回归方程显著,即是有意义的