![](https://static.youtibao.com/asksite/comm/h5/images/m_q_title.png)
假定你作为一个数据挖掘顾问,受雇于一家因特网搜索引擎公司,下列属于使用数据挖掘方法为公司提供帮助的是()。
A.使用离群点挖掘发现与大部分对象不同的对象,用于分析针对网络的秘密收集信息的攻击
B.使用人工查询公司网络故障信息,查找原因进行记录
C.使用关联规则发现大型数据集中间存在的关系,用于推荐搜索
D.使用分类对客户进行等级划分,从而实施不同的服务
E.使用聚类算法发现互联网中的不同群体,用于网络社区发现
![](https://static.youtibao.com/asksite/comm/h5/images/solist_ts.png)
A.使用离群点挖掘发现与大部分对象不同的对象,用于分析针对网络的秘密收集信息的攻击
B.使用人工查询公司网络故障信息,查找原因进行记录
C.使用关联规则发现大型数据集中间存在的关系,用于推荐搜索
D.使用分类对客户进行等级划分,从而实施不同的服务
E.使用聚类算法发现互联网中的不同群体,用于网络社区发现
A.退出
B.妥协
C.平滑
D.强制
利用CEMENT.RAW中的数据。
(i)将水泥价格月增长率(gprc)作为供给数量增长率(gce)函数,写出静态供给函数是
其中,gprcpet(汽油价格上涨率)被假定为外生变量,而feb,···,dec为月度虚拟变量。你预期a1和β1的符号是什么?用OLS估计这个方程。供给函数向上倾斜吗?
(ii)变量gdefs是美国真实国防支出的月增长率。gdefs要作为gcem的一个好的工具变量,你需要对它做什么假定?检验gcem是否与gdefs偏相关。(不用担心约简型中可能的序列相关。)你能用gdefs作为估计供给函数中的一个Ⅳ吗?
(iii)谢伊(Shea,1993)认为建住宅楼的产出增长率(gres)和非住宅楼的产出增长率(gnon)是gcem的有效工具变量。其思想是,存在一些应该与供给误差项u,大致无关的需求移动因子。检验gcem是否与gres和gnon偏相关;同样不用担心约简型中的序列相关。
(iv)利用gres和gnon作为gcem的工具变量估计供给函数。你对水泥的静态供给函数得到什么结论?[动态供给函数显然是向上倾斜的;参见Shea(1993)。]
问:樊某的行为是否构成累犯?
(i)你为什么会把这些数据归类为聚类样本?大致上,你预期能从一个典型学生得到大概多少次观测?
(ii)写出一个类似于教材方程(14.12)那样的模型,用到课率和其他特征去解释期终考试成绩。以s作为学生下标和c作为课程下标,对同一个学生哪个变量是不变的?
(iii)如果你把所有的数据混合起来并使用OLS,那么,对影响成绩和到课率的非观测学生特征,你正在做什么假定呢?SAT和学期前GPA在这方面扮演着什么角色呢?
(iv)如果你认为SAT和学期前GPA不足以刻画学生能力,你如何估计到课率对期终考试成绩的影响呢?
参考答案:
6.利用计量经济软件中的“聚类”选项,便得到教材表14-2中混合OLS估计值充分稳健[即对复合误差(vit:t=1,···,T)中的序列相关和异方差性保持稳健]的标准误为:
(i)这些标准误与非稳健标准误相比一般如何?为什么?
(ii)混合OLS的稳健标准误与RE的标准误相比如何?解释变量是否随时间变化有什么关系吗?
A.改革开放初期通过小商品贸易而很快致富的个体户,他们是第一批“先富起来”的人
B.许多高校教师退休后到民办高校兼课,在发挥余热的同时也能获得可观的经济收入
C.一批“精英”在IT行业大显身手,创办了一批著名网站、许多软件公司和网络营销公司
D.李某大学毕业后租房开办了一家书屋,兼营售书、租书、代购图书和网络购书业务
A.234000
B.200000
C.140400
D.480000
A.从数据中移除停用词(stopwords)将会影响数据的维度
B.数据中词的归一化将会减少数据的维度
C.转化所有的小写单词将不会影响数据的维度