A.数据清洗的目的是为了提高数据质量
B.空值一定要删除
C.数据预处理包括数据的清洗、合并、重塑与转换
D.在Pandas中,缺失值使用NaN表示
A.正态分布是由均数决定对称轴位置、由标准差决定形态的分布
B.对于相同的标准差,正态分布的95%分位数(P95)随均数减小而减小
C.正态分布规律可用于数据质量控制
D.正常居民的血铅浓度可用正态分布描述
A.粒度是指数据仓库小数据单元的详细程度和级别
B.数据越详细,粒度就越小,级别也就越高
C.数据综合度越高,粒度也就越大,级别也就越高
D.粒度的具体划分将直接影响数据仓库中的数据量以及查询质量
E.粒度的大小需要数据仓库在设计时在数据量大小与查询的详细程度之间作出权衡