A.Datanode负责处理文件系统客户端的文件读写请求
B.集群中的Datanode一般是一个节点一个
C.文件的副本系数由Datanode储存
D.Datanode进行数据块的创建、删除和复制工作
A.HDFS并不是一个单机文件系统,它是分布在多个集群节点上的文件系统
B.仅仅对数据进行冗余备份还不够,HDFS要有一个更有效的副本存放策略
C.对于HDFS来说,丢失一个Data Node意味着丢失了存储在它的硬盘上的数据块的副本
D.如果要存放数据的节点宕机,HDFS会再分配三个节点给数据块
A.BlockSize是不可以修改的
B.如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作
C.SecondaryNameNode应与NameNode部署到一个节点
D.以上都不对
A.hdfsfsck/test.txt-files
B.hdfsfsck/text.txt-locations
C.hdfsfsck/test.txt-blocks
D.hdfsfsck/test.txt-list-corruptfileblocks
A.冗余备份
B.副本存放
C.当HDFS读取某个数据块时,客户端会到其他节点上读取
D.对于HDFS来说,丢失一个DataNode意味着丢失了存储在它的硬盘上的数据块的副本
A.实时分析一般应用于电子商务和金融。需要在数据不断变化的情况下,进行快速的数据分析,并以非常短的延迟返回,才能达到不影响用户体验的目的
B.实时分析采用的架构包括,使用传统关系数据库的并行处理集群,或者采用实时计算架构,例如开源数据分析平台Storm
C.离线分析通常指分析时不需要联网的应用,例如机器学习,统计分析和推荐算法
D.离线分析的技术框架相对成熟,常用的分析框架是:HDFS做存储,MapReduce做计算框架,Hive作为数据仓库
A.Lustre设计前提是硬件不容易坏
B.Lustre中节点失效后部分数据不能访问
C.HDFS设计前提是硬件容易坏
D.HDFS中节点失效后不需要人工干预