A.Spark引进了弹性分布式数据集RDD(ResilientDistributedDataset)的抽象,容错性高
B.Spark提供的数据集操作类型不仅限于Map和Reduce,大致分为:Transformations和Actions两大类
C.Spark程序由Python语言进行编写,不支持Java语言进行的程序编写
D.Spark把中间数据放到内存中,迭代运算效率高
A.hadoop的文件API不是通用的,只用于HDFS文件系统
B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础
C.FileStatus对象存储文件和目录的元数据
D.FSDataInputStream是java、io、DataInputStream的子类
A.Hadoop是一个由Apache基金会开发的分布式系统开源架构
B.Hadoop的初始设计思想来源于Google发布的学术论文
C.Hadoop在当前衍生的一系列优秀的开源项目,包括Hbase,Hive等
D.Hadoop的两个核心部分是HDFS和MapReduce计算框架
A.这是较少使用的一个模式
B.单机模式适用于开发过程中运行MapReduce程序
C.这是一个可以用于学习的模式
D.这是一个可用于生产环境的模式