下列关于Spark说法错误的是()
A.Spark是用于大规模数据存储的NoSQL数据库
B.Spark的计算模式也属于MapReduce
C.Spark可以完全代替Hadoop
D.Spark可以进行实时数据流的数据处理
A.Spark是用于大规模数据存储的NoSQL数据库
B.Spark的计算模式也属于MapReduce
C.Spark可以完全代替Hadoop
D.Spark可以进行实时数据流的数据处理
A.sqoop可以使用spark进行数据采集
B.sqoop默认采用的mapreduce进行数据采集
C.sqoop属于b/s架构
D.sqoop只能采集某个表的数据
A.Spark是一个基于内存迭代的框架
B.Spark是一个数据分析技术栈,包含了大数据的多种计算模式
C.Spark可以采用多种编程语言进行开发,比如Scal
D.Java
E.Spark计算过程中,数据不会落地到磁盘
A.一个Application由若干个Job组成
B.一个Job由若干个Stage组成
C.一个Stage由若干个Task组成
D.RDD中的数据可修改
A.dataframe是指定列名称的dataset
B.dataframe提供详细的结构信息
C.dataframe不是面向对象的
D.dataframe在序列化与反序列化时,要对数据和数据结构进行序列化
B.Carbon使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少60%-80%数据存储空间,大大节省硬件存储成本
C.Carbon是一种新型的ApacheHadoop本地文件格式,使用先进的列式存储.索引.压缩和编码技术,以提高计算效率,有助于加速超过PB数量级的数据查询,可用于更换的交互查询
D.Carbon也是一种将数据源与Spark集成的高性能分析引擎