关于Spark分布式并行计算框架描述不正确的是()。
A.适合迭代式任务
B.实时接收数据流
C.数据缓冲内存
D.适合批处理任务
A.适合迭代式任务
B.实时接收数据流
C.数据缓冲内存
D.适合批处理任务
A.NoSQL数据库因为不受schema的限制,可以获得比传统关系型数据库更好的读写性能,因此,所有应用都可以使用NoSQL数据库替代关系型数据库。
B.NoSQL数据库类型可以分为键值型NoSQL数据库,文档型NoSQL数据库,列存储型NoSQL数据库和图NoSQL数据库
C.Redis是单纯的内存数据库,不提供数据持久化功能,因此可靠性很低。
D.Spark分布式计算框架可以支持多种计算模式,包括批处理、流处理和SQL查询。
A.RDD具有血统机制(Lineage)
B.RDD默认存储在磁盘
C.RDD是一个只读的,可分区的分布式数据集
D.RDD是Spark对基础数据的抽象
A.MR框架过多的磁盘操作,缺乏对分布式内存的支持
B.MR框架无法高效地支持迭代式计算
C.MR框架无法高效地支持交互式数据挖掘任务
D.MR框架无法进行分析性计算任务
A.Spark是一个基于内存迭代的框架
B.Spark是一个数据分析技术栈,包含了大数据的多种计算模式
C.Spark可以采用多种编程语言进行开发,比如Scal
D.Java
E.Spark计算过程中,数据不会落地到磁盘
A.水平扩容,DDM在不中断业务的情况下,支持新增RDS实例,水平扩容存储空间
B.数据分布式存储,DDM采用水平拆分方式,将数据记录数庞大的单个数据库按指定的规则拆分,分布式存储到各个分片中
C.读写分离,用户可以根据数据读取压力负载情况,为每个RDS实例配置一个或者多个只读实例,提高查询并发性能
D.高性能,DDM实例关联多个RDS节点,同时实现并行计算
A.MapReduce程序只能用Java写
B.MapReduce是一种计算框架
C.MapReduce来源于google的学术论文
D.MapReduce隐藏了并行计算的细节,方便使用
A.RDD是一个只读的,课分区的分布式数据集
B.RDD是Spark对基础数据的抽象
C.RDD具有血统机制(Lineage)
D.RDD默认存储在磁盘
A.MapReduce是一种计算框架
B.MapReduce来源于google的学术论文
C.MapReduce程序只能用java语言编写
D.MapReduce隐藏了并行计算的细节,方便使用