基于hadoop的大数据处理生态中,HBASE是一种什么组件?()
A.可视化组件
B.计算框架
C.分布式数据库
D.管理组件
A.可视化组件
B.计算框架
C.分布式数据库
D.管理组件
A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
B.Hadoop被视为事实上的大数据处理标准
C.Hadoop为海量数据提供存储的HDFS和对数据进行计算的MapReduce
D.Hadoop提供整个HDFS文件系统的命名空间管理,块管理等所有服务
A.系统内不适合多表复杂关联,需要在数据进入HADOOP前做好数据关联
B.适合非低延迟数据处理
C.集群支持分布式并行写入,并发写入速度快
D.大数据的关联能力弱
A.分为映射,映射为Map阶段
B.分为减速,减速为Reduce阶段
C.分为映射,映射为Reduce阶段
D.分为减速,减速为Map阶段
A.复杂的批量数据处理:MapReduce
B.基于历史数据的交互式查询:Impala
C.基于实时数据流的数据处理:Storm
D.图结构数据的计算:Hive
B.Hive可以实现在大规模数据集上实现低延迟快速的查询
C.Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在作提交和调度的时候需要大量的开销
D.Hive查询操作过程严格遵循HadoopMapReduce的作用执行模型,Hive将用户的HiveQL语句通过解释器转换为MapReduceHadoop集群上
A、Hive最佳使用场景是大数据集的批处理作业
B、Hive可以实现在大规模集群上实现低延迟快速查询
C、Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在提交作业和调度的时候需要大量的开销
D、Hive查询操作过程严格遵循HadoopMap Reduce的作用执行模型,Hive将用户的HiveSQL语句通过解释器转换为Map ReduceHadoop集群上
A.分布式文件存储系统(HDFS)
B.分布式计算框架(MapReduce)
C.分布式资源调度系统(Yarn)
D.数据处理方法(DPW)
A.DataWorks是基于MaxCompute作为计算引擎的
B.DataWorks是基于MaxCompute作为存储引擎的
C.DataWorks可以使用Hadoop作为底层引擎
D.DataWorks的底层计算引擎是