关于Hadoop描述不正确的是()。
A.一个分布式文件系统和并行执行环境
B.让用户便捷的处理海量数据
C.优势在于处理数据少计算量高的任务
D.Apache软件基金会下面的一个开源项目
A.一个分布式文件系统和并行执行环境
B.让用户便捷的处理海量数据
C.优势在于处理数据少计算量高的任务
D.Apache软件基金会下面的一个开源项目
B.Hive可以实现在大规模数据集上实现低延迟快速的查询
C.Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在作提交和调度的时候需要大量的开销
D.Hive查询操作过程严格遵循HadoopMapReduce的作用执行模型,Hive将用户的HiveQL语句通过解释器转换为MapReduceHadoop集群上
A.Hive最终将数据存储在HDFS中
B.HiveSQL其本质是执行的MapReduce任务
C.Hive是Hadoop平台的数据仓库工具
D.Hive对HBase有强依赖
A.是一种通过网络实现文件在多台主机上进行分布式存储的文件系统
B.所有的分布式文件系统的设计都是采用“客户机/服务器”(Client/Server)模式
C.谷歌开发了分布式文件系统GFS
D.Hadoop分布式文件系统(HadoopDistributedFileSystem,HDFS)是针对GFS的开源实现
A.能基于Atlas的Web页面查询用户的数据查询操作历史
B.能基于Atlas的Web页面浏览数据的血缘关系
C.能基于Atlas的Web页面标注元数据,为元数据分类
D.Atlas支持与Hive数据源的集成,可以实时获取Hive的元数据变化
A.Fifoschedular,先进后出的原则
B.Capacityschedular,计算能力调度器,选择占用最小、优先级高的先执行,依此类推
C.FCFS:每次调度就从就绪队列中选一个最先进入该队列的进程,为之分配处理机
D.Fairschedular:公平调度,所有的job具有相同的资源
A.Hadoop是一个由Apache基金会开发的分布式系统开源架构
B.Hadoop的初始设计思想来源于Google发布的学术论文
C.Hadoop在当前衍生的一系列优秀的开源项目,包括Hbase,Hive等
D.Hadoop的两个核心部分是HDFS和MapReduce计算框架
A.系统内不适合多表复杂关联,需要在数据进入HADOOP前做好数据关联
B.适合非低延迟数据处理
C.集群支持分布式并行写入,并发写入速度快
D.大数据的关联能力弱
A.DataWorks是基于MaxCompute作为计算引擎的
B.DataWorks是基于MaxCompute作为存储引擎的
C.DataWorks可以使用Hadoop作为底层引擎
D.DataWorks的底层计算引擎是