下面关于hadoop2相对于hadoop1.x的优化说法错误的是()。
A.加入了yarn解决了资源调度的问题
B.HDFS增强了NameNode的水平扩展及可用性
C.引入HBase列数据库代替传统关系型数据库
D.MapReduce拆分JobTracker为资源管理及任务生命周期管理两个独立的组件
A.加入了yarn解决了资源调度的问题
B.HDFS增强了NameNode的水平扩展及可用性
C.引入HBase列数据库代替传统关系型数据库
D.MapReduce拆分JobTracker为资源管理及任务生命周期管理两个独立的组件
A.Fifoschedular,先进后出的原则
B.Capacityschedular,计算能力调度器,选择占用最小、优先级高的先执行,依此类推
C.FCFS:每次调度就从就绪队列中选一个最先进入该队列的进程,为之分配处理机
D.Fairschedular:公平调度,所有的job具有相同的资源
A.ResourceManager(JobTracker)
B.NodeManager(TaskTracker)
C.JournalNode
D.NameNode
A.写入数据的时候会写到不同机架的DataNode中
B.如果一个机架出问题,不会影响数据读写
C.MapReduce会根据机架获取离自己比较近的网络数据
D.机架感知是Hadoop默认配置,无需再做配置设置
A.Hive最终将数据存储在HDFS中
B.HiveSQL其本质是执行的MapReduce任务
C.Hive是Hadoop平台的数据仓库工具
D.Hive对HBase有强依赖
A.hadoop的文件API不是通用的,只用于HDFS文件系统
B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础
C.FileStatus对象存储文件和目录的元数据
D.FSDataInputStream是java、io、DataInputStream的子类
B.Hive可以实现在大规模数据集上实现低延迟快速的查询
C.Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在作提交和调度的时候需要大量的开销
D.Hive查询操作过程严格遵循HadoopMapReduce的作用执行模型,Hive将用户的HiveQL语句通过解释器转换为MapReduceHadoop集群上
A.两者都起守护进程,且守护进程运行在一台机器上
B.单机模式不使用HDFS,但加载守护进程
C.两者都不与守护进程交互,避免复杂性
D.后者比前者增加了HDFS输入输出以及可检查内存使用情况
A.是一种通过网络实现文件在多台主机上进行分布式存储的文件系统
B.所有的分布式文件系统的设计都是采用“客户机/服务器”(Client/Server)模式
C.谷歌开发了分布式文件系统GFS
D.Hadoop分布式文件系统(HadoopDistributedFileSystem,HDFS)是针对GFS的开源实现