关于Hive,以下说法不正确的是:()
A.Hive是基于Hadoop的一个数据仓库,由Facebook开源,最初是用于解决海量结构化的日志数据统计问题
B.Hive定义了一种类似SQL的查询语言HQ,将SQL转化为MapRuduce任务,在Hadoop上执行
C.目前Hive支持MapRuduce、Tez的计算模型
D.Hive的表更新采用的是插入的方式
A.Hive是基于Hadoop的一个数据仓库,由Facebook开源,最初是用于解决海量结构化的日志数据统计问题
B.Hive定义了一种类似SQL的查询语言HQ,将SQL转化为MapRuduce任务,在Hadoop上执行
C.目前Hive支持MapRuduce、Tez的计算模型
D.Hive的表更新采用的是插入的方式
A.sqoop可以将HQL/SQL的执行结果导入到Oracle或者Hive
B.不能大于1M
C.sqoop使用参数-m(即--num-mappers)进行导数时,分布在每一个map上的数据是均匀的
D.sqoop将数据导入Oracle时遇到值的长度超长,sqoop会继续将正常的数据导入Oracle
A.hive中的join查询只支持等值链接,不支持非等值连接
B.hive的表一共有两种类型,内部表和外部表
C.hive默认仓库路径为/user/hive/warehouse/
D.hive支持数据删除和修改
A.数据加载时,overwrite关键字是必须的
B.删除表时,表中的数据可以同时删除掉
C.hive的内表和外表都可以修改location属性
D.Hive是在数据查询时进行模式验证,而不是加载的时候验证
A.Hive支持所有标准SQL语法
B.Hive底层采用的计算引擎是MapReduce
C.Hive提供的HQL语法,与传统SQL很类似
D.HiveServer可采用MySQL存储元数据信息
A.可以指定实例进行日志收集
B.可以指定节点IP进行收集
C.可以指定用户进行日志收集
D.可以指定时间段进行日志收集
A、Hive最佳使用场景是大数据集的批处理作业
B、Hive可以实现在大规模集群上实现低延迟快速查询
C、Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在提交作业和调度的时候需要大量的开销
D、Hive查询操作过程严格遵循HadoopMap Reduce的作用执行模型,Hive将用户的HiveSQL语句通过解释器转换为Map ReduceHadoop集群上
A.SparkSQL依赖Hive的元数据
B.SparkSQL的执行引擎为Sparkcore,Hive默认执行引擎为MapReduce
C.SparkSQL不可以使用Hive的自定义函数
D.SparkSQL兼容绝大部分Hive的语法和函数
B.Hive可以实现在大规模数据集上实现低延迟快速的查询
C.Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在作提交和调度的时候需要大量的开销
D.Hive查询操作过程严格遵循HadoopMapReduce的作用执行模型,Hive将用户的HiveQL语句通过解释器转换为MapReduceHadoop集群上
A.在sqlcontext.sql中直接使用sql读取hive表
B.在sqlcontext.sql中直接使用sql操作dataframe对象
C.在sqlcontext.sql中直接已经在sparksql中注册为表的对象
D.在sqlcontext.sql中直接使用sql读取mysql表