关于Hive与传统数据仓库的对比,下列描述错误的是:()。
A.Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,二传统数据仓库数据应用单一,灵活性低
B.Hive基于HDFS存储,理论上存储可以无限扩容,而传统数据仓库存储量有上限
C.由于Hive的数据存储在HDFS上,所以可以保证数据的高容错,高可靠
D.由于Hive基于大数据平台,所以查询效率比传统数据仓库快
A.Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,二传统数据仓库数据应用单一,灵活性低
B.Hive基于HDFS存储,理论上存储可以无限扩容,而传统数据仓库存储量有上限
C.由于Hive的数据存储在HDFS上,所以可以保证数据的高容错,高可靠
D.由于Hive基于大数据平台,所以查询效率比传统数据仓库快
A.Hive最终将数据存储在HDFS中
B.HiveSQL其本质是执行的MapReduce任务
C.Hive是Hadoop平台的数据仓库工具
D.Hive对HBase有强依赖
A.Hive支持所有标准SQL语法
B.Hive底层采用的计算引擎是MapReduce
C.Hive提供的HQL语法,与传统SQL很类似
D.HiveServer可采用MySQL存储元数据信息
A.Hadoop
B.Impala
C.Spark
D.BigTable
A.SparkSQL依赖Hive的元数据
B.SparkSQL的执行引擎为Sparkcore,Hive默认执行引擎为MapReduce
C.SparkSQL不可以使用Hive的自定义函数
D.SparkSQL兼容绝大部分Hive的语法和函数
在下面关于新型数据库的说法中,错误的是()。
A.数据仓库不是一个新的平台,仍然使用传统的数据库管理系统
B.分布式数据库是一个数据在多个不同的地理位置存储的数据库
C.面向对象数据库仍然采用传统的关系型数据库管理系统
D.空间数据库是随着地理信息系统(GIS)的开发与应用而发展起来的数据库新技术
述、匹配和发现;类似于传统搜索引擎,将需求拆分为关键字,进而将其与每个服务的描述进行匹配,匹配度较大的服务被发现出来。此法效率高,但准确度不高。”
A.大数据比结构化数据增长快10倍到50倍
B.大数据是传统数据仓库的10倍到50倍
C.大数据很多不同形式
D.大数据无模式或者模式不明显
A.粒度是指数据仓库小数据单元的详细程度和级别
B.数据越详细,粒度就越小,级别也就越高
C.数据综合度越高,粒度也就越大,级别也就越高
D.粒度的具体划分将直接影响数据仓库中的数据量以及查询质量
E.粒度的大小需要数据仓库在设计时在数据量大小与查询的详细程度之间作出权衡
A.内部表数据由Hive自身管理,外部表数据由HDFS管理
B.外部表数据的存储位置由自己制定
C.删除内部表会直接删除元数据(metadata)及存储数据
D.删除外部表,HDFS上的文件也会被删除