Spark的运行架构包括()。
B、运行作业任务的工作节点Worker Node
C、每个应用的任务控制节点Driver
D、每个工作节点上负责具体任务的执行进程Executor
B、运行作业任务的工作节点Worker Node
C、每个应用的任务控制节点Driver
D、每个工作节点上负责具体任务的执行进程Executor
A.SparkSQL
B.Hive
C.Spark
D.MapReduce
A.主控程序Nimbus
B.集群调度器Zookeeper
C.工作节点控制程序Supervisor
D.工作进程Worker
A.包括4种缓存架构。分别为:标准单幅本、标准双副本、集群单幅本、集群双副本
B.支持弹性扩容、数据持久化、容灾切换、监控告警功能
C.支持“标准版-单副本”变更至“集群版-单副本”、“标准版-双副本”变更至“集群版-双副本”
D.支持公网访问、ipv6网络访问功能
A.Kafka
B.Zookeeper
C.HIVE
D.Spark
A.sqoop可以使用spark进行数据采集
B.sqoop默认采用的mapreduce进行数据采集
C.sqoop属于b/s架构
D.sqoop只能采集某个表的数据
A.实时分析一般应用于电子商务和金融。需要在数据不断变化的情况下,进行快速的数据分析,并以非常短的延迟返回,才能达到不影响用户体验的目的
B.实时分析采用的架构包括,使用传统关系数据库的并行处理集群,或者采用实时计算架构,例如开源数据分析平台Storm
C.离线分析通常指分析时不需要联网的应用,例如机器学习,统计分析和推荐算法
D.离线分析的技术框架相对成熟,常用的分析框架是:HDFS做存储,MapReduce做计算框架,Hive作为数据仓库