大数据技术原理与应用_厦门大学中国大学mooc课后章节答案期末考试题库20

阅读: 评论:0

2024年1月29日发(作者:)

大数据技术原理与应用_厦门大学中国大学mooc课后章节答案期末考试题库20

大数据技术原理与应用_厦门大学中国大学mooc课后章节答案期末考试题库2023年

1. 数据产生方式的变革主要经历了三个阶段,以下哪个不属于这三个阶段:

答案:

数据流阶段

2. 第三次信息化浪潮的发生标志是以下哪种技术的普及:

答案:

物联网、云计算和大数据

3. 在Flink中哪个是基于批处理的图计算库:

答案:

Gelly

4. Hadoop的两大核心是 和

答案:

HDFS; MapReduce

5. HDFS默认的一个块大小是

答案:

64MB

6. 在分布式文件系统HDFS中, 负责数据的存储和读取:

答案:

数据节点

7. 上传当前目录下的本地文件到分布式文件系统HDFS的“/path”目录下的Shell命令是:

答案:

hdfs dfs -put /path

8. 在HDFS根目录下创建一个文件夹/test,且/test文件夹内还包含一个文件夹dir,正确的shell命令是:

答案:

hadoop fs -mkdir -p /test/dir

9. 下列有关HBase的说法正确的是:

答案:

HBase是一种NoSQL数据库

10. 已知一张表student存储在HBase中,向表中插入一条记录{id:2015001,name:Mary,{score:math}:88},其id作为行键,其中,在插入数学成绩88分时,正确的命令是:

答案:

put 'student','2015001','score:math','88'

11. NoSQL数据库的三大理论基石不包括:

答案:

ACID

12. 在设计词频统计的MapReduce程序时,对于文本行“hello bigdata hello

hadoop”,经过map函数处理后直接输出的结果应该是(没有发生combine和merge操作):

答案:

<"hello",1>、<"hello",1>、<"bigdata",1>和<"hadoop",1>

13. 假设已经配置好PATH环境变量,启动Hadoop的命令是:

答案:

14. 下列说法错误的是:

答案:

第二名称节点是热备份,而HDFS HA不是热备份

15. RDD操作包括转换(Transformation)和动作(Action)两种类型,下列RDD操作属于动作(Action)类型的是:

答案:

collect

16. 下列关于Hive的说法正确的是:

答案:

Hive支持批量导入

17. 大数据的特点包括:

答案:

数据种类繁多

数据量大

价值密度低

处理速度快

18. 下列适用于批处理计算的框架有哪些:

答案:

Spark

MapReduce

19. 下列适用于流计算的框架有哪些:

答案:

Storm

Spark Streaming

20. Flink核心组件栈分为哪三层:

答案:

API&Libraries层

物理部署层

Runtime核心层

21. 从技术架构上来看,物联网可以分为哪几层:

答案:

网络层

应用层

处理层

感知层

22. HBase需要根据哪些属性来唯一地确定一个单元格(cell)中的某个版本数据:

答案:

列限定符

列族

行键

时间戳

23. 典型的NoSQL数据库的类型包括:

答案:

图数据库

键值数据库

列族数据库

文档数据库

24. CAP是指:

答案:

一致性

可用性

分区容忍性

25. 云计算主要包括哪3种类型:

答案:

SaaS

PaaS

IaaS

26. 以下属于流计算的应用有哪些:

答案:

购物网站的广告推荐

实时交通路线推荐

27. 下列关于图计算产品Pregel的说法正确的是:

答案:

Pregel是一种基于BSP模型实现的并行图处理系统

在每个超步中,每个顶点会根据其接收消息的最大值和自身值比较,来确定自己状态作何种改变

当多个顶点的操作请求发生冲突时,Pregel采用局部有序和Handler来解决冲突

28. 下列哪些是图计算框架Pregel的应用:

答案:

二分匹配

单源最短路径

PageRank

29. 关于Spark的特性说法正确的是:

答案:

Spark的计算模式也属于MapReduce,但编程模型比Hadoop MapReduce更灵活

Spark基于DAG的任务调度执行机制,要优于Hadoop MapReduce的迭代执行机制

Scala是Spark的主要编程语言,但Spark还支持Java、Python、R作为编程语言

Spark提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更高

30. BASE的基本含义是:

答案:

基本可用

最终一致性

软状态

31. Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,是基于Java语言开发的,具有很好的跨平台特性。

答案:

正确

32. HDFS分布式文件系统,是谷歌文件系统GFS的开源实现,而Hadoop

MapReduce也是针对谷歌MapReduce的开源实现。

答案:

正确

33. 在分布式文件系统HDFS中,名称节点负责管理HDFS的元数据,这些元数据被保存在磁盘中。

答案:

错误

34. HDFS可以高效存储大量的小文件。

答案:

错误

35. FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。

答案:

正确

36. 第二名称节点(Secondary NameNode)是HDFS架构中的一个组成部分,它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间。

答案:

正确

37. HDFS采用了主从(Master/Slave)架构模型,一个HDFS集群包括一个名称节点和若干个数据节点。

答案:

正确

38. NoSQL数据库的数据库模式灵活,可扩展性好,同时,所有NoSQL数据库都支持事务的ACID四性。

答案:

错误

39. 传统的关系数据库和NoSQL数据库各有所长,不存在一方完全取代另一方的问题,在很长的一段时期内,二者都会共同存在,满足不同应用的差异化需求。

答案:

正确

40. MongoDB是一种图数据库,由C++语言编写的,其数据类型类似于JSON对象。

答案:

错误

41. Hadoop的两大核心是HDFS和MapReduce,HDFS用来存储数据,MapReduce用来处理数据.

答案:

正确

42. 协同过滤是最早、最知名的推荐算法,可分为基于用户的协同过滤和基于物品的协同过滤。

答案:

正确

43. Hive适合于实时交互式SQL查询,而Impala适合于长时间的批处理查询分析。

答案:

错误

大数据技术原理与应用_厦门大学中国大学mooc课后章节答案期末考试题库20

本文发布于:2024-01-29 08:00:44,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170648644413842.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   数据库   计算   节点   下列   应用   名称
留言与评论(共有 0 条评论)
   
验证码:
排行榜

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23