首页 > 编程札记 > javascript

大数据技术原理与应用_厦门大学中国大学mooc课后章节答案期末考试题库20

阅读：评论：0

2024年1月29日发(作者：)

大数据技术原理与应用_厦门大学中国大学mooc课后章节答案期末考试题库2023年

1. 数据产生方式的变革主要经历了三个阶段，以下哪个不属于这三个阶段：

答案:

数据流阶段

2. 第三次信息化浪潮的发生标志是以下哪种技术的普及：

答案:

物联网、云计算和大数据

3. 在Flink中哪个是基于批处理的图计算库：

答案:

Gelly

4. Hadoop的两大核心是和

答案:

HDFS; MapReduce

5. HDFS默认的一个块大小是

答案:

64MB

6. 在分布式文件系统HDFS中，负责数据的存储和读取:

答案:

数据节点

7. 上传当前目录下的本地文件到分布式文件系统HDFS的“/path”目录下的Shell命令是：

答案:

hdfs dfs -put /path

8. 在HDFS根目录下创建一个文件夹/test，且/test文件夹内还包含一个文件夹dir，正确的shell命令是:

答案:

hadoop fs -mkdir -p /test/dir

9. 下列有关HBase的说法正确的是：

答案:

HBase是一种NoSQL数据库

10. 已知一张表student存储在HBase中，向表中插入一条记录{id:2015001,name:Mary,{score:math}:88}，其id作为行键，其中，在插入数学成绩88分时，正确的命令是:

答案:

put 'student','2015001','score:math','88'

11. NoSQL数据库的三大理论基石不包括:

答案:

ACID

12. 在设计词频统计的MapReduce程序时，对于文本行“hello bigdata hello

hadoop”，经过map函数处理后直接输出的结果应该是（没有发生combine和merge操作）:

答案:

<"hello",1>、<"hello",1>、<"bigdata",1>和<"hadoop",1>

13. 假设已经配置好PATH环境变量，启动Hadoop的命令是:

答案:

14. 下列说法错误的是：

答案:

第二名称节点是热备份，而HDFS HA不是热备份

15. RDD操作包括转换（Transformation）和动作(Action)两种类型，下列RDD操作属于动作（Action）类型的是:

答案:

collect

16. 下列关于Hive的说法正确的是:

答案:

Hive支持批量导入

17. 大数据的特点包括:

答案:

数据种类繁多

数据量大

价值密度低

处理速度快

18. 下列适用于批处理计算的框架有哪些：

答案:

Spark

MapReduce

19. 下列适用于流计算的框架有哪些:

答案:

Storm

Spark Streaming

20. Flink核心组件栈分为哪三层：

答案:

API&Libraries层

物理部署层

Runtime核心层

21. 从技术架构上来看，物联网可以分为哪几层:

答案:

网络层

应用层

处理层

感知层

22. HBase需要根据哪些属性来唯一地确定一个单元格(cell)中的某个版本数据:

答案:

列限定符

列族

行键

时间戳

23. 典型的NoSQL数据库的类型包括：

答案:

图数据库

键值数据库

列族数据库

文档数据库

24. CAP是指：

答案:

一致性

可用性

分区容忍性

25. 云计算主要包括哪3种类型：

答案:

SaaS

PaaS

IaaS

26. 以下属于流计算的应用有哪些：

答案:

购物网站的广告推荐

实时交通路线推荐

27. 下列关于图计算产品Pregel的说法正确的是：

答案:

Pregel是一种基于BSP模型实现的并行图处理系统

在每个超步中，每个顶点会根据其接收消息的最大值和自身值比较，来确定自己状态作何种改变

当多个顶点的操作请求发生冲突时，Pregel采用局部有序和Handler来解决冲突

28. 下列哪些是图计算框架Pregel的应用:

答案:

二分匹配

单源最短路径

PageRank

29. 关于Spark的特性说法正确的是:

答案:

Spark的计算模式也属于MapReduce，但编程模型比Hadoop MapReduce更灵活

Spark基于DAG的任务调度执行机制，要优于Hadoop MapReduce的迭代执行机制

Scala是Spark的主要编程语言，但Spark还支持Java、Python、R作为编程语言

Spark提供了内存计算，可将中间结果放到内存中，对于迭代运算效率更高

30. BASE的基本含义是：

答案:

基本可用

最终一致性

软状态

31. Hadoop是Apache软件基金会旗下的一个开源分布式计算平台，是基于Java语言开发的，具有很好的跨平台特性。

答案:

正确

32. HDFS分布式文件系统，是谷歌文件系统GFS的开源实现，而Hadoop

MapReduce也是针对谷歌MapReduce的开源实现。

答案:

正确

33. 在分布式文件系统HDFS中，名称节点负责管理HDFS的元数据，这些元数据被保存在磁盘中。

答案:

错误

34. HDFS可以高效存储大量的小文件。

答案:

错误

35. FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。

答案:

正确

36. 第二名称节点(Secondary NameNode)是HDFS架构中的一个组成部分，它是用来保存名称节点中对HDFS元数据信息的备份，并减少名称节点重启的时间。

答案:

正确

37. HDFS采用了主从（Master/Slave）架构模型，一个HDFS集群包括一个名称节点和若干个数据节点。

答案:

正确

38. NoSQL数据库的数据库模式灵活，可扩展性好，同时，所有NoSQL数据库都支持事务的ACID四性。

答案:

错误

39. 传统的关系数据库和NoSQL数据库各有所长，不存在一方完全取代另一方的问题，在很长的一段时期内，二者都会共同存在，满足不同应用的差异化需求。

答案:

正确

40. MongoDB是一种图数据库，由C++语言编写的，其数据类型类似于JSON对象。

答案:

错误

41. Hadoop的两大核心是HDFS和MapReduce，HDFS用来存储数据，MapReduce用来处理数据.

答案:

正确

42. 协同过滤是最早、最知名的推荐算法，可分为基于用户的协同过滤和基于物品的协同过滤。

答案:

正确

43. Hive适合于实时交互式SQL查询，而Impala适合于长时间的批处理查询分析。

答案:

错误

本文发布于:2024-01-29 08:00:44，感谢您对本站的认可！

本文链接：https://www.4u4v.net/it/170648644413842.html

上一篇：贪吃蛇毕设

下一篇：js中判断数字字母中文的正则表达式 (实例)

标签：数据数据库计算节点下列应用名称

留言与评论（共有 0 条评论）