2024年1月29日发(作者:)
大数据技术原理与应用_厦门大学中国大学mooc课后章节答案期末考试题库2023年
1. 数据产生方式的变革主要经历了三个阶段,以下哪个不属于这三个阶段:
答案:
数据流阶段
2. 第三次信息化浪潮的发生标志是以下哪种技术的普及:
答案:
物联网、云计算和大数据
3. 在Flink中哪个是基于批处理的图计算库:
答案:
Gelly
4. Hadoop的两大核心是 和
答案:
HDFS; MapReduce
5. HDFS默认的一个块大小是
答案:
64MB
6. 在分布式文件系统HDFS中, 负责数据的存储和读取:
答案:
数据节点
7. 上传当前目录下的本地文件到分布式文件系统HDFS的“/path”目录下的Shell命令是:
答案:
hdfs dfs -put /path
8. 在HDFS根目录下创建一个文件夹/test,且/test文件夹内还包含一个文件夹dir,正确的shell命令是:
答案:
hadoop fs -mkdir -p /test/dir
9. 下列有关HBase的说法正确的是:
答案:
HBase是一种NoSQL数据库
10. 已知一张表student存储在HBase中,向表中插入一条记录{id:2015001,name:Mary,{score:math}:88},其id作为行键,其中,在插入数学成绩88分时,正确的命令是:
答案:
put 'student','2015001','score:math','88'
11. NoSQL数据库的三大理论基石不包括:
答案:
ACID
12. 在设计词频统计的MapReduce程序时,对于文本行“hello bigdata hello
hadoop”,经过map函数处理后直接输出的结果应该是(没有发生combine和merge操作):
答案:
<"hello",1>、<"hello",1>、<"bigdata",1>和<"hadoop",1>
13. 假设已经配置好PATH环境变量,启动Hadoop的命令是:
答案:
14. 下列说法错误的是:
答案:
第二名称节点是热备份,而HDFS HA不是热备份
15. RDD操作包括转换(Transformation)和动作(Action)两种类型,下列RDD操作属于动作(Action)类型的是:
答案:
collect
16. 下列关于Hive的说法正确的是:
答案:
Hive支持批量导入
17. 大数据的特点包括:
答案:
数据种类繁多
数据量大
价值密度低
处理速度快
18. 下列适用于批处理计算的框架有哪些:
答案:
Spark
MapReduce
19. 下列适用于流计算的框架有哪些:
答案:
Storm
Spark Streaming
20. Flink核心组件栈分为哪三层:
答案:
API&Libraries层
物理部署层
Runtime核心层
21. 从技术架构上来看,物联网可以分为哪几层:
答案:
网络层
应用层
处理层
感知层
22. HBase需要根据哪些属性来唯一地确定一个单元格(cell)中的某个版本数据:
答案:
列限定符
列族
行键
时间戳
23. 典型的NoSQL数据库的类型包括:
答案:
图数据库
键值数据库
列族数据库
文档数据库
24. CAP是指:
答案:
一致性
可用性
分区容忍性
25. 云计算主要包括哪3种类型:
答案:
SaaS
PaaS
IaaS
26. 以下属于流计算的应用有哪些:
答案:
购物网站的广告推荐
实时交通路线推荐
27. 下列关于图计算产品Pregel的说法正确的是:
答案:
Pregel是一种基于BSP模型实现的并行图处理系统
在每个超步中,每个顶点会根据其接收消息的最大值和自身值比较,来确定自己状态作何种改变
当多个顶点的操作请求发生冲突时,Pregel采用局部有序和Handler来解决冲突
28. 下列哪些是图计算框架Pregel的应用:
答案:
二分匹配
单源最短路径
PageRank
29. 关于Spark的特性说法正确的是:
答案:
Spark的计算模式也属于MapReduce,但编程模型比Hadoop MapReduce更灵活
Spark基于DAG的任务调度执行机制,要优于Hadoop MapReduce的迭代执行机制
Scala是Spark的主要编程语言,但Spark还支持Java、Python、R作为编程语言
Spark提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更高
30. BASE的基本含义是:
答案:
基本可用
最终一致性
软状态
31. Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,是基于Java语言开发的,具有很好的跨平台特性。
答案:
正确
32. HDFS分布式文件系统,是谷歌文件系统GFS的开源实现,而Hadoop
MapReduce也是针对谷歌MapReduce的开源实现。
答案:
正确
33. 在分布式文件系统HDFS中,名称节点负责管理HDFS的元数据,这些元数据被保存在磁盘中。
答案:
错误
34. HDFS可以高效存储大量的小文件。
答案:
错误
35. FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。
答案:
正确
36. 第二名称节点(Secondary NameNode)是HDFS架构中的一个组成部分,它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间。
答案:
正确
37. HDFS采用了主从(Master/Slave)架构模型,一个HDFS集群包括一个名称节点和若干个数据节点。
答案:
正确
38. NoSQL数据库的数据库模式灵活,可扩展性好,同时,所有NoSQL数据库都支持事务的ACID四性。
答案:
错误
39. 传统的关系数据库和NoSQL数据库各有所长,不存在一方完全取代另一方的问题,在很长的一段时期内,二者都会共同存在,满足不同应用的差异化需求。
答案:
正确
40. MongoDB是一种图数据库,由C++语言编写的,其数据类型类似于JSON对象。
答案:
错误
41. Hadoop的两大核心是HDFS和MapReduce,HDFS用来存储数据,MapReduce用来处理数据.
答案:
正确
42. 协同过滤是最早、最知名的推荐算法,可分为基于用户的协同过滤和基于物品的协同过滤。
答案:
正确
43. Hive适合于实时交互式SQL查询,而Impala适合于长时间的批处理查询分析。
答案:
错误
本文发布于:2024-01-29 08:00:44,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170648644413842.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |