Hadoop介绍

Hadoop是什么

HDFS是Hadoop Distributed File System, 即Hadoop分布式文件系统

NameNode(nn): 用来记录数据存储在哪些服务器上, 即保存数据存储位置的服务器

SecondeNameNone(2nn): 辅助NameNode完成工作, 对NameNode服务器每隔一段时间进行备份

DataNode(dn): 用来实际存储数据, 即用来存储数据的服务器

客户端可以有多个
ResourceManager用于管理整个集群的资源(CPU和内存)
NodeManager用于管理每台服务器上的资源
每台服务器上可以虚拟化出来多个Container, 用户实际获得的是Container容器, 在Container中由ApplicationMaster进行管理

MapReduce将计算过程分为两个阶段: Map和Reduce

//todo

转载规则

《》由熊水斌采用知识共享署名 4.0 国际许可协议进行许可。

Redis 集群Redis 集群的安装配置解压缩tar -zxvf /opt/module/redis-6.2.7.tar.gz -C /opt/module 编译make -C /opt/module/redis-6.2.7 安装m

2022-11-11

溢写文件在哪（MapTask 工作流程） Mapper 的 run() 方法 Mapper 的 cleanup() 方法 output.close(mapperContext) 中 collector.flush() 将环形缓冲区中的数据溢

2022-11-11