保姆级教程：用VMware克隆功能，5分钟搞定Hadoop 3.1.3多节点集群的快速部署

张

张建站

2026/5/1 10:19:40

10分钟阅读

保姆级教程：用VMware克隆功能，5分钟搞定Hadoop 3.1.3多节点集群的快速部署

5分钟极速部署Hadoop集群VMware克隆技术与自动化配置实战在学习和测试Hadoop分布式系统时最耗时的环节往往是重复配置多个节点。传统方法需要逐台安装系统、配置环境、设置网络整个过程繁琐且容易出错。本文将介绍一种利用VMware克隆功能快速搭建Hadoop集群的方法通过一次配置批量复制的策略将原本数小时的工作压缩到5分钟内完成。1. 基础环境准备1.1 创建基准虚拟机首先需要准备一台配置好的基准虚拟机我们称之为master节点后续所有节点都将通过克隆这个基准镜像来创建。以下是基准机的必备配置操作系统选择推荐使用Ubuntu Server LTS版本如20.04或22.04相比桌面版更轻量且稳定。安装时选择最小化安装即可减少不必要的软件包。网络配置使用NAT模式网络确保虚拟机可以访问外网以下载必要的软件包。记录下NAT网关地址通常是192.168.x.2后续静态IP配置会用到。用户设置创建专用用户hadoop并赋予sudo权限sudo useradd -m hadoop -s /bin/bash sudo passwd hadoop # 设置密码如123456 sudo adduser hadoop sudo基础工具安装sudo apt update sudo apt upgrade -y sudo apt install -y openssh-server net-tools vim1.2 系统优化配置完成基础安装后需要对系统进行一些优化设置关闭防火墙仅限实验环境sudo ufw disable配置静态IP以Ubuntu 22.04为例sudo nano /etc/netplan/00-installer-config.yaml修改为以下内容根据实际网络调整network: ethernets: ens33: dhcp4: no addresses: [192.168.33.130/24] gateway4: 192.168.33.2 nameservers: addresses: [8.8.8.8, 1.1.1.1] version: 2应用配置sudo netplan apply主机名与hosts文件sudo hostnamectl set-hostname master sudo nano /etc/hosts添加以下内容192.168.33.130 master 192.168.33.131 slave1 192.168.33.132 slave22. Hadoop核心组件安装2.1 JDK环境配置Hadoop 3.x需要Java 8或11环境。以下是OpenJDK 11的安装步骤sudo apt install -y openjdk-11-jdk配置环境变量添加到~/.bashrc末尾export JAVA_HOME/usr/lib/jvm/java-11-openjdk-amd64 export PATH$JAVA_HOME/bin:$PATH验证安装java -version2.2 Hadoop安装与配置下载并解压Hadoop 3.1.3wget https://archive.apache.org/dist/hadoop/common/hadoop-3.1.3/hadoop-3.1.3.tar.gz tar -xzf hadoop-3.1.3.tar.gz -C ~/ mv ~/hadoop-3.1.3 ~/hadoop配置环境变量添加到~/.bashrcexport HADOOP_HOME~/hadoop export PATH$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH关键配置文件修改hadoop-env.shecho export JAVA_HOME$JAVA_HOME $HADOOP_HOME/etc/hadoop/hadoop-env.shcore-site.xmlconfiguration property namefs.defaultFS/name valuehdfs://master:9000/value /property property namehadoop.tmp.dir/name value/home/hadoop/hadoopdata/value /property /configurationhdfs-site.xmlconfiguration property namedfs.replication/name value2/value /property /configurationworkers文件替代旧版的slaves文件echo -e slave1\nslave2 $HADOOP_HOME/etc/hadoop/workers3. VMware克隆与节点配置3.1 创建虚拟机克隆关闭master虚拟机sudo poweroff在VMware中右键master虚拟机 → 管理 → 克隆选择完整克隆命名为slave1重复操作创建slave23.2 克隆后差异化配置每个克隆节点需要修改以下配置修改主机名sudo hostnamectl set-hostname slave1 # 在slave1上执行 sudo hostnamectl set-hostname slave2 # 在slave2上执行更新静态IP 修改/etc/netplan/00-installer-config.yamlslave1:192.168.33.131slave2:192.168.33.132应用配置sudo netplan apply同步hosts文件确保所有节点的/etc/hosts内容一致包含所有节点的IP和主机名映射。3.3 SSH免密登录配置在master节点执行ssh-keygen -t rsa -P -f ~/.ssh/id_rsa cat ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys chmod 600 ~/.ssh/authorized_keys将公钥分发到所有节点包括自己ssh-copy-id hadoopmaster ssh-copy-id hadoopslave1 ssh-copy-id hadoopslave2验证免密登录ssh slave1 date ssh slave2 date4. 集群启动与验证4.1 格式化HDFS仅在第一次启动前执行hdfs namenode -format4.2 启动集群start-dfs.sh检查各节点进程jpsmaster应有NameNode、SecondaryNameNodeslave1/slave2应有DataNode4.3 Web界面验证访问NameNode Web UIhttp://master:98704.4 常见问题解决无法解析主机名检查所有节点的/etc/hosts文件是否一致确保主机名与IP映射正确SSH连接失败sudo systemctl restart ssh权限问题在hadoop-env.sh中添加export HDFS_NAMENODE_USERhadoop export HDFS_DATANODE_USERhadoop export HDFS_SECONDARYNAMENODE_USERhadoop端口冲突检查netstat -tulnp确认Hadoop所需端口如9000、9870未被占用通过这种克隆部署方法我们实现了初始配置时间从数小时缩短到5分钟确保所有节点环境完全一致方便后续扩展更多节点易于维护和重建集群

GHelper终极指南：华硕笔记本轻量级控制工具，5步掌握极致性能调校

GHelper终极指南：华硕笔记本轻量级控制工具，5步掌握极致性能调校【免费下载链接】g-helper G-Helper is a fast, native tool for tuning performance, fans, GPU, battery, and RGB on any Asus laptop or handheld - ROG Zephyrus, Flow, Strix, TUF,…...

2026/5/1 10:19:32 阅读更多 →

告别穷举！用微软PICT工具5分钟搞定复杂系统的测试用例设计（附实战模型文件）

微软PICT实战指南：5步构建高覆盖率的智能测试模型在软件测试领域，我们常常陷入一个两难困境——既要保证测试覆盖率，又要控制测试成本。传统的手工设计测试用例方法在面对多参数组合时，往往需要耗费大量时间却依然难以避免遗漏。…...

2026/5/1 10:17:23 阅读更多 →

Excel自动化小技巧：用VBA把单元格内容变成二维码图片，并自动保存到指定文件夹

Excel自动化进阶：用VBA批量生成并管理二维码图片的完整方案市场部门小王最近遇到了一个棘手问题——需要为300款新产品制作宣传单页，每款产品都要包含专属二维码。传统做法是手动生成二维码后逐个插入设计稿，不仅效率低下还容易出错。其实&a…...

2026/5/1 10:17:23 阅读更多 →

如何理解临键锁Next-Key Lock_行锁与间隙锁的组合原理解析

临键锁锁定的是左开右闭区间，如对索引值20加锁即锁住(10,20]，包含记录20及前一索引间隙；仅作用于被扫描的索引范围，且在REPEATABLE READ下启用。临键锁到底锁了哪块数据？临键锁不是新锁类型，而是 Record Lo…...

2026/4/30 11:20:20 阅读更多 →

CUDA 13.3 RTX 4090实测报告：FP16混合精度算子性能断层分析（含37个主流PyTorch算子汇编级差异对比）

更多请点击： https://intelliparadigm.com 第一章：CUDA 13.3 RTX 4090混合精度算子性能断层分析总览 NVIDIA RTX 4090 搭载的 Ada Lovelace 架构在 CUDA 13.3 中首次全面启用第三代 Tensor Core 的 FP8 原生支持，使得混合精度计算路径&…...

2026/4/30 11:20:21 阅读更多 →

Vue3项目实战：手写Ant Design Vue a-table拖拽排序（绕过付费功能）

Vue3项目实战：基于Ant Design Vue的a-table手写拖拽排序方案去年接手一个从React迁移到Vue3的项目时，遇到了一个有趣的挑战。项目使用了Ant Design Vue作为UI组件库，在实现菜单管理列表的拖拽排序功能时，发现官方提供的a-table拖…...

2026/5/1 7:45:55 阅读更多 →

2026届最火的AI辅助写作平台实测分析

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在人工智能进行交互期间，指令存在冗余情形常常会致使输出出现偏差以及造成效率方…...

2026/4/30 11:20:20 阅读更多 →