删除节点
1)数据迁移备份:
确保相关的数据已经迁移备份,然后再进行特定节点的移除操作;
2)查看所有节点,并登录非被删除节点:
hp1# pvecm nodes Membership information ~~~~~~~~~~~~~~~~~~~~~~ Nodeid Votes Name 1 1 hp1 (local) 2 1 hp2 3 1 hp3 4 1 hp4
3)关闭需要被移除的节点,并保证其不会以当前配置再次启动;
如果节点再次启动,可能会破坏集群,并导致集群较难恢复;
4)删除节点:
hp1# pvecm delnode hp4 Could not kill node (error = CS_ERR_NOT_EXIST) Killing node 4 // 如果出现 CS_ERR_NOT_EXIST 错误,可以忽略,该错误是因为 corosync 尝试删除离线节点; // 从 SSH known_hosts 中删除被移除节点的主机密钥; # pvecm updatecerts
5)查看集群状态:
hp1# pvecm status ...
如果希望重新使用被移除的节点:
1)官方建议重新安装,再加入集群;
2)如果不想重新安装(官方不推荐):Separate a Node Without Reinstalling
常见问题处理
… [TOTEM] Retransmit List: …
问题描述:加入节点失败,无法完成节点数据同步(/etc/pve 缺少文件),查看 corosync.service 日志,提示 … Retransmit List … 错误;
原因分析:网线的问题,该环境的网线采用 UTP 1236 wiring 接法,进而导致该问题;
解决方案:更换网线;