「PVE」- 集群管理

  CREATED BY JENKINSBOT

删除节点

Cluster Manager – Proxmox VE

1)数据迁移备份:
确保相关的数据已经迁移备份,然后再进行特定节点的移除操作;

2)查看所有节点,并登录非被删除节点:

hp1# pvecm nodes

Membership information
~~~~~~~~~~~~~~~~~~~~~~
    Nodeid      Votes Name
         1          1 hp1 (local)
         2          1 hp2
         3          1 hp3
         4          1 hp4

3)关闭需要被移除的节点,并保证其不会以当前配置再次启动;
如果节点再次启动,可能会破坏集群,并导致集群较难恢复;

4)删除节点:

hp1# pvecm delnode hp4
Could not kill node (error = CS_ERR_NOT_EXIST)
Killing node 4

// 如果出现 CS_ERR_NOT_EXIST 错误,可以忽略,该错误是因为 corosync 尝试删除离线节点;

// 从 SSH known_hosts 中删除被移除节点的主机密钥;

# pvecm updatecerts

5)查看集群状态:

hp1# pvecm status
...

如果希望重新使用被移除的节点:
1)官方建议重新安装,再加入集群;
2)如果不想重新安装(官方不推荐):Separate a Node Without Reinstalling

常见问题处理

… [TOTEM] Retransmit List: …

问题描述:加入节点失败,无法完成节点数据同步(/etc/pve 缺少文件),查看 corosync.service 日志,提示 … Retransmit List … 错误;

原因分析:网线的问题,该环境的网线采用 UTP 1236 wiring 接法,进而导致该问题;

解决方案:更换网线;