「VRRP」- 常见问题处理

  CREATED BY JENKINSBOT

VRRP & BFD

问题描述

当 VRRP 备份组之间的链路出现故障时,由于此时 VRRP 报文无法正常交互,Backup 设备需要等待 Master_Down_Timer 计时器超时后才会切换为 Master 设备,在等待切换期间内,业务流量仍会发往 Master 设备,此时会造成业务流量丢失;

解决方案

在 Master Router 和 Backup Router 间,通过建立 BFD 会话并与 VRRP 备份组进行绑定(配置 VRRP 与 BFD 联动),由 BFD 机制快速检测 VRRP 备份组之间的通信故障,当 Backup 设备通过 BFD 感知故障发生后,不再等待 Master_Down_Timer 计时器超时,而会在 BFD 检测周期结束后及时通知 VRRP 备份组进行主备切换,在出现故障时立即切换 VRRP 状态,从而大大减少应用中断时间。,此时可以实现毫秒级的主备切换;

这是另种 VRRP 与 BFD 联动场景,目的是快速发现 Master 故障;

在普通 BFD 联动中,VRRP 备份组会根据 BFD 会话的状态进行优先级调整,并根据调整后的优先级判断是否进行主备切换。在实际应用中,通常 Master 设备配置延时抢占,而 Backup 设备配置立即抢占,当 Backup 设备检测到 BFD 会话状态出现 DOWN 后,通过增加自身优先级大于 Master 优先级实现快速切换,当故障排除,BFD 会话状态出现 UP 时,新的 Master 通过减小自己的优先级,发送 vrrp 通告报文,经过延迟时间后再次切换为 Backup;