解决方案
NSR 是在有 AMB 和 SMB 的设备上, AMB 发生故障时不影响邻居关系的一种可靠性技术。
原理简述
在设备发生倒换的过程中,路由处理不中断,因为:(1)邻居和拓扑信息不丢失;(2)邻居关系不中断;
特性特征
通过协议备份机制,实现主备倒换时控制平面(路由)和转发平面(业务)均不中断。
不依赖也不影响对端设备,没有互通问题;
路由的收敛速度要比 NSF 快;
应用场景
系统级 NSR 功能触发情况:
1)系统故障触发主备倒换。
2)软件升级或系统维护时网络管理员手动触发主备倒换。
原理概述
说明:NSR 对 OSPF、IS-IS、BGP 等协议的实现原理相同,我们以 OSPF 协议为例。
1)在控制平面中,路由协议实时备份路由信息;
2)硬件通道感知 AMB 异常,通知 SMB 升主,同时切换接口板上送报文通道;
NSR 原理主要包括以下三个过程:
批量备份
NSR 功能使能后,备板重启时, AMB 将路由信息和转发信息批量备份到 SMB 上。批量备份过程在实时备份过程之前进行,此时NSR无法实施主备倒换过程。
NSR功能使能后,备板重启时, AMB 上的业务进程会收到 SMB 上线的消息。业务进程开始进行内部数据的批量备份。
1)当批量数据备份完毕时,系统进入冗余保护状态。进入该状态后,如果主控板出现故障,备板升主后就可以利用之前从主板备份过来的数据进行升主,恢复业务。
2)当批量数据备份未完时,主控板故障,备板升主后可能会因为业务数据不全而导致无法升主,因此这个种状态下无法完成NSR倒换,设备会整机重启,恢复故障前状态。
1)备板启动完成。
2)各业务进程通过 HA 通道开始批量备份路由等业务数据,系统进入批量备份阶段。
3)业务进程全部批量备份完成后,系统进入冗余保护状态。
实时备份
当批量备份过程结束后,系统进入实时备份阶段。任何在控制平面和转发平面的改变(邻居状态或路由信息发生变化),都将实时从 AMB 备份到 SMB 上。在该阶段, SMB 能够随时代替 AMB 工作。
1)邻居状态变化或路由变化。
2) AMB 将变化信息通过HA通道备份到 SMB 。
3) SMB 答复 AMB 确认信息。
主备倒换
在已经完成备份的NSR系统 AMB 发生故障时, SMB 会通过硬件状态感知到 AMB 故障,并成为新的 AMB 。 SMB 升主后,该单板会切换接口板的报文上送通道。由于倒换时间足够短,路由协议在主备切换的过程中不会和邻居节点断连。
完成批量备份,进入冗余保护状态的系统,当 AMB 发生软件或硬件故障后, SMB 会从底层硬件感知到 AMB 的故障,并自行升主。
当 SMB 升主后,业务进程会使用之前从 AMB 备份来的数据进行工作。同时接口板也会向新的主控板发送平滑倒换期间变化的信息。实现真正的路由不中断,转发不中断。
1)硬件通道感知 AMB 异常,通知 SMB 升主,同时切换接口板上送报文通道。
2) SMB 升主后,接口板会向新的AMB发送平滑倒换期间的状态变化。
3)倒换升主完成后,新的 AMB 会向新的 SMB 进行NSR备份。
补充说明
1)HA(High Availability):高可靠性/高实用性的简称,这里指主备板间的备份通道。
2)AMB(Active Main Board)和SMB(Standby Main Board ): AMB 和 SMB ,单板上承载控制平面进程。
3)LPU(Line Interface Process Unit):接口板,单板上承载转发平面进程。
配置案例
使能NSR功能。 [Huawei] switchover mode { nonstop-routing | nonstop-forwarding } 设置系统HA的工作模式。缺省情况下,系统HA的工作模式为NSF模式。 nonstop-routing:指定系统HA的工作模式为不间断路由NSR模式。系统处于NSR模式时,能够实现路由处理及转发业务不中断。 nonstop-forwarding:指定系统HA的工作模式为不间断转发NSF模式。系统处于NSF模式时,能够大幅减少转发业务中断时间。 检查配置结果。 [Huawei] display switchover mode 查看当前系统HA的工作模式。 [Huawei] display ip routing-table [ vpn-instance vpn-instance-name ] [ verbose ] 查看主备倒换后的路由信息。 [Huawei] display fib [ slot-id ] [ vpn-instance vpn-instance-name ] [ verbose ] 查看主备倒换后的转发信息。