问题描述
网络故障,指由于某种原因而使网络丧失规定功能并影响业务的现象。从用户的角度出发,凡是影响业务的现象都可以定义为故障。
常见的故障现象和分类如下(分类和故障现象的对应关系在不同的场景下会有所不同):
解决方案
常见监测技术
传统的网络监控手段(SNMP、CLI、日志),例如:
SNMP 和 CLI 主要采用“拉模式”获取数据,即发送请求来获取设备上的数据。但该方式限制能够监控的网络设备数量,且无法快速获取数据。
SNMP Trap 和日志虽然采用“推模式”获取数据,即设备主动将数据上报给监控设备,但仅上报事件和告警,监控的数据内容极其有限,无法准确地反映网络状况。
传统的网络检测技术已无法满足网络需要,新的检测技术有:
CLI(Telnet/SSH)、SNMP 、NETCONF 、NetStream、sFlow、Telemetry、SYSLOG、LLDP、Mirror(镜像)
网络检测技术对比:
Telemetry SNMP Get SNMP Trap CLI SYSLOG 工作模式 推模式 拉模式 推模式 拉模式 推模式 精度 亚秒级 分钟级 秒级 分钟级 秒级