「NETWORKING」- 数通网络:网络排障,故障管理,网络调试

  CREATED BY JENKINSBOT

问题描述

网络故障,指由于某种原因而使网络丧失规定功能并影响业务的现象。从用户的角度出发,凡是影响业务的现象都可以定义为故障。

常见的故障现象和分类如下(分类和故障现象的对应关系在不同的场景下会有所不同):

解决方案

常见监测技术

传统的网络监控手段(SNMP、CLI、日志),例如:
SNMP 和 CLI 主要采用“拉模式”获取数据,即发送请求来获取设备上的数据。但该方式限制能够监控的网络设备数量,且无法快速获取数据。
SNMP Trap 和日志虽然采用“推模式”获取数据,即设备主动将数据上报给监控设备,但仅上报事件和告警,监控的数据内容极其有限,无法准确地反映网络状况。

传统的网络检测技术已无法满足网络需要,新的检测技术有:
CLI(Telnet/SSH)、SNMP 、NETCONF 、NetStream、sFlow、Telemetry、SYSLOG、LLDP、Mirror(镜像)

网络检测技术对比:

			Telemetry	SNMP Get	SNMP Trap	CLI			SYSLOG
工作模式		推模式		拉模式		推模式		拉模式		推模式
精度			亚秒级		分钟级		秒级			分钟级		秒级