问题描述
随着人工智能、大数据、云计算等新技术快速发展,未来各行业将面临数字化转型,企业业务随着数字化转型也变得丰富多样,使网络管理成为网络管理员面临的最具挑战的问题之一。我们无法仅依赖人手工来完成整个的网络管理的工作,迫切的需要一种自动化和智能化的工具协助我们管理网络中的设备和资源。因此,数字化带来网络模型的变化,传统的网络管理模式已经不能适应数字化业务带来的新需求。传统网络的建设、管理和运维手段已无法满足数字化带来的新的网络需求;
当前网络的发展现状
呈现出 网络规模日益扩大、设备种类日益繁多、网络维护日益复杂、维护人员要求更高 趋势;
传统网管面临的挑战
网络规模大、业务开通慢、排障效率低
故障损失:每小时停机损失百万美元,在不同行业,网络故障也带来不同程度的损失;
业务开通慢:>70% 的网络通过 CLI 方式管理网络,响应速度比较慢;
故障定位难:一个故障定位平均耗时 76min;
该笔记将记录:网络管理相关内容,形成网络管理整体认识,以及在网络管理中使用到的各种技术方案。该部分笔记偏向于技术手段、实践方案、概念理念,并不包含过多的网络协议、通信技术;
解决方案
维护又有“运维”、“运营”、“操作与维护”等不同的说法,但表达的是同个概念;
网络管理,简单地说是对网络的管理,是一个网络的基本诉求。当前,用户能够通过各种协议、工具、应用或设备来实现对网络的管理,其管理对象包括网络中的硬件及软件。通过对网络中设备的管理,保证设备工作正常,使通信网络正常地运行,以提供高效、可靠和安全的通信服务,是通信网络的重要组成部分;
网络管理的目标:实现对网络软硬件的监控、测试、配置、分析、评价及控制等,确保网络运行正常;
网络管理的典型架构
通常情况下,网络管理系统具有相同的基本体系结构;
该体系结构包含两个关键元素:
1)管理设备,也被称为网络管理站;
2)被管设备,也被称为代理设备;
企业网的管理结构:
网络管理的四大模型
OSI Network Management Model 由四个主要的模型组成:
1)组织结构模型(Organization Model):描述网络管理系统组件的功能和基础架构;
该模型定义 管理者、代理、被管理对象。它描述网络管理系统的 组件、组件的功能、基础架构;
2)信息模型(Information Model):描述被管理对象及其关系的信息库;
该模型与信息结构和存储有关。它指定用于描述被管理对象及其关系的信息库;
管理信息结构(SMI)定义存储在管理信息库(MIB)中的管理信息的语法和语义。代理进程和管理器进程都使用 MIB 进行管理信息交换和存储;
3)通信模型(Communication Model):描述管理者与被管理者之间交换信息的方式;
该模型处理代理与管理者之间以及管理者之间交换信息的方式。通信模型中包含三个关键元素:传输协议,应用程序协议和要传达的实际消息;
4)功能模型(Functional Model):包括配置管理、性能管理、故障管理、安全管理、计费管理五个功能区域;
该模型包括网络管理的五个功能区域:配置管理、性能管理、故障管理、安全管理、计费管理;
功能模型(Functional Model)
配置管理(Configuration Management)
1)配置管理负责监控网络的配置信息,使网络管理人员可以生成、查询和修改硬件、软件的运行参数和条件,并可以进行相关业务的配置;
2)配置管理涉及初始化网络,提供网络资源和服务以及监视和控制网络。更具体地说,配置管理的职责包括在网络运行期间设置,维护,添加和更新组件之间的关系以及组件的状态;
3)配置管理包括设备配置和网络配置。设备配置可以在本地或远程执行。自动化的网络配置,例如 DHCP 和 DNS 在网络管理中发挥关键作用;
性能管理(Performance Management)
1)性能管理以网络性能为准则,保证在使用较少网络资源和具有较小时延的前提下,网络能够提供可靠、连续的通信能力;
2)性能管理与评估和报告被管理网络对象的行为和有效性有关。网络监视系统可以测量和显示网络状态,例如收集有关流量,网络可用性,响应时间和吞吐量的统计信息;
故障管理(Fault Management)
1)故障管理涉及检测,隔离和纠正可能导致 OSI 网络故障的异常操作;
2)故障管理的主要目标是确保网络始终可用,并在发生故障时尽快将其修复;
安全管理(Security Management)
1)安全管理可以保护网络和系统免受未经授权的访问和安全攻击;
2)安全管理机制包括身份验证,加密和授权。安全管理还涉及加密密钥以及其他与安全相关的信息的生成,分发和存储。安全管理可以包括提供实时事件监视和事件日志的安全系统,例如防火墙和入侵检测系统;
计费管理(Accounting Management)
1)记录用户使用网络资源的情况并核收费用,同时也统计网络的利用率;
2)计费管理可以计量被管理对象的使用费用,并确定这种使用的成本。该度量可能包括消耗的资源,用于收集会计数据的设施以及为客户使用的服务设置计费参数,维护用于计费目的的数据库,以及准备资源使用情况和计费报告;
在网络运维工作中,主要涉及到三个功能:
配置:许多管理协议都包括对托管项目执行动作的能力;
性能:这里的想法是获取有关平台行为的数据,该数据使我们可以推断其性能;
故障:在这一领域中,其思想是拥有检测故障的程序和报告故障的方案;
网络管理的发展趋势
管理自动化:通过在线的网规、部署、优化和巡检工具,实现本地网络免管理,可以有效降低 OPEX(Operating Expense,运营支出,指企业运行付出的各种支出成本,包括维护费用、营销费用、人工成本以及折旧)。正如家用洗衣机一样,从手动到半自动,到今天的全自动甚至是智能洗衣,让人人都能操作一个复杂的机器完成复杂的任务。对于网络管理也是如此,从基于命名行的逐台设备的配置与管理,到基于图形化界面的管理控制系统,到今天基于业务语言对网络进行自动化配置。从网络管理的视角,企业网络管理将几乎 1/3 的时间花费在网络的规划、部署上。根据行业知名分析机构在 2019 年 4 月发布的关于 AI 和自动化提高网络可靠性的报告中指出,到 2022 年,将会有 65%的企业在园区网络部署网络自动化技术,而今天这个比例只有 17%;
未来网络自动化有两个层面:
1)全生命周期的自动化:包括自动化工具是否能从网络的规划、部署、策略发放、网络状态监测和维护以及管理的全生命周期,均实现自动化;
2)整网自动化:包括企业的 LAN、WLAN、以及 WAN 网络是否能够进行集中式地管理和策略配置,是否能从全局视角定义基于用户身份和应用类型的业务策略
运维智能化:网络故障提前预警,故障解决更快,降低业务损失,潜在故障识别率大幅提升。智能化是网络管理运维的更高级别能力。以前,网络运维工作很简单,主要关注网络和设备的 KPI 指标,无法感知用户体验和业务质量。而今天,网络连接的质量直接影响到了业务的质量,从而影响了企业的运作效率。甚至在部分工业和生产场景,因不同业务的需要,网络质量有了差异化的要求,每终端的带宽、时延、丢包、无线漫游的切换时间仅依托以网元为中心的运维系统是无法完成如此复杂的工作。像医生为了检测疾病,需要采用更为先进的机器;
多业务融合:随着互联网产业的飞速发展,网络面临巨大变革,多业务融合成为未来网络的主流趋势。网络的融合需要管理的融合,统一网管能实现多业务、多设备的统一集中管理;
章节列表
「OpenSSH」- OpenBSD Secure Shell
「Network」- AAA,Authentication,Authorization,Accounting
「YANG」- Yet Another Next Generation
「Telemetry」- 常见问题处理
「OpenSSH」- 端口转发
「NETWORKING」- 数通网络:网络排障,故障管理,网络调试
「SSH」- 部分工作原理