「NETWORKING」- 问题排查案例:流量无法主动进入;

  CREATED BY JENKINSBOT

问题描述

最近(11/25/2021)遇到个奇怪的问题:
1)电信给了几个静态 IP 地址,我随便挑了一个,然后绑网关路由器上。
2)阿里云服务器 到 网关路由,是 ping 这个静态地址不通。这时候我们保持长 ping,不要退出 ping
3)此时,如果我从路由器上先 ping 一下电信的网关(哪怕一个 ping 包),然后阿里云服务器 到 网关路由 立马就通了。

原因分析

Router: AR 1220
Optical Modem: ZTE ZXHN F401

# 11/25/2021

## 环境
现在我在 光猫 和 路由器 加个一个中间设备(图中的 MITM),实际是台工控机,两个千兆口
1)MITM 上运行 Linux 系统
2)然后,我把 MITM 的两个千兆口做了桥接,
3)然后在两个千兆口上抓包。这也是加这个设备的目的,还是抓包。

## 现象
Alibaba Cloud Server 主动 ping AR2,当网络不通的时候,MITM 没有收到数据包。
当我从 AR2 主动 ping optical modem ,就发一个 ping 包,然后 Alibaba Cloud Server 到 AR2 马上通。

## 推测 电信光猫 MAC 地址表的问题
1)我从 AR2 上 ping optical modem,这时候它从接口学到我得 MAC 地址。
2)当长时间不发包,optical modem 上的 MAC 地址失效之后,optical modem 就不知道 .125 的 MAC 是多少
1)另外,我在 MITM 上很少看到 optical modem 发来 ARP,也就是 网关很少发 ARP 来问 .125 这个地址的 MAC 是多少。

## 复现的方法
1)根据推测,复现的方法就很简单,直接重启 optical modem,这样它整个 MAC 地址表就没了。
2)然后在从 Alibaba Cloud Server 主动 ping AR2,此时 100% 不通
3)然后 从 AR2 主动 ping optical modem ,就发一个 ping 包,然后 Alibaba Cloud Server 到 AR2 马上通。

## 补充说明
1)当链路 UP 之后,第一个数据包,如果是从远程到本地,则绝对不通。因为电信的光猫没有路由器的 MAC 地址,它也不发 ARP 查。

## 类似问题
【求助】光猫不支持ARP,请问怎么搞
puzzle: when the ISP refuses to use arp requests…

# 12/04/2022 问题在之前得以解决:在我们的场景中,两条宽带存在隔离。所以入 Inbound Tfc 与 Outbound Tfc 必须是相同的链路。