网络延迟高、ping 不稳定 从内网到公网完整排查

发布时间:2026/6/3 16:07:28

网络延迟高、ping 不稳定 从内网到公网完整排查 我最近在河南一家知名IDC公司郑州易方科贸861.cn托管的一台服务器发现线上业务最头疼的问题里网络延迟忽高忽低、ping 抖动大、间歇性超时、游戏/接口/直播卡顿绝对排前三。很多人排查网络只会单纯 ping 一下、重启服务器完全找不到根因有时候本地 ping 正常、用户访问却巨卡有时候内网流畅、公网延迟疯狂跳变有时候延迟高但没有丢包怎么查都查不出问题。本文给大家一套从内网到公网、从浅层到深层、可落地的分层排查方案覆盖 99% 的网络延迟、抖动、ping 不稳定问题新手也能直接照着操作。一、先分清三种网络异常现象别再搞混排查前先区分故障类型避免盲目排查三者成因完全不同延迟高延迟稳定偏大ping 值固定几百ms无明显跳动、无丢包多是链路长、路由绕、带宽拥堵导致ping 抖动/不稳定延迟忽高忽低10ms→200ms→50ms 反复横跳核心是网络队列拥堵、设备性能瓶颈、链路干扰间歇性丢包偶尔超时、请求失败、连接断开多是防火墙拦截、端口故障、运营商波动、流量攻击导致绝大多数业务卡顿都是抖动轻微丢包共同造成的比单纯延迟高危害更大。二、第一步快速定位故障区间核心关键网络问题分为三段本地网络 → 服务器内网 → 公网链路先锁定问题出在哪一段排查效率翻倍。1. 本地测试排除自身网络问题本地电脑持续 ping 服务器公网 IP观察 3-5 分钟# Windows 持续ping ping 服务器IP -t # Linux 持续ping ping 服务器IP -c 1000判断标准本地 ping 抖动大、丢包 → 优先查本地宽带、路由器、WIFI、局域网拥堵本地 ping 稳定用户反馈卡顿 → 问题在服务器端、运营商链路2. 服务器内网自测排除服务器本身网卡故障登录服务器ping 内网网关、本机网卡测试内网稳定性# ping 本机网卡 ping 127.0.0.1 # ping 内网网关 ping 网关IP判断标准内网 ping 延迟高、抖动、丢包 → 服务器网卡、交换机、内网环境故障内网完全稳定公网 ping 异常 → 问题出在公网运营商链路3. 终极定位工具mtr比traceroute精准10倍普通 ping 只能看终点状态mtr 可以排查整条路由链路精准定位哪一跳卡顿丢包是运维排查网络的核心工具。# 安装 yum install mtr -y # 持续检测公网链路推荐 mtr -c 1000 目标IP结果解读前几跳内网段丢包 → 机房内网/交换机/网卡问题中间骨干网跳点丢包、延迟飙升 → 运营商线路波动最后一跳丢包 → 目标服务器端口/服务/安全组问题三、内网层排查解决服务器本地延迟、抖动问题很多公网卡顿根源其实是服务器内网、网卡本身异常这一步必须优先排查。1. 网卡状态检测最容易被忽略查看网卡是否存在错包、丢包、溢出只要有数值就说明硬件链路异常ifconfig # 或 ip -s link重点查看errors、dropped、overruns、frame只要这几个字段持续增长必然导致延迟抖动、间歇性丢包常见原因网线老化、松动、光模块故障网卡协商异常千兆网卡跑百兆、半双工模式机房交换机端口故障、端口拥塞查看网卡协商模式ethtool eth0确保为1000Base-T 全双工非自动协商、非半双工。2. 服务器资源过载导致的网络卡顿服务器 CPU、内存、IO 打满后系统无力处理网络报文会出现ping 抖动、延迟飙升属于假性网络故障。快速核查top查看 CPU 负载是否过高iostat -x 1查看磁盘IO是否100%占用free -h查看内存是否耗尽、Swap占用过高系统资源拥堵会直接导致网络报文处理延迟表现为 ping 不稳定、业务超时。3. 内网ARP冲突、广播风暴局域网内IP冲突、ARP异常会导致内网转发混乱延迟忽高忽低整机网络极不稳定。排查命令查看是否存在同一个IP对应多个MAC、MAC地址频繁跳动存在则为ARP冲突需固定IP、绑定ARP。四、公网层排查解决跨网、抖动、延迟高问题确认内网无问题后卡顿全部来自公网链路、运营商、云平台策略。1. 带宽跑满、流量拥堵高峰期带宽占满报文排队拥堵直接造成延迟飙升、抖动严重。排查流量占用# 安装流量监控 yum install iftop -y # 查看实时流量 iftop -i eth0常见场景爬虫、下载、大文件传输、CC攻击占满带宽导致正常业务卡顿。2. 安全组/防火墙限速、丢包云服务器高发问题安全组、防火墙、云平台防护规则会对高频请求、异常报文进行拦截、限流。表现ping 偶尔超时、延迟跳变无规律卡顿。排查方式查看云平台安全组、WAF、流量风控日志临时关闭服务器防火墙测试systemctl stop firewalld3. 跨网延迟最常见的高延迟原因电信、联通、移动三大运营商互通存在壁垒电信用户访问移动服务器 → 延迟高、抖动大跨网链路需要中转极易出现不稳定解决方式开启智能DNS、CDN、多线BGP机房彻底解决跨网卡顿。4. MTU 值不匹配导致的隐性卡顿MTU 是单包最大传输单元服务器、路由器、运营商 MTU 不统一会导致数据包分片、重传表现为小流量ping正常、大流量业务卡顿。排查测试ping -s 1472 服务器IP -c 100大包丢包、延迟高就是 MTU 不匹配问题常规服务器默认设置MTU1500即可。五、特殊场景无丢包但延迟极高很多时候 mtr 无丢包但延迟持续偏高大概率是以下问题运营商链路绕路、跨省中转节点带宽拥堵、队列排队严重服务器内核网卡队列参数不合理TCP 连接数过多、端口队列占满查看TCP连接状态ss -s连接数过高、TIME_WAIT 堆积会持续拉高网络延迟。六、全网排查标准流程直接套用本地ping测试区分是本地网络还是服务器网络问题内网ping网关确认服务器内网、网卡是否正常mtr链路检测精准定位卡顿丢包的路由节点检查网卡状态排查错包、协商异常、硬件故障核查服务器资源排除CPU、IO、内存过载导致的假性卡顿监控实时流量排查带宽跑满、异常流量攻击检查防护策略安全组、防火墙限流拦截问题核查跨网/MTU解决隐性延迟、抖动问题七、长期优化彻底告别网络卡顿优先选择BGP多线机房解决跨网延迟问题配置流量监控、延迟告警提前发现链路波动优化TCP内核参数缓解端口队列、TIME_WAIT堆积定期检查网卡、交换机设备更换老化硬件

相关新闻