a8222021 发表于 2021-11-11 09:21:37

【案例】故障排查——分流卡顿

背景描述

用户有电信专线和广电专线若干,主要业务是抖音快手和微信。之前默认走的是电信专线,现在需要分流抖音快手和微信到广电线路上缓解电信线路压力。
但是分流之后效果不理想很多视频没法播放,有些页面也加载不出来。

排查过程

Panabit上有NPM这个功能可以看到tcp连接建立各阶段的延时,首先找一个用户看下连接信息。发现广电线路上访问的服务延时普遍偏高。


这种情况可能是线路问题或者是DNS调度问题导致的,检查网卡有crc错误计数增加,用户更换尾纤,之后还是反馈很卡,甚至播放不了视频。


排除了线路问题,剩下可能就是DNS调度的问题导致的了,首先在连接信息查看用户DNS管控确实没有做牵引,帮助用户找了域名配合做了牵引和分流。
在流量概况可以看到,需要分流的应用流量已经全部识别到自定义协议。并且做了DNS管控之后,连接的延时明显降了很多看着正常。



但是用户还是会反馈刷视频会有视频无法播放,只要是能播放的就比较流畅,播放不了的就一直播放不了。
给用户单机走到广电线路上正常不会出现这个问题,并且发现会有一些访问私网IP的流量识别的是其它WEB视频。


检查内网并没有这些IP,并且tracert发现是广电那边的IP,推测是广电那边的缓存服务器给重定向了,导致Panabit识别成其他的流量走电信出去无法访问,给访问这整个C段的流量NAT到广电线路测试之后用户反馈正常。
页: [1]
查看完整版本: 【案例】故障排查——分流卡顿