Panabit-Luo 发表于 2016-6-7 13:26:51

PA小课堂 | 网吧高峰时段ADSL线路丢包问题的排查与解决办法





最近我们河北的一个代理商,他遇到一个问题。他维护了有两家相邻的网吧,两家的外网都是1根联通光纤+1根电信光纤+1根AD,A网吧用的是全新官方PX1硬件,B网吧用的是老的硬件,两家网吧的策略一样,A网吧每到高峰期的时候AD丢包严重,B网吧不丢包。他把两家的AD对调,情况还是一样。为了确定问题,我远程看了这个网吧。
第一阶段,怀疑硬件有问题。查看数据网卡的内部信息,网卡上没有丢包。这个就不像是硬有问题。


第二阶段,怀疑AD线路对MAC地址做了什么限制,将A网吧的MAC地址换了一个,重播ping值一直正常,开始认为问题就这样解决了,为了验证这个,我到B网吧的AD上,把B网吧的AD的mac换成之前A网吧线路的MAC来测试,B网吧的AD一直无法拨上号,这样看来似乎问题的确和MAC有关。

第三阶段,将B网吧恢复后,我继续观察A网吧ping情况,A网吧ping值开始很正常,但是没过多久又开始丢包了,看来换MAC这招不灵。我对比两家网吧AD的流量情况,发现A网吧流量下行在60M左右,上行在2M左右。而B网吧的流量下行只有20M左右,上行只有几百K。A网吧的上机人数有80多,B网吧只有40多。开始怀疑是不是A网吧流量跑太高了,于是通过策略,将A网吧的上行压到了1M以下。这样过后,丢包的确是降低了很多了。貌似问题出在带宽使用量这块。

第四阶段,压制了A网吧AD线路的带宽后,丢包现象的确有了很大的好转,但是还是有丢包,对比B网吧,B网吧完全没有丢包。这个感觉不对。而且A网吧在丢包的情况下,带宽仍然能跑到60M。再次询问了用户情况,在丢包的时候网页会特别卡。原来AD还跑了网页的流量,那么先解决网页问题吧。暂时网页走回光纤。当做完这个策略,发现AD的ping值正常了,AD的流量还是在60M左右。这次不能急着下结论,再观察观察再说。Ping值一直稳定,看样子是AD不能跑网页,为了证明这个,将网页再次分流到AD上,没过两分钟,AD马上又开始丢包了。再把网页走回光纤,丢包现象马上消失。反复测试几次,确定就是AD不能跑网页。推测是运营商通过网页做了共享检测,用户数不允许并发太高。

将网页走回主线后,AD不会再丢包了。但是这样网吧的光纤成本就要增加。导致AD丢包的原因是网页的内网用户并发数过高,然后就触发了运营商的限制策略。B网吧的人数比A网吧少一半,很少出现这样的问题。AD线路不是完全不能跑网页,只是少跑一些就行。那么我们就在PA上把光纤和AD组成一个线路群组,这个群组的负载方式为源地址,光纤和AD的权重为2:1,将网页的流量分流到这个群组上,这样就能降低AD线路的网页并发,同时也降低了光纤的带宽成本。如果高峰期AD的网页量还是比较大,再尝试修改权重比例,比如改成3:1。






hddufeng 发表于 2016-7-7 23:49:08

这个真不错,谢谢

maowp2002 发表于 2016-9-21 21:14:02

谢谢分享,收藏。。。

qq303016469 发表于 2016-12-9 16:33:51

实际情况中,有遇到,非常感谢!
页: [1]
查看完整版本: PA小课堂 | 网吧高峰时段ADSL线路丢包问题的排查与解决办法