测试 bug 问题分析 - 上传图片超时
最近在测试上遇到一个莫名奇妙的问题,最后也没有得到具体是哪块的原因,看各位大佬有没有思路??
一 、背景
现在我们有三台服务器,用来布两套环境。其中另外一台服务器3配置的 tomcat ,用来做文件管理之类的。两套环境完全一样的代码和配置,环境1部在服务器1,环境2部在服务器2。
二、问题
上传照片大于4MB的图片时候服务器2会卡顿 tomcat 报超时,但是服务器1没有任何问题。
三、排查过程
1、排查服务器 cpu 和 内存 问题
服务器 cpu 和 内存,发现没有异常,故排除
2、排查线程问题
在上传时候开了多线程,没有用线程池(老代码),arthas 和 dunp文件看线程没有任何问题
3、更改 tomcat 超时时间 20s -> 40s
因为主要报的是超时,所以更改了超时时间,但是是治标不治本的。
4、用别的服务器 ping 服务器 3, 均出现丢包问题 loss 在 5 左右
在这里大致就排除了代码的问题,为了验证这个问题,就用同样的代码在别的服务器运行,就没有发现有这个问题。因此在此时就锁定了是服务器本身的问题,但是具体是网络还是网卡还是其他的问题,还需要进行深度的排查。
5、排查服务器本身问题
在发现 ping 出 loss 的情况下,然后就在两个测试服务器调同一个接口,发现相应时间有很大的差别,一个是 100 ms 左右,但是有问题的都在 800 ms 上下。
因为我们用的是阿里云服务器,有可视化监控,可以看到网速能达到 10 M/S,可以看出网络的速度是没有问题的。
四、问题解决
最后尝试重启服务器,问题就解决了。。但是具体的问题我们现在推测是网卡的问题,但是无法的到验证了。
重启大法好!!!!