在linux中经常会对程序进行测试,开发完的程序推送到板子上就可以运行测试,一般情况下都能正常运行,但是遇到异常情况就需要对程序的cpu占用率进行分析,其中一种隐蔽的异常情况是io阻塞问题。
Io阻塞就是一段时间内,通常是几秒钟时间内有频繁的读写文件操作,或者有频繁的网络数据传输,导致正在运行的程序数据出现阻塞或中断,进而影响程序的正常逻辑运行导致出错的现象。如何判断io阻塞,判断io阻塞的方法可以用命令top查看io项百分比,或者idle项百分比是否降低以及当前cpu各项占用率,也可以将占用率依次写入日志以便按对应时间查找。正常情况下io占用率是0,如果出现io阻塞其占用率会升高到百分之几。一般小比率的阻塞不会对程序产生影响,只有频繁的大规模的日志或图像保存操作才可能影响程序运行。
Io阻塞对程序的影响通常表现在传感器数据突然中断,对slam系统来说其轮式里程计的数据会突然为0,阻塞结束后会收到里程计突变数据,之后导致预测位姿错误,导致定位错误,甚至定位丢失。
针对io阻塞的改进方法有,减少程序中频繁的读写io操作,以及保存图像和日志操作,或者切换效率高的日志库例如spdlog, 或者对需要保存的文件以及日志执行压缩操作压缩后再保存。同时程序中也要有关于阻塞的判断,防止跳变数据产生或者对跳变数据进行修复等,从一定程度上减小阻塞的影响,提高程序运行的稳定性。