ANR系列(三)——ANR分析套路

news/2024/9/22 14:41:31/

前言

在懂得了ANR的发生原理和监控原理之后,是时候针对项目中的ANR进行分析了,在分析前要知道ANR的分析套路一般是怎么分析的

分析ANR问题需要哪些日志

  • Trace日志:当ANR产生的时候,系统会dump此时的top进程中Thread的运行状态,将其保存在trace文件上
  • AnrInfo日志:当ANR产生的时候,logcat会打印出当前AnrInfo信息,该信息可以通过ActivityManagerService.getProcessesInErrorState()方法获取
  • Bugreport日志:当前Android设备上的错误报告,包含设备日志、堆栈轨迹和其他诊断信息,该信息可以通过adb bugreport D:\命令获取

ANR的分析思路

  • 一、看Trace信息
    • 死锁堆栈、业务堆栈、IPC Block堆栈、系统堆栈
  • 二、看关键字
    • Load、CPU、Slow Operation、Kswapd、Mmcqd、Kwork、Lowmemorykiller、onTrimMemory
  • 三、看系统cpu负载分布
    • 通过系统整体CPU负载User、Sys、IOWait占比,判断CPU资源紧张,还是IO资源紧张,进一步分析当前负载过高是发生在应用空间还是系统空间
  • 四、看进程CPU
    • 观察进程CPU占比CPU usage from 37010ms to 0ms ago101% 23326/com.demo: 32% user + 68% kernel
  • 五、看线程CPU:
    • 对比各线程CPU占比,以及线程内部user和kernel占比,可以从目标进程内部分析各个线程的(utm,stm),进一步分析是哪个线程有问题了
  • 六、看消息调度锁定细节
    • 发生ANR时,没有一个消息是无辜的

Trace日志

----- pid 23326 at 2023-02-21 00:15:26 -----
Cmd line: com.demo
Build fingerprint: 'google/android_x86/x86:7.1.2/N2G48C/N975FXXU1ASGO:user/release-keys'
ABI: 'x86'                                 //x86一般为模拟器
Build type: optimized
Zygote loaded classes=4380 post zygote classes=9911
Intern table: 48884 strong; 554 weak
JNI: CheckJNI is off; globals=1079 (plus 1467 weak)
Libraries: ...
Heap: 17% free, 43MB/52MB; 674957 objects  //已分配堆内存大小52MB,其中已用43MB,剩下17%空余,共分配了674957个对象
Total time spent in GC: 6.414s             //GC用过了多少时间
Mean GC size throughput: 244MB/s
Mean GC object throughput: 6.31642e+06 objects/s
Total number of allocations 41189203       //进程创建到现在一共创建了多少对象
Total bytes allocated 1GB                  //进程创建到现在一共申请了1GB内存
Total bytes freed 1GB                      //进程创建到现在一共释放了1GB内存 
Free memory 8MB                            //不扩展堆堆情况下可用的内存
Free memory until GC 8MB                   //GC前的可用内存
Free memory until OOME 212MB               //OOM之前的可用内存,这个值很小,说明内存紧张
Total memory 52MB                          //当前总内存(已用+可用)
Max memory 256MB                           //进程最多能申请的内存
Zygote space size 1552KB
Total mutator paused time: 177.563ms
Total time waiting for GC to complete: 89.366ms
Total GC count: 130                        //GC次数
Total GC time: 6.414s                      //GC时长
Total blocking GC count: 1                 //GC被block次数以及时长
Total blocking GC time: 100.948ms
suspend all histogram:	Sum: 65.115ms 99% C.I. 5.440us-15646.719us Avg: 478.786us Max: 35628us
DALVIK THREADS (65):                       //当前进程共有65个线程"Signal Catcher" daemon prio=5 tid=3 Runnable| group="system" sCount=0 dsCount=0 obj=0x12c3a310 self=0xb6ed7e00| sysTid=23332 nice=0 cgrp=default sched=0/0 handle=0xc2ba6910| state=R schedstat=( 63328804 15730865 32 ) utm=3 stm=2 core=3 HZ=100| stack=0xc2aaa000-0xc2aac000 stackSize=1014KB| held mutexes= "mutator lock"(shared held)// Signal Catcher:线程名  daemon: 守护线程  prio:线程优先级  tid:线程内部id  Runnable: 线程状态
// group: 线程所属的线程组  sCount:线程挂起次数  dsCount:用于调试的线程挂起次数  obj:当前线程关联的Java线程对象  self:当前线程地址
// sysTid:线程真正意义上的tid  nice:调度优先级,值越小优先级越高  cgrp: 进程所属的进程调度组  sched: 调度策略  handle:函数处理地址
// state:线程状态  schedstat:CPU调度时间统计,依次表示cpu运行时间、RQ队列等待时间、cpu调度切换次数  utm: 用户态的cpu时间  stm:内核态的cpu时间  core:该线程的最后运行所在核  HZ:时钟频率
// stack:线程栈的地址空间  stackSize:栈的大小
// mutexes:所持有 mutex 类型,有独占锁(exclusive)和 共享锁(shared)两类

AnrInfo日志

ANR in com.demo (com.demo/com.demo.SplashActivity)
PID: 23326
Reason: Input dispatching timed out (Waiting because no window has focus but there is a focused application that may eventually add a window when it finishes starting up.)
//系统负载:表示不同时间段的系统整体负载, 依次表示ANR发生前 1分钟、前5分钟、前15分钟时间段的cpu负载
Load: 8.44 / 8.67 / 8.1
//进程cpu使用率:表示当前ANR发生前的进程cpu使用率
CPU usage from 37010ms to 0ms ago (2023-02-21 00:14:49.456 to 2023-02-21 00:15:26.466):101% 23326/com.demo: 32% user + 68% kernel / faults: 257 minor0.9% 1298/system_server: 0.5% user + 0.4% kernel / faults: 10086 minor 30 major0.1% 1387/com.android.systemui: 0% user + 0% kernel / faults: 3023 minor 4 major0.1% 1744/com.android.launcher3: 0% user + 0% kernel / faults: 124 minor 4 major0% 1105/surfaceflinger: 0% user + 0% kernel0% 1110/audioserver: 0% user + 0% kernel0% 7/rcu_sched: 0% user + 0% kernel0% 275/kworker/0:1: 0% user + 0% kernel0% 1669/android.ext.services: 0% user + 0% kernel / faults: 117 minor 2 major
//系统cpu使用率总汇
25% TOTAL: 8.3% user + 17% kernel + 0% iowait
CPU usage from 1434ms to 1936ms later (2023-02-21 00:15:27.900 to 2023-02-21 00:15:28.402):102% 23326/com.demo: 29% user + 73% kernel100% 23380/AsyncInit: 27% user + 73% kernel
24% TOTAL: 7% user + 17% kernel
  1. 先分析系统负载Load字段,8.44 / 8.67 / 8.1说明系统当前的负载还算可以
  2. 再从cpu信息找到当前应用cpu使用率高达101%,从下面可以找到当前的线程卡在AsyncInit方法上

Bugreport日志

Bugreport日志比较冗长,包含设备的各种信息,对于ANR来说,我们只要过滤ANR需要的关键字即可

1、搜索am_anr

通过当前关键字可以找到最终发送ANR的罪魁祸首

03-07 22:01:47.632  1000  1675 15617 I am_anr  : [0,6267,com.demo,953695814,executing service com.demo/com.demo.hensen.MyService]

2、搜索ANR in

通过当前关键字可以找到最终发送ANR的罪魁祸首

E ActivityManager: ANR in com.demo.hensen.MyService
E ActivityManager: PID: 3036
E ActivityManager: Reason: executing service com.demo/com.demo.hensen.MyService

http://www.ppmy.cn/news/40379.html

相关文章

外部navicat无法连接mysql数据库的问题原因及解决方案

问题起因是这样:在linux操作中的docker中部署了一个数据库,数据库启动之后,端口也映射了(创建容器时用 -p 30036:3306进行的映射),但是在外不想使用navicat连接时,怎么都连不上,本人遇到的问题如下 一、端…

ESXI6.5 为RA 共享存储

今天想在自己的ESXI6.5环境下的虚拟机安装一套19C RAC做zabbix客户端做测试,添加共享磁盘鼓捣了一上午,找了很多资料(没找到很全的),东拼西凑,终于把共享磁盘添加上了,写下来做个记录 1、安装E…

Kafka与内置Zookeeper常用命令

存放路径(看自己情况) d:\work\kafka_2.13-3.4.0 windows运行路径(看自己的情况) d:\work\kafka_2.13-3.4.0\bin\windows 启动服务器 (先启动zookeeper服务器,再启动kafka) !&…

《算法竞赛进阶指南》0x41 并查集

0x41 并查集 程序自动分析 题意: 一些变量,之间是相等与不相等关系。询问所有约束条件是否可以同时满足 解析: 并查集。并查集维护相等的变量,对于不相等变量,检查是否在在同一并查集里。注意离散化 代码&#x…

SD-WAN基本介绍

一、SD-WAN是什么?它能为我们带来什么? SD-WAN,即软件定义广域网络,是将SDN技术应用到广域网场景中所形成的一种服务。这种服务用于连接广阔地理范围的企业网络、数据中心、互联网应用及云服务,旨在帮助用户降低广域网…

NFS介绍

NFS简介 NFS(Network File System)是一种分布式文件系统,可在不同的机器之间共享文件。它最初是由Sun公司开发的,现在已成为一种标准的网络文件系统。NFS将网络上的一个目录挂载到另一个机器上,使得另一个机器可以访问…

Hive了解

目录 1.1 什么是Hive 1.2 Hive发展历程 1.3 Hive架构原理 1.1 什么是Hive 1)Hive简介 Hive是由Facebook开源,基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 那为什么会有Hive呢&a…

希尔排序的简单理解

详细描述 希尔排序又称为缩小增量排序,主要是对序列按下标的一定增量进行分组,对每组使用直接插入排序算法排序;随着增量逐渐减小,每组包含的关键字越来越多,当增量减至 1 时,整个文件恰被分成一组&#x…