Android12的ANR解析

ops/2024/11/19 4:15:21/

0. 参考:

ANR分析
深入理解 Android ANR 触发原理以及信息收集过程

1.ANR的触发分类:

ANR分为4类:

  • InputDispatchTimeout:输入事件分发超时5s,包括按键和触摸事件。
  • BroadcastTimeout:比如前台广播在10s内未执行完成,后台60s
  • ServiceTimeout:前台服务在20s内未执行完成,后台服务未在200s内完成。
  • ContentProviderTimeout:contenProvider在publish后超时10s

2.ANR的触发机制

2.1基本概念

  • ANR 的检测和处理逻辑主要写在 AMS(Activity Manager Service) 进程中
  • 当超时事件触发后,AMS 会记录下应用主线程的状态,并调用 ActivityManagerService.appNotResponding() 方法来启动 ANR 处理流程。
  • 当应用程序在UI线程阻塞太长时间,就会弹出系统弹框,询问我们继续等待还是关闭应用程序,此时发生了ANR。

3.Service,BroadCast,Provider触发ANR:

3.1 ANR是在发生这些调用的时候,就启用"定时炸弹"。

  • 1.APP侧:
    在Activity中调用startService后,调用链:ContextImpl.startService()->ContextImpl.startServiceCommon()
    1. AMS侧:
      ActivityManagerService.startService()
      ->ActiveServices.startServiceLocked()
      ->ActiveServices.startServiceInnerLocked()
      ->ActiveServices.bringUpServiceLocked()
      ->ActivieServices.realStartServiceLocked()
      ->ActivieServices.realStartServiceLocked
  • 2.1 其中realStartServiceLocked主要通过向AMS发送一个Handler的延迟消息告诉AMS这个调用超时了。
    private void realStartServiceLocked(ServiceRecord r, ProcessRecord app,IApplicationThread thread, int pid, UidRecord uidRecord, boolean execInFg,boolean enqueueOomAdj) throws RemoteException {  // 2
...............// 记录此调用的开始---原因是 "create"// 从此处开始倒计时--发送handler消息到AMSbumpServiceExecutingLocked(r, execInFg, "create", null /* oomAdjReason */);
................// 通知APP启动Service,执行 handleCreateService// 调用到 ApplicationThread.scheduleCreateServicethread.scheduleCreateService(r, r.serviceInfo,mAm.compatibilityInfoForPackage(r.serviceInfo.applicationInfo),app.mState.getReportedProcState());
..........
  • 2.2 ActivieServices.bumpServiceExecutingLocked---->ActivieServices.scheduleServiceTimeoutLocked
    这个延迟时间就是1中说到的超时20s, 对应ActiveService的SERVICE_TIMEOUT变量;
    void scheduleServiceTimeoutLocked(ProcessRecord proc) {  // 2
...................Message msg = mAm.mHandler.obtainMessage(ActivityManagerService.SERVICE_TIMEOUT_MSG);msg.obj = proc;mAm.mHandler.sendMessageDelayed(msg, proc.mServices.shouldExecServicesFg()? SERVICE_TIMEOUT : SERVICE_BACKGROUND_TIMEOUT);  // 发送延迟消息给AMS的Handler}
  • 2.3 scheduleCreateService
    会通过Binder调用回APP侧,最终会调用到ApplicationThread.scheduleCreateService
        public final void scheduleCreateService(IBinder token,ServiceInfo info, CompatibilityInfo compatInfo, int processState) {updateProcessState(processState, false);CreateServiceData s = new CreateServiceData();s.token = token;s.info = info;s.compatInfo = compatInfo;sendMessage(H.CREATE_SERVICE, s);  // 发送Handler消息}// 找到处理Handler消息的地方:handleCreateService最终会调用到这个Service的onCreate方法上。case CREATE_SERVICE:if (Trace.isTagEnabled(Trace.TRACE_TAG_ACTIVITY_MANAGER)) {Trace.traceBegin(Trace.TRACE_TAG_ACTIVITY_MANAGER,("serviceCreate: " + String.valueOf(msg.obj)));}handleCreateService((CreateServiceData)msg.obj);  // 执行Service的回调onCreateTrace.traceEnd(Trace.TRACE_TAG_ACTIVITY_MANAGER);break;
  • 3 小结
    1)最开始调用了startService来触发AMS发送一个延迟为SERVICE_TIMEOUT(20s)的Handler事件,
    2)并最终回调到实现了这个Service的onCreate函数。
    3)如果超过了20s这个Handler消息还是没被取消,那么就会去触发AMS的ANR机制。

3.2 取消延迟发送的Handler消息, “取消炸弹”

  • 在上面描述的正常流程中,会调用到handleCreateService,最终会调用removeMessages取消3.1中的延迟发送的Handler消息
    private void handleCreateService(CreateServiceData data) { 
.....service.onCreate();   // 进入service的onCreate回调
....// Service启动完成,需要通知AMSActivityManager.getService().serviceDoneExecuting(data.token, SERVICE_DONE_EXECUTING_ANON, 0, 0);
.....}public void serviceDoneExecuting(IBinder token, int type, int startId, int res) {synchronized(this) {if (!(token instanceof ServiceRecord)) {Slog.e(TAG, "serviceDoneExecuting: Invalid service token=" + token);throw new IllegalArgumentException("Invalid service token");}// 执行到ActivityManagerService的 serviceDoneExecuting方法mServices.serviceDoneExecutingLocked((ServiceRecord) token, type, startId, res, false);}}// ActivityManagerService的 serviceDoneExecuting方法private void serviceDoneExecutingLocked(ServiceRecord r, boolean inDestroying,boolean finishing, boolean enqueueOomAdj) {
......// 将Handler消息取消mAm.mHandler.removeMessages(ActivityManagerService.SERVICE_TIMEOUT_MSG, r.app);
..........}

3.3 ANR的触发, “炸弹引爆”

  • 就是延迟发送的Handler消息处理,
    在ActivityManagerService.java可看到处理SERVICE_TIMEOUT_MSG的代码
            case SERVICE_TIMEOUT_MSG: {// 调用到ActiveServices的serviceTimeout方法mServices.serviceTimeout((ProcessRecord) msg.obj);} break;//com.android.server.am.ActiveServices.javavoid serviceTimeout(ProcessRecord proc) {................// 计算是否超时,if (anrMessage != null) {  // 超时// 触发超时机制,mAm是AMS,mAnrHelper是AnrHelpermAm.mAnrHelper.appNotResponding(proc, anrMessage);  }}
  • 调用到AnrHelper的appNotResponding方法,最终是调用到AmrConsumerThread().start方法来处理ANR
    void appNotResponding(ProcessRecord anrProcess, String annotation) {appNotResponding(anrProcess, null /* activityShortComponentName */, null /* aInfo */,null /* parentShortComponentName */, null /* parentProcess */,false /* aboveSystem */, annotation);}void appNotResponding(ProcessRecord anrProcess, String activityShortComponentName,ApplicationInfo aInfo, String parentShortComponentName,WindowProcessController parentProcess, boolean aboveSystem, String annotation) {synchronized (mAnrRecords) {mAnrRecords.add(new AnrRecord(anrProcess, activityShortComponentName, aInfo,parentShortComponentName, parentProcess, aboveSystem, annotation));}startAnrConsumerIfNeeded();}private void startAnrConsumerIfNeeded() {if (mRunning.compareAndSet(false, true)) {new AnrConsumerThread().start();  // 启动AnrConsumerThread线程处理ANR}}
private class AnrConsumerThread extends Thread {@Overridepublic void run() {AnrRecord r;while ((r = next()) != null) {......//这里的r就是AnrRecordr.appNotResponding(onlyDumpSelf);......}}
}
private static class AnrRecord {void appNotResponding(boolean onlyDumpSelf) {//mApp是ProcessRecord,mErrorState是ProcessErrorStateRecordmApp.mErrorState.appNotResponding(mActivityShortComponentName, mAppInfo,mParentShortComponentName, mParentProcess, mAboveSystem, mAnnotation,onlyDumpSelf);}
}

调用到ProcessErrorStateRecord.appNotResponding来弹出无响应弹出。或者dump操作啥的,就是平时见到的ANR

3.4 ANR做了哪些事情

  • 主要就是记录ANR错误的相关信息 + 弹出ANR的弹窗
  • 最终会调用到ProcessErrorStateRecord的appNotResponding,下面来研究ProcessErrorStateRecord.java的这个函数
    void appNotResponding(String activityShortComponentName, ApplicationInfo aInfo,String parentShortComponentName, WindowProcessController parentProcess,boolean aboveSystem, String annotation, boolean onlyDumpSelf) {  // 
........// 将ANR的相关信息记录到anr文件中StringBuilder info = new StringBuilder();
.....StringBuilder report = new StringBuilder();....................// 弹出ANR的Dialogif (mService.mUiHandler != null) {// Bring up the infamous App Not Responding dialogMessage msg = Message.obtain();msg.what = ActivityManagerService.SHOW_NOT_RESPONDING_UI_MSG;msg.obj = new AppNotRespondingDialog.Data(mApp, aInfo, aboveSystem);mService.mUiHandler.sendMessageDelayed(msg, anrDialogDelayMs);}}}
  • 小结:
    1)在调用得时候发送了延迟HANDLER消息:SERVICE_TIMEOUT_MSG
    2)到了延时时间,还未remove掉此handler消息,那么就会触发SERVICE_TIMEOUT_MSG的处理。
    3)最终调用到AnrHelper的appNotResponding来处理ANR

4.Input触发ANR:

4.1 从linux侧获取input事件

  • 如inputFlinger 讲解的内容,InputReader线程通过EventHub监听/dev/input读取输入事件,监听到事件则把消息传到InputDispatcher(即InputReader把消息写入mInBoundQueue队列)
  • InputDispatcher负责把输入事件分发给 目标应用窗口。

4.2 ANR相关

  • InputDispatcher的流程:
    input的ANR流程

4.3 ANR触发 代码流程梳理

  • InputDispatcher中的方法调用:
    1.有等待获取焦点的应用:当前时间超过Timeout,调用processNoFocusedWindowAnrLocked() 进一步确认
    2.存在window:当前时间超过事件响应的超时时间。调用onAnrLocked() 进一步确认。
> frameworks/native/services/inputflinger/dispatcher/InputDispatcher.cpp// 检查是否有任何连接的等待队列具有太旧的事件。如果我们等待事件被确认的时间超过窗口超时,
// 请引发 ANR。返回我们下次应该醒来的时间。
nsecs_t InputDispatcher::processAnrsLocked() {const nsecs_t currentTime = now();nsecs_t nextAnrCheck = LONG_LONG_MAX; // 下一次检查anr的时间// 检查我们是否正在等待一个聚焦窗口出现。如果等待时间过长就报 ANRif (mNoFocusedWindowTimeoutTime.has_value() && mAwaitedFocusedApplication != nullptr) {if (currentTime >= *mNoFocusedWindowTimeoutTime) {// 场景1: 触发noFocusedWindow的anrprocessNoFocusedWindowAnrLocked();mAwaitedFocusedApplication.reset();mNoFocusedWindowTimeoutTime = std::nullopt;return LONG_LONG_MIN;} else {// 请继续等待。我们将在mNoFocusedWindowTimeoutTime到来时放弃该事件。nextAnrCheck = *mNoFocusedWindowTimeoutTime;}}// 检查是否有任何连接 ANR 到期,mAnrTracker 中保存所有已分发事件(未被确认消费的事件)的超时时间nextAnrCheck = std::min(nextAnrCheck, mAnrTracker.firstTimeout());if (currentTime < nextAnrCheck) { // 最有可能的情况// 一切正常,在 nextAnrCheck 再检查一次return nextAnrCheck;}// 如果我们到达这里,则连接无响应。sp<Connection> connection = getConnectionLocked(mAnrTracker.firstToken());// 停止为此无响应的连接唤醒mAnrTracker.eraseToken(connection->inputChannel->getConnectionToken());// 场景2: 触发ANRonAnrLocked(connection);return LONG_LONG_MIN;
}

4.4 ANR在InputDispatcher的调用栈

dispatchOnce findFocusedWindowTargetsLocked processAnrsLocked processNoFocusedWindowAnrLocked onAnrLocked postCommandLocked updateLastAnrStateLocked processConnectionUnresponsiveLocked sendMonitorUnresponsiveCommandLocked sendWindowUnresponsiveCommandLocked runCommandsLockedInterruptible command 赋值mNoFocusedWindowTimeoutTime return 触发ANR检查 case 1: 失去焦点时间(mNoFocusedWindowTimeoutTime)过长 onAnrLocked(application) 向mCommandQueue中写入数据 return case 2: 连接过期,触发ANR, onAnrLocked(connection) onAnrLocked(connection) return 记录ANR相关 case 1 case 2 return 捕获 ANR 时 InputDispatcher 状态的记录。 处理postCommandLocked写入的 mCommandQueue 调用command处理 dispatchOnce findFocusedWindowTargetsLocked processAnrsLocked processNoFocusedWindowAnrLocked onAnrLocked postCommandLocked updateLastAnrStateLocked processConnectionUnresponsiveLocked sendMonitorUnresponsiveCommandLocked sendWindowUnresponsiveCommandLocked runCommandsLockedInterruptible command

6.排查思路:

  1. adb shell getevent后,点击屏幕,如果有打印,代表驱动是可以拿到点击事件的。如果没有则需要内核的同事查看。如果有则代表是Android的问题。


http://www.ppmy.cn/ops/134857.html

相关文章

【Linux学习】【Ubuntu入门】1-4 ubuntu终端操作与shell命令1

1.使用快捷键CtrlAltT打开命令终端&#xff0c;或者单击右键点击… 2.常用shell命令 目录信息查看命令&#xff1a;ls ls -a&#xff1a;显示目录所有文件及文件夹&#xff0c;包括隐藏文件&#xff0c;比如以.开头的 ls -l&#xff1a;显示文件的详细信息 ls -al&#xff1…

第8章利用CSS制作导航菜单

8.1 水平顶部导航栏 水平菜单导航栏是应用范围最广的网站导航设计&#xff0c;一般位于页面顶部。它适用性强&#xff0c;几乎适用于所有类型的网站&#xff0c;且设计难度低。若导航过于普通&#xff0c;无法承载复杂信息结构&#xff0c;在内容模块较多时&#xff0c;则需结…

vs2022搭建opencv开发环境

1 下载OpenCV库 https://opencv.org/ 下载对应版本然后进行安装 将bin目录添加到系统环境变量opencv\build\x64\vc16\bin 复制该路径 打开高级设置添加环境变量 vs2022新建一个空项目 修改属性添加头文件路径和库路径 修改链接器&#xff0c;将OpenCV中lib库里的o…

后端一次性返回数据,前端分页

vue 结合elementUI 分页组件&#xff0c;后端一次性返回数据&#xff0c;前端做分页 1.template中 <el-paginationsize-change"handleSizeChange":page-sizes"[10, 20, 50, 100]"style"float:right"current-change"currentChangeHandle…

C# 反射与动态编程

文章目录 1.反射&#xff08;Reflection&#xff09;1.1 什么是反射&#xff1f;1.2 反射的基本操作1.2.1 获取类型信息1.2.2 获取成员信息 1.3 调用成员1.4 实例化对象1.5 常见应用场景 2.动态编程2.1 什么是动态编程&#xff1f;2.2 dynamic 关键字2.3 动态对象和 ExpandoObj…

使用Python Flask构建Web应用

Flask 是一个轻量级的 Python Web 框架,以其灵活性和易用性受到开发者的喜爱。本文将详细介绍 Flask 的基本概念、安装方法、路由和视图函数、模板引擎、表单处理、数据库集成等内容,并通过一个具体的示例来展示如何使用 Flask 构建一个简单的博客应用。 1. Flask 概述 Fla…

ollama+springboot ai+vue+elementUI整合

1. 下载安装ollama (1) 官网下载地址&#xff1a;https://github.com/ollama/ollama 这里以window版本为主&#xff0c;下载链接为&#xff1a;https://ollama.com/download/OllamaSetup.exe。 安装完毕后&#xff0c;桌面小图标有一个小图标&#xff0c;表示已安装成功&…

Ubuntu 18 EDK2 环境编译

视频&#xff1a;在全新的Ubuntu上从零搭建UEFI的EDK2开发环境 开始&#xff1a;git clone https://github.com/tianocore/edk2.git 开始编译BaseTools前先更新一下子模块&#xff1a;git submodule update --init &#xff0c;然后&#xff1a;make -C BaseTools/ 问题1&a…