科普:ROC AUC与PR AUC

embedded/2025/3/1 7:09:20/
aidu_pl">

在评价二分类模型性能时,有许多评价指标,其中,有一对是用面积AUC(Area Under the Curve)做评价的:ROC AUCPR AUC

本文我们对ROC AUCPR AUC进行多维度对比分析:


一、定义与核心原理

维度ROC AUCPR AUC
全称Receiver Operating Characteristic AUCPrecision-Recall AUC
横轴假正率(FPR)= FP / (FP + TN)召回率(Recall)= TP / (TP + FN)
纵轴真正率(TPR/Recall)= TP / (TP + FN)精确率(Precision)= TP / (TP + FP)
曲线生成方式调整分类阈值,计算不同阈值下的TPR和FPR调整分类阈值,计算不同阈值下的Precision和Recall
数值意义模型对正负样本的全局排序能力模型对正类样本的查准与查全的综合能力

二、使用场景对比

场景类型ROC AUCPR AUC
类别平衡数据适用(如男女用户分类)适用,但ROC AUC更直观
中度不平衡仍可用,但需谨慎解读(如正类占10%)更优(如用户流失预测)
严重不平衡易虚高(如欺诈检测正类占0.1%)首选(直接反映正类性能)
业务需求需全局排序(如信用评分)需聚焦正类(如癌症筛查)
典型场景示例
  1. 金融风控(正类占1%)
    • ROC AUC=0.95:可能因负类主导而虚高,无法反映欺诈识别的实际效果。
    • PR AUC=0.35:直接暴露模型对正类的低识别能力,需优化特征或采样策略。
  2. 广告点击预测(正类占5%)
    • ROC AUC=0.85:表明模型整体区分能力良好。
    • PR AUC=0.65:提示需提高精确率(减少误推成本)。

三、选择标准

决策因素优先选择ROC AUC优先选择PR AUC
正类比例正类≥10%正类<10%
业务目标需全局风险排序(如客户分层)需精准识别正类(如医学诊断)
误判成本容忍度可接受较高误判(如推荐系统)误判成本高(如法律审核)
模型解释性需直观展示整体性能需聚焦正类细节表现

四、与类别不平衡程度的关系

不平衡程度ROC AUC表现PR AUC表现
平衡(1:1)可靠,反映全局性能(如AUC=0.9优秀)可靠,与ROC AUC互补(如AUC=0.88)
中度不平衡(1:10)可能虚高(如AUC=0.85,实际正类识别差)更敏感(如AUC=0.6,提示需优化)
严重不平衡(1:100)虚高严重(如AUC=0.95但正类全漏)真实反映问题(如AUC=0.2,模型无效)
示例分析
  • 正类占0.5%的欺诈检测
    • ROC AUC=0.92:看似优秀,但可能因模型正确分类大量负类(TN)导致虚高。
    • PR AUC=0.15:直接显示模型对欺诈交易的识别能力极差(随机模型的PR AUC=0.005)。
  • 结论:在严重不平衡时,PR AUC是唯一可信指标

建议

  • 类别不平衡时:PR AUC是黄金指标,ROC AUC仅作参考。
  • 平衡数据时:两者互补,优先ROC AUC。
  • 业务决策时:以PR曲线选择阈值,以PR AUC评估模型优先级。

附:正样本比例与不平衡程度及推荐评估指标的对应表


正样本比例不平衡程度推荐评估指标备注
<1%严重不平衡PR AUC、F1分数、召回率(Recall)、MCC、G-Mean优先关注正类的查全率(Recall)和综合性能(PR AUC),避免ROC AUC的虚高误导。
1%~5%严重不平衡PR AUC、F1分数、召回率(Recall)、MCC、G-Mean需结合过采样(SMOTE)或代价敏感学习,重点关注少数类的识别能力。
5%~10%中度不平衡PR AUC、F1分数、G-Mean、平衡准确率(Balanced Accuracy)、ROC AUC平衡查准与查全,可辅以ROC AUC验证全局排序能力。
10%~20%轻微不平衡ROC AUC、F1分数、精确率(Precision)、PR AUC常规处理即可,关注业务核心指标(如误判成本)。
20%~40%较平衡准确率(Accuracy)、ROC AUC、F1分数、精确率/召回率(按业务需求侧重)无需特殊处理,模型优化重点转向特征工程或复杂度调整。
>40%平衡准确率(Accuracy)、ROC AUC、混淆矩阵(TP/FP/TN/FN)常规分类任务,指标选择取决于业务容忍度(如FP或FN的代价)。

主要指标
  1. 严重不平衡(<5%)

    • 核心指标:PR AUC(直接反映正类性能)、召回率(避免漏检)。
    • 辅助指标:MCC(综合所有类别)、G-Mean(平衡正负类识别能力)。
    • 禁用指标:准确率(虚高且无意义)。
  2. 中度不平衡(5%~10%)

    • 核心指标:PR AUC(仍优先)、F1分数(平衡查准与查全)。
    • 辅助指标:ROC AUC(验证全局能力)、平衡准确率(简单鲁棒)。
  3. 轻微不平衡(10%~20%)

    • 核心指标:ROC AUC(全局排序)、F1分数(平衡性能)。
    • 业务适配:若需高精确率(如广告推荐),优先精确率;若需高召回率(如用户流失预警),优先召回率。
  4. 实际应用

    • 金融风控:严重不平衡时,PR AUC + 召回率 + 误判成本矩阵。
    • 医学诊断:中度不平衡时,召回率 + 特异度(Specificity)。
    • 推荐系统:轻微不平衡时,精确率 + ROC AUC。


http://www.ppmy.cn/embedded/168994.html

相关文章

网络安全清单

&#x1f345; 点击文末小卡片 &#xff0c;免费获取网络安全全套资料&#xff0c;资料在手&#xff0c;涨薪更快 移除(Deprovisioning) 移除&#xff08;Deprovisioning&#xff09;是一个除去现存用户帐户的过程&#xff0c;其包括用户帐户登记和设备失效。 分布式编码规则…

更改MacOS用户名在终端的显示

Macbook Terminal 终端中修改名称显示 用户名组成修改终端的PS1&#xff08;仅修改显示&#xff0c;不改实际用户名&#xff09;Basics 用户名组成 MacBook pro 终端显示的用户名通常由你的 主机名 和 账户名 组成&#xff0c;例如&#xff1a; 用户名主机名 &#xff5e; %我…

2025影视泛目录无需缓存技术:苹果CMS站群Search聚合版蜘蛛诱捕

引言&#xff1a;泛目录技术的进化与突破 在影视资源聚合领域&#xff0c;苹果CMS凭借其灵活的二次开发能力持续引领技术革新。本文介绍的2025苹果CMS霸屏Search词聚合定制版&#xff0c;基于苹果CMS V10新版框架深度开发&#xff0c;融合无缓存刷新技术与站群智能管理两大核心…

大白话html 第三章学习表格和表单

大白话html 第三章学习表格和表单 表单 表单用于收集用户输入的数据&#xff0c;比如注册账号、登录、填写调查问卷等都要用到表单。 文本输入框&#xff1a;用<input>标签&#xff0c;type"text"表示普通的文本输入框。用户可以在里面输入文字。例如&#…

齐向东:十大态势态势威胁,七大防护

《网安面试指南》https://mp.weixin.qq.com/s/RIVYDmxI9g_TgGrpbdDKtA?token1860256701&langzh_CN 5000篇网安资料库https://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247486065&idx2&snb30ade8200e842743339d428f414475e&chksmc0e4732df793fa3bf39…

区县级水司一体化抄表营业收费系统设计思路

本文围绕县级水司抄表营业系统展开研究&#xff0c;分析了县级水司营业管理的现状及需求&#xff0c;阐述了营业系统的设计原则、总体架构、功能模块设计等内容&#xff0c;同时探讨了系统的应用效果和实施要点。通过建设先进的营业系统&#xff0c;有助于县级水司提升管理效率…

第13天:数据序列化实战 - 从内存到磁盘的完美转换

第13天&#xff1a;数据序列化实战 - 从内存到磁盘的完美转换 一、今日学习目标 &#x1f9f1; 掌握二进制序列化的原理与实现&#x1f4c4; 学习JSON格式的序列化方法&#x1f4be; 完成学生信息管理系统的通用数据存储方案&#x1f50d; 理解不同序列化格式的适用场景 二、…

每日定投40刀BTC(5)20250223 - 20250226

定投 已亏16% 《播种季的独白》我在深秋埋下种子泥土里 数字在发芽十六颗星星坠落化作肥料 渗入根系月光在K线上流淌浇灌着 未破土的希望每一粒亏损都是春天埋下的伏笔我数着年轮一圈圈 都是沉默的诺言当根系触到暗河嫩芽就会顶开冻土这是播种的季节我在等一场迟到的春雨