机器学习/深度学习——关于分类任务的机器学习、深度学习模型的评估指标详解

机器学习/深度学习——关于分类任务的机器学习、深度学习模型的评估指标详解

devtools/2024/9/23 14:28:33/

机器学习/深度学习——模型的评估详解

搭配以下文章进行学习：

卷积神经网络：
深度学习——卷积神经网络（convolutional neural network）CNN详解（一）——概述. 步骤清晰0基础可看

深度学习——卷积神经网络（convolutional neural network）CNN详解（二）——前向传播与反向传播过程（特征提取+预测+反向传播更新参数）. 步骤清晰0基础可看

简单的神经网络详解：
深度学习——神经网络（neural network）详解（一）. 带手算步骤，步骤清晰0基础可看

深度学习——神经网络（neural network）详解（二）. 带手算步骤，步骤清晰0基础可看

梯度下降法：
机器学习/深度学习——梯度下降法（Gradient descent）详解. 步骤清晰 0基础可看

模型的过拟合与欠拟合：
机器学习/深度学习——模型的欠拟合和过拟合，正则化方法详解

（1）混淆矩阵

我们需要先了解如下概念：

它是一个表格，用于描述分类模型的预测结果与实际标签之间的关系。混淆矩阵的基本元素包括：

True Positives (TP): 真正例，模型正确预测为正类的样本数量。
True Negatives (TN): 真负例，模型正确预测为负类的样本数量。
False Positives (FP): 假正例，模型错误预测为正类的样本数量（也称为第一类错误）。
False Negatives (FN): 假负例，模型错误预测为负类的样本数量（也称为第二类错误）。

如下图所示展示了4个指标以及TRP和FPR的概念

混淆矩阵

总结

评估指标列表

1.Accuracy (准确率)

来源：正确分类的样本占总样本的比例
作用：衡量模型整体的准确性
公式： $\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}$

2.Precision (精确度)

来源：预测为正类中实际为正类的比例
作用：衡量模型预测为正类的准确性
公式： $\text{Precision} = \frac{TP}{TP + FP}$

3.Recall (召回率, 真正例率)

来源：实际为正类中被正确预测的比例
作用：衡量模型捕捉所有正类样本的能力
公式： $\text{Recall} = \frac{TP}{TP + FN}$

4.F1 Score (F1分数)

来源：精确度和召回率的调和平均数
作用：平衡精确度和召回率，提供一个综合指标
公式： $\times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$

5.Specificity (特异性, 真负例率)
在计算公式上：Specificity =1-误诊率

来源：实际为负类中被正确预测的比例
作用：衡量模型对负类的分类能力
公式： $\text{Specificity} = \frac{TN}{TN + FP}$

6.敏感度（Sensitivity, TPR）
在计算公式上：Sensitivity =1-漏诊率
敏感度是真正例（TP）占实际正类（TP + FN）的比例。
$\frac{TP}{TP + FN}$

7.Negative Predictive Value (NPV, 负预测值)

来源：预测为负类的样本中实际为负类的比例
作用：衡量模型预测为负类的准确性
公式： $\frac{TN}{TN + FN}$

8.False Positive Rate (FPR, 假正例率，误诊率)
将得病称为正例（Positive）。
健康称为负例（Negative）。
误诊就是将没有病的人诊断为有病，也就是假正例率。

来源：实际为负类中被错误预测为正类的比例
作用：衡量模型将负类错误分类为正类的频率
公式： $\frac{FP}{TN + FP}$

9.False Negative Rate (FNR, 假负例率，漏诊率)
漏诊就是将有病的人诊断为健康，也就是假负例率。

来源：实际为正类中被错误预测为负类的比例
作用：衡量模型将正类错误分类为负类的频率
公式： $\frac{FN}{TP + FN}$

AUC-ROC (接收者操作特征曲线下面积)

来源：ROC曲线下面积
作用：提供一个模型在不同阈值下性能的综合评估
公式：通常不直接给出，而是通过计算不同阈值下的TPR和FPR

AUC-PR (精确率-召回率曲线下面积)
- 来源：PR曲线下面积
- 作用：特别适用于不平衡数据集，提供一个模型性能的综合评估
- 公式：同样不直接给出，通过计算不同阈值下的精确度和召回率

http://www.ppmy.cn/devtools/95298.html

相关文章

LeetCode290 单词规律

LeetCode290 单词规律

使用哈希表可以解决的问题 LeetCode 205 同构字符串-CSDN博客 LeetCode 383. 赎金信-CSDN博客Leetcode 49 字母异位词分组-CSDN博客LeetCode 242 有效的字母异位词-CSDN博客 LeetCode1. 两数之和-CSDN博客题目 290. 单词规律已解答简单相关标签相关企业给定一种规律 …

阅读更多...

Nakagami衰落——详细介绍

Nakagami衰落——详细介绍

Nakagami衰落是一种描述无线通信信道中信号衰落特性的统计模型，它以日本学者中上健为名。Nakagami衰落模型在无线通信、移动通信、雷达、声纳等领域广泛应用，尤其适用于多径传播情况下的信号传输。一、Nakagami衰落模型的背景在无线信道中&#xff0c…

阅读更多...

通达信扫雷宝的安全分的计算公式维度猜测

通达信扫雷宝的安全分的计算公式维度猜测

“扫雷宝”是通达信证券软件中的一个功能，它通过评估股票的各种风险因素，计算出一个“安全分”，帮助投资者判断股票的风险程度。不过，通达信并未公开其“安全分”的具体计算公式。因此，具体的计算方式可能涉及多种因素…

阅读更多...

phpmailer如何配置SSL以发送安全电子邮件？

phpmailer如何配置SSL以发送安全电子邮件？

phpmailer支持哪些邮件附件类型？如何使用phpmailer？ PHPMailer作为一个广泛使用的PHP邮件发送类库，支持通过SSL发送加密邮件，以确保信息在传输过程中的安全性。AokSend将探讨如何配置PHPMailer以使用SSL发送安全的电子邮件。 Ph…

阅读更多...

富婆和富公子都在看的负载均衡和Haproxy大全

富婆和富公子都在看的负载均衡和Haproxy大全

一.负载均衡 1.1：什么是负载均衡负载均衡： Load Balance ，简称 LB ，是一种服务或基于硬件设备等实现的高可用反向代理技术，负载均衡将特定的业务(web 服务、网络流量等 ) 分担给指定的一个或多个后端特定的服务器或…

阅读更多...

【Spark集群部署系列一】Spark local模式介绍和搭建以及使用（内含Linux安装Anaconda)

【Spark集群部署系列一】Spark local模式介绍和搭建以及使用（内含Linux安装Anaconda)

简介注意： 在部署spark集群前，请部署好Hadoop集群，jdk8【当然Hadoop集群需要运行在jdk上】，需要注意hadoop，spark的版本，考虑兼容问题。比如hadoop3.0以上的才兼容spark3.0以上的。下面是Hadoop集群部署…

阅读更多...

Azure与Google Cloud Platform（GCP）的云安全策略与最佳实践（第二篇）

Azure与Google Cloud Platform（GCP）的云安全策略与最佳实践（第二篇）

1. 引言随着企业业务不断向云端迁移，理解和实施Azure与Google Cloud Platform（GCP）的安全最佳实践变得愈发重要。本篇文章将探讨这两个主流云平台的安全策略，结合代码示例，帮助用户更好地保护其云计算环境。 2. Azu…

阅读更多...

Python酷库之旅-第三方库Pandas(084)

Python酷库之旅-第三方库Pandas(084)

目录一、用法精讲 351、pandas.Series.str.isdigit方法 351-1、语法 351-2、参数 351-3、功能 351-4、返回值 351-5、说明 351-6、用法 351-6-1、数据准备 351-6-2、代码示例 351-6-3、结果输出 352、pandas.Series.str.isspace方法 352-1、语法 352-2、参数 3…

阅读更多...

最新文章