预测知识 | 预测技术流程及模型评价

news/2025/2/19 16:37:43/

预测知识 | 预测技术流程及模型评价

目录

    • 预测知识 | 预测技术流程及模型评价
      • 技术流程
      • 模型评价
      • 参考资料

技术流程

1)模型训练阶段:预测因素和结局,再加上预测模型进行模型拟合;
2)预测阶段:将预测因素代入拟合好的模型,得到预测概率;
3)校准和验证阶段:先做校准,而后做验证。校准是预测概率和真实概率进行的模型再调整,目的是使得预测概率尽可能准确。最后,将校准概率与实际住院概率进行比较,构建混淆矩阵,对模型预测效果进行评价。

模型预测出来的概率可能与真实概率相差甚多,如果任由其不管,那模型应用后会带来很多问题。如果要对其进行处理,概率校准就是最常用的方法,也就是把有偏差的概率重新"拉回"正常值或"靠近"正常值。作者指出,对于树模型(如决策树、随机森林等),其概率一般都偏差较多,即校准度很不好,此时,大多需要进行模型再校准。

在这里插入图片描述

模型评价

在机器学习中,评价指标用于度量模型的性能和准确度。选择适当的评价指标取决于具体的任务和数据类型。以下是一些常见的机器学习评价指标:
准确率(Accuracy):准确率是最常用的评价指标之一,它表示模型正确预测的样本数与总样本数之间的比例。然而,准确率在处理不平衡数据集时可能会失效,因为它没有考虑到不同类别的样本分布。
精确率(Precision)和召回率(Recall):精确率和召回率通常一起使用来对二分类模型进行评估。精确率表示模型预测为正例的样本中实际为正例的比例,召回率表示模型正确预测为正例的样本占所有实际为正例的样本的比例。在某些情况下,我们需要在精确率和召回率之间进行权衡,可以使用F1分数作为综合指标,它是精确率和召回率的调和均值。
ROC曲线和AUC(Receiver Operating Characteristic Curve and Area Under the Curve):ROC曲线通过绘制模型在各个分类阈值下的真阳性率(TPR)和假阳性率(FPR)之间的关系来评估二分类模型的性能。AUC表示ROC曲线下的面积,范围在0到1之间,AUC越接近1,模型性能越好。
均方误差(Mean Squared Error,MSE):均方误差常用于回归问题的评估,计算预测值与实际值之间的平均平方差。较小的MSE值表示模型预测得更准确。
对数损失(Log Loss):对数损失用于评估概率模型的性能,它衡量模型预测的概率分布与实际标签之间的差异。对数损失越小,表示模型的预测越接近实际情况。
对于不平衡预测,模型之间的AUC差异是很小的,不具有区分价值,而PR曲线下面积(AP表示average precision,是计算PR曲线下面积的一种方式)更有助于区分。

参考资料

[1] Reference: Development and validation of predictive models for unplanned hospitalization in the Basque Country: analyzing the variability of non-deterministic algorithms


http://www.ppmy.cn/news/1026432.html

相关文章

Java | 字符串

目录 一、String类 1.1 声明字符串 1.2 创建字符串 二、连接字符串 2.1 连接多个字符串 2.2 连接其他数据类型 三、获取字符串信息 3.1 获取字符串长度 3.2 字符串查找 3.3 获取指定索引位置的字符 四、字符串操作 4.1 获取字符串 4.2 去除空格 4.3 字符串替换 …

Java线程池的类型和使用

Java线程池的类型和使用 引言 在并发编程中,线程池是一种非常重要的工具,它可以实现线程的复用,避免频繁地创建新线程,从而提高程序的性能和效率。Java的并发库提供了丰富的线程池功能,本文将介绍Java线程池的类型和…

佛祖保佑,永不宕机,永无bug

当我们的程序编译通过,能预防的bug也都预防了,其它的就只能交给天意了。当然请求佛祖的保佑也是必不可少的。 下面是一些常用的保佑图: 佛祖保佑图 ——————————————————————————————————————————…

《贫穷的本质》阅读笔记

《贫穷的本质》阅读笔记 2023年8月11日在杭州小屋读完,对于穷,我可有太多想说的了。可以说自己活这么大以来,一直在摆脱贫穷,也将会穷尽一生去避免贫穷。作为一个穷人该如何去摆脱贫穷,我觉得没有一个确切的答案&#…

或许有用的开源项目平台——物联网、区块链、商城、CMS、客服系统、低代码、可视化、ERP等

摘自个人印象笔记Evernote Export wumei-smart-物美智能开源物联网平台 官网:https://wumei.live/ gitee:https://gitee.com/kerwincui/wumei-smart 一个简单易用的物联网平台。可用于搭建物联网平台以及二次开发和学习。适用于智能家居、智慧办公、智慧…

缓存穿透,击穿,雪崩之间的区别与联系

1、缓存数据基本流程 通常来说,我们是从数据库将数据查询出来之后,如果数据不为空,则将数据存储在缓存中,下次查询时就直接从缓存查询了,只有查询不到才会从数据库查询。 2、缓存穿透 核心在穿透两个字,穿透了,就说明在查询数据时没有遇到阻碍,直接就查询到了数据库。…

Spring与Spring Bean

Spring 原理 它是一个全面的、企业应用开发一站式的解决方案,贯穿表现层、业务层、持久层。但是 Spring 仍然可 以和其他的框架无缝整合。 Spring 特点 轻量级 控制反转 面向切面 容器 框架集合 Spring 核心组件 Spring 总共有十几个组件核心容器(Spring core) S…

安全之安全(security²)博客目录导读

研究方向:安全之安全 研究内容:ARM/RISC-V安全架构、TF-A/TEE之安全、GP安全认证、静态代码分析、FUZZ模糊测试、IDA逆向分析、安全与功耗等,欢迎您的关注💖💖 一、ARM安全架构 1、Trustzone安全研究综述文章推荐 2、T…