『大模型笔记』主成分分析(PCA)解释:简化机器学习中的复杂数据!

server/2024/10/9 9:21:27/
主成分分析PCA)解释:简化机器学习中的复杂数据

文章目录

PCA_5">一. 主成分分析PCA)解释:简化机器学习中的复杂数据!

在这里插入图片描述

主成分分析(Principal Component Analysis,简称PCA)通过 将大型数据集中的维度减少到能够保留大部分原始信息的主成分,从而减少数据的维度

让我给你举个例子,说明为什么这很重要。假设在一个风险管理的场景中,我们想要了解哪些贷款彼此相似,以便理解哪些类型的贷款通常会还清,哪些类型的贷款风险较高。请看这张表,显示了六笔贷款的数据。这些贷款包含多个维度,例如贷款金额、申请人的信用评分等。虽然这里只显示了四个维度,但贷款实际上包含更多的维度。例如,借款人的年龄和收入债务比也是重要维度。

PCA是一种找出最重要维度或主成分的方法。直观上讲,我们知道在考虑风险时,有些维度比其他维度更重要。例如,信用评分可能比借款人在当前工作中的工作年限更重要。如果我们去除这些不重要或不太重要的维度,我们会看到两个主要好处:一是机器学习的训练和推理速度会更快,因为要处理的数据更少,维度更少;其次,如果只有两个维度࿰


http://www.ppmy.cn/server/48945.html

相关文章

「实战应用」如何用DHTMLX将上下文菜单集成到JavaScript甘特图中(一)

DHTMLX Gantt是用于跨浏览器和跨平台应用程序的功能齐全的Gantt图表。可满足项目管理应用程序的所有需求,是最完善的甘特图图表库。 DHTMLX Gantt是一个高度可定制的工具,可以与项目管理应用程序所需的其他功能相补充。在本文中您将学习如何使用自定义上…

基于Java+SpringBoot制作一个景区导览小程序

基于Java+SpringBoot制作一个景区导览小程序。其中系统前端功能包括注册登录、景区采风、旅游导览、地图导航、发布采风、门票预订、修改个人信息;系统后台功能包括用户管理、景区管理、采风管理等模块。 摘要一、小程序1. 创建小程序2. 首页3. 景区采风页4. 旅游导览页5. 发布…

Linux---系统的初步学习【 项目二 管理Linux文件和目录】

项目二 管理Linux文件和目录 2.1项目知识准备 ​ 文件是存储在计算机上的数据集合。在Windows系统中,我们理解的文件可以是文本文档、图片、程序、音乐、视频等。在Linux中,一切皆文件,也就是除了Windows中所理解的文件,目录、字…

荣耀手机删除系统APP

1、打开开发者模式 设置–系统–关于手机–快速多次点击手机的版本号,即可进入开发者模式。 然后进入开发人员选项,开启USB调试,如下图。 2、数据线连接电脑,检查设备连接情况 按键盘winR键,在弹窗中输入cmd&#…

百度网盘限速解决办法

文章目录 开启P2P下载30秒会员下载体验一次性高速下载服务导入“百度网盘青春版”后下载注册新号参与活动 获取下载直链后使用磁力链接下载不是办法的办法无效、已失效方法免限速客户端、老版本客户端、永久会员下载体验试用客户端,或类似脚本、工具获取下载直链后多…

(源码)一套医学影像PACS系统源码 医院系统源码 提供数据接收、图像处理、测量、保存、管理、远程医疗和系统参数设置等功能

PACS系统还提供了数据接收、图像处理、测量、保存、管理、远程医疗和系统参数设置等功能。 PACS系统提高了医学影像的利用率和诊疗效率,为医生提供了更加准确和及时的诊断依据。它是医院信息化的必备系统之一,已经成为医学影像管理和传输的重要工具。 P…

DockerHub无法访问,国内镜像拉取迂回解决方案

无法访问后,主要存在以下几个问题: 无法进行镜像的搜索无法查看镜像相关的使用说明无法直接拉取镜像 对于第二点,目前没啥解决思路,主要针对第一点和第三点。 解决无法搜索镜像 目前仅可以解决部分问题,在知道镜像名…

c++ 函数内对象的释放

void someFunction() {MyClass obj MyClass(); }void someFunction() {MyClass obj new MyClass();}void someFunction() {MyClass* obj new MyClass(); }void someFunction() {std::unique_ptr<MyClass> obj std::make_unique<MyClass>(); }在函数中用这4种…