数据可视化02-PCA降维

ops/2025/3/6 23:05:35/

一、PCA

PCA做什么?找坐标系。

目标?二维降到一维,信息保留最多。

怎么样最好?数据分布最分散的方向(方差最大),作为主成分(坐标轴)。

二、怎么找主成分?

PC1的确定:每个点的 b^{2} 之和最小,c^{2} 之和最大。

PC2的确定:过原点,且与PC1垂直。

PCA降维的核心思想是:用少数几个最重要的方向(主成分PC1)来表示数据,而不是用所有方向。

为什么可以降噪?

  1. 舍弃次要方向: 噪声(偏离的点)通常分布在次要方向(如PC2)上,降维时舍弃这些方向,相当于过滤了一部分噪声。

  2. 压缩噪声的影响: 即使噪声点在PC1上仍有偏离,它们的偏离程度比在原始数据中要小。

三、特征值与特征向量

(一)特征向量

简单来说,特征向量定义了新的坐标轴的方向

(二)特征值

特征值表示了每个主成分在数据集中的方差贡献率

(三)碎石图


http://www.ppmy.cn/ops/163406.html

相关文章

FPGA开发,使用Deepseek V3还是R1(6):以滤波器为例

以下都是Deepseek生成的答案 FPGA开发,使用Deepseek V3还是R1(1):应用场景 FPGA开发,使用Deepseek V3还是R1(2):V3和R1的区别 FPGA开发,使用Deepseek V3还是R1&#x…

Deepseek助力思维导图与流程图制作:高效出图新选择

在当今快节奏的工作和学习环境中,高效的工具对于提升生产力至关重要。思维导图和流程图作为整理思路、展示结构和流程的有效方式,广泛应用于各个领域。然而,传统的制作方式往往耗费大量时间和精力。本文将介绍一种借助deepseek和mermaid.live…

复盘的意义

一、复盘的流程 [事件触发] │▼ [信息收集] → 日志/监控/文档 → [数据清洗]│▼ [结构化分析] → 根因定位 → [决策树]│▼ [方案设计] → 技术/流程/组织 → [优先级矩阵]│▼ [落地验证] → A/B测试/混沌工程 → [效果量化]│▼ [知识沉淀] → 模板/工具/文档 → [防御体…

Vite:现代前端构建工具的新选择

引言 随着前端项目复杂度的不断提高,开发者对构建工具的要求也越来越高。我们需要更快的启动时间、更高效的热更新和更优化的构建结果。Vite 作为一个由 Vue.js 创建者尤雨溪开发的新一代前端构建工具,正是为了解决这些问题而诞生的。本文将深入探讨 Vit…

使用300M带宽是否可以流畅地玩原神

本文来自腾讯元宝 ps:搬家了,需要装个路由器打游戏。 根据搜索结果,300M的网络带宽完全可以满足《原神》的流畅游玩需求。以下是具体分析及优化建议: 一、带宽需求与300M网络的适配性 ​带宽要求较低​ 《原神》作为一款开放世界…

动态规划之 “完全背包“ ------P8646 [蓝桥杯 2017 省 AB] 包子凑数

文章目录 前言一、例题二、分析题意三、代码示例总结 前言 今天讲一道蓝桥真题 需要的前置知识点是完全背包,如果对此知识点不懂可以点击此处了解代码随想录之完全背包 现在我们有了这个前置知识点后直接开始看题 一、例题 二、分析题意 其实这就是一个完全背包问…

将md格式转jupyter并运行

将md格式转jupyter并运行 有时候我们需要将这种文档以学习的形式记笔记到jupyter中(任务) 但是内容太多了,一个一个粘贴又不方便,怎么办呢? 发现直接粘贴到md中是带格式的!!! 那…

Linux常见命令

目录 一、文件命令 1.cd命令 2.mkdir命令 3.rm命令 4.pwd命令 5.ls命令 6.cp命令 7.mv 命令 二、查看文件内容 8.cat命令 三、文件搜索 9.find命令 四、文件权限 10.chmod命令 11.chown命令 12.chgrp命令 五、文本处理 13.grep命令 14.paste命令 15.sort命…