微生信神助力:在线绘制发表级主成分分析(PCA)图

news/2024/9/23 17:44:22/

主成分分析(Principal components analysisPCA)是一种线性降维方法。它利用正交变换对一系列可能相关的变量的观测值进行线性变换,从而投影为一系列线性不相关变量的值,这些不相关变量称为主成分(Principal Components)。PCA是一种对数据进行简化分析的技术,这种方法可以有效地找出数据中最主要的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。

举个通俗易懂的例子:以学习成绩为例,每个同学有多门考试成绩(即分数),例如语文75、数学78、英语86等等。如果有10门课程,那么每个同学的成绩就有10个维度,10个维度对于我们了解这个同学的成绩来说,有点复杂。这时,我们可以用成绩好和成绩不好来表征这个同学的成绩,这就是“降维”。

PCA降维”的目的:

1)去冗余

例如微积分成绩和概率论的成绩一般是强相关,这样就可以将10个维度去掉1个维度)

2)发现异常值

例如某同学由于疫情被隔离了几天,缺了几门课的成绩,那么降维后就可以在2D图上找到该同学所代表的点,后续分析时可以考虑踢掉

3)保留原始信息

降维后新的主成分能够解释原数据,如果降维后可解释性降低,那么就不是好的降维

大多数情况下,降维是为聚类、分类服务的。降维后,我们就可以研究同学们的成绩情况,寻找隐藏在成绩背后的信息,例如,有几个学生成绩都很好,那么“他们住在同一个宿舍”就有可能是潜在变量。

降维的方法有很多种,常见的包括线性降维(PCAPLS),非线性降维(UMAPtSNE)等。降维后一般会进行2D,或者3D图的绘制,其中2D图最常见也最容易理解。一般我们绘制individuals散点图,也就是将看得见,摸得着的样本点(例如常规RNAseq结果中的15个样品或者单细胞测序中的成千上万个细胞等)绘制在X/Y轴坐标系中。

对主成分分析(Principal components analysisPCA)有了简单地解后,我们就可以用微生信网站进行发表级PCA绘图了。

1,打开绘图页面

微生信-在线绘制主成分分析图(Principal component analysis,PCA)

2,下载示例数据

这是最经典的鸾(音:yuān)尾花数据,该数据测量了三种鸢尾花(B列:Setosa鸢尾花、Versicolour鸢尾花和Virginica鸢尾花)的4个属性数据(C:花萼长度、D:花萼宽度、E:花瓣长度、F:花瓣宽度),每种花收集了50条样本记录,共计150条(A列:s1-s150)。

3,拷贝并粘贴示例数据

4,修改参数,并提交

图片大小颜色形状以及标注字体大小等都可以个性化定制,可满足不同的绘图需求。

5,提交出图

该图展示了150个样品在第一主成分(73%)和第二主成分(22.39%)的散点图,百分比表示可解释程度,即第一主成分可以解释数据属性的73%。将4维空间降维为2维空间后,可以较明显地看出这150个样本呈现为3群。

该模块调用了FactoMineRfactoextraR包。

没有预览就是没有出图,这时请参考示例数据,检查输入数据格式!

遇到文字截断,需要修改字体、调整字体大小等,使用inkscape软件进行操作

微生信助力高分文章,用户185000,谷歌学术3600篇


http://www.ppmy.cn/news/1468834.html

相关文章

第7章 用户输入和 while 循环

第7章 用户输入和 while 循环 7.1 函数 input()的工作原理7.1.1 编写清晰的程序7.1.2 使用 int()来获取数值输入7.1.3 求模运算符 7.2 while 循环简介7.2.1 使用 while 循环7.2.2 让用户选择何时退出7.2.3 使用标志7.2.4 使用 break 退出循环7.2.5 在循环中使用 continue7.2.6 …

Studio One安装教程+软件安装包下载

Studio One6全新版本上线 记录、生产、混合、掌握和执行所有操作。从工作室到舞台,Studio One6以易用为核心,是您的创意合作伙伴。 当你准备好登上舞台时,Studio One就在那里。只有Studio One从最初的灵感到完整的制作,最终混音…

LabVIEW传感器虚拟综合实验系统

LabVIEW传感器虚拟综合实验系统 开发了一个基于LabVIEW的传感器虚拟综合实验系统,该系统集成了NIELVIS和CSY系列传感器实验平台,通过图形化编程语言进行数据处理和实验管理。系统允许用户进行多种传感器参数的测量和实验报告的自动生成,支持…

Maven下载、安装、配置与使用教程

Maven下载、安装、配置与使用教程 目录 简介下载与安装配置使用示例总结 1. 简介 Maven是一个项目管理工具,主要用于Java项目。它可以自动化构建过程,包括编译、测试、打包和部署等。Maven使用POM(Project Object Model)文件来…

深度神经网络——什么是深度强化学习?

除了无监督机器学习和监督学习之外,人工智能创造的另一种常见形式是强化学习。除了常规的强化学习之外, 深度强化学习 由于它结合了深度学习和强化学习的最佳方面,因此可以带来令人惊讶的令人印象深刻的结果。让我们具体看看深度强化学习是如…

第十三篇——信息正交性:在信息很多的情况下如何做决策?

目录 一、背景介绍二、思路&方案三、过程1.思维导图2.文章中经典的句子理解3.学习之后对于投资市场的理解4.通过这篇文章结合我知道的东西我能想到什么? 四、总结五、升华 一、背景介绍 信息的正交性,让我们对信息有足够的判断,可以避免…

springboot接收byte[]字节

在Spring Boot中,可以使用RequestBody注解来接收字节流。以下是一个简单的示例: 1. 首先,创建一个控制器类,如ByteController: java import org.springframework.web.bind.annotation.PostMapping; import org.sprin…

LeetCode刷题之HOT100之合并区间

雨下了一整天,中午早早就回去吃饭拿快递了,今天拿了很多快递。我的书回来啦哈哈,还有好多零食,爽歪歪啊,放在下面了,然后准备开始做题啦! 图一:左一是xh送我的,非常精彩…