Correlated_Covariance_Independence

news/2024/10/22 13:34:23/

Correlated 仅指存在线性关系。二次方关系不是 correlated。

Uncorrelated 指不存在线性关系,但可能有别的关系,比如说二次方等等。
这就是为什么 uncorrelated 不意味着 independence.
也即,dependent variables 不一定 correlated.
但是所有的 independent variables 都一定是 uncorrelated.

我们学当 Covariance = 0, 意思是 uncorrelated

Correlated 是指相关性,相关性是指线性相关性就是两个变量有没有线性关系。你的其他的关系,他是他是不管的。

另外这个 correlation coefficient 就是算出来那个系数,它实际上是standardized covariance,所以你 covariance 要等于0的话,你的 correlation 应该是等于0的。

Correlation Coefficient 和 Covariance 的区别

它们两个之间的区别是什么?
区别就是 correlation 是在 -1到+1之间。它是有区间的。
那个 covariance 可以是从-∞到+∞。

为什么要standardize这个 covariance 呢?

对协方差 covariance 进行标准化的原因主要是因为协方差的值会受到变量单位和量级的影响,这使得其值难以直观解释。标准化协方差(也称为相关系数 correlation coefficient)通过将协方差除以两个变量的标准差来消除这种影响,从而使得结果更容易解释和比较。标准化后的协方差(相关系数)的值介于-1和1之间,其中-1表示完全的负线性关系,1表示完全的正线性关系,0表示没有线性关系。

比如说,你有两个variable X跟Y,比如说它们两个的 covariance 是等于是等于27。
然后呢,你的有另外两个variable,比如说是A跟B,它们两个的 covariance 是127。
虽然A跟B的 covariance 要比X跟Y的 covariance 要大,但你不能说明A跟B的相关性要比X跟Y的相关性大。

但是correlation就能说明你比如说A跟B的,它的correlation coefficient 的是0.9,你的那个X跟Y的 correlation coefficient 是0.5。哦,那么你是可以说明A跟B的这个线性相关性,要比X跟Y的这个相关性要高,它是可以比较的。

为什么 covariance 是没有办法比较的呢?因为Covariance 是跟那个数值的单位是有关系的,比如说你的X跟Y,它的它的单位是是米,然后,你算它的 covariance 上,它得一个值。
然后,你假如说把它换算成多少厘米,就增加了100倍,你的 covariance 也会增加100倍。
所以,它是依赖于数值单位的,这个就没有办法比较了。就关键是你的衡量那个单位是不一样啊,你X跟Y的衡量的单位有可能是X跟Y是公斤,你的A跟B是厘米,你这个没法比较。

不要问AI关于这些概念的比较,它说的是错的!

Covariance is defined as the expected value of variations of two variables from their expected values. More simply, covariance measures how much variables change together.

Correlation is the standardized form of covariance by dividing the covariance with SD of each variable under normal distribution assumption. Generally, we use ‘r’ as sample correlation coefficient and ‘ρ’ as population correlation coefficient.

Statistical notes for clinical researchers: covariance and correlation:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5816993/


http://www.ppmy.cn/news/1533271.html

相关文章

JAVA笔记 | 实际上用到的策略模式(可直接套用)

自己开发中用到了策略模式,这样写不一定是最好的,但是满足了业务场景跟使用要求,做个笔记,下次有用到可以快速复习跟套用 假设使用场景:有几只宠物,猫跟狗等,要求他们做各种动作,比如…

服装分类检测系统源码分享

服装分类检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer Vis…

国内访问OpenAI API

最近在学习LLM。绕不过去的肯定要学习OpenAI。 国内想直接使用官方API十分麻烦。就到处查资料及网友的分享。发现了这个代理可以在国内很方便的使用OpenAI API。 代理的地址如下: https://referer.shadowai.xyz/r/1014150 经过一段实际体验下来,这个…

leetcode刷题day31|贪心算法Part05重叠区间问题(56. 合并区间、738.单调递增的数字、968.监控二叉树)

56. 合并区间 思路:这个题跟气球重叠区间的题目类似,只需要先按左边界进行排序,判断是否重叠,如果重叠,就选择最小的左边界和最大的右边界构成新的区间。 代码如下: class Solution {public int[][] mer…

选择更轻松:山海鲸可视化与PowerBI的深度对比

在数据分析与可视化的时代,选择合适的报表工具显得尤为重要。山海鲸可视化和PowerBI是市场上颇受欢迎的两款免费报表软件,各有特色。接下来,我们将从功能、优缺点等方面进行对比,帮助你找到最适合的工具。 山海鲸可视化 山海鲸可…

QEMU使用Qemu-Guest-Agent传输文件、执行指令等

简介 之前介绍过qemu传输文件,使用的挂载 / samba方式 :Qemu和宿主机不使用外网进行文件传输。 这是一种方式,这里还有另一种方式:使用Qemu-Guest-Agent,后面简称qga。 官网介绍:https://www.qemu.org/d…

超分服务的分量保存

分量说明 分量的概念主要是对于显卡解码,编码和网络传输而言,显卡可以同时进行几个线程,多个显卡可以分布式计算,对分量进行AI识别,比如我们有cuda的显卡,cuda的核心量可以分给不同的分片视频,第…

Linux 进程的基本概念及描述

目录 0.前言 1. 什么是进程 1.1 进程的定义与特性 1.2 进程与线程的区别 2.描述进程 2.1 PCB (进程控制块) 2.2 task_struct 3.查看进程 3.1 查看进程信息 3.1.1 /proc 文件系统 3.1.2 ps 命令 3.1.2 top 和 htop 命令 3.2 获取进程标识符 3.2.1使用命令获取PID 3.2.2 使用C语言…