【自信息、信息熵、联合熵、条件熵、互信息】

devtools/2024/12/28 14:43:32/

文章目录

  • 一、自信息 I(X)
  • 二、信息:衡量系统的混乱程度
    • 信息 H(X)
    • 联合 H(X,Y)
  • 三、条件H(Y|X) = 联合H(X,Y) - 信息H(X)
  • 四、互信息 I(X,Y)
  • 五、总结
  • References

一、自信息 I(X)

自信息(Self-information) 是由香农提出的,用来衡量单一事件发生时所包含的信息量的多寡,单位是bit或nats。

就是说,自信息表示某一事件发生时所带来的信息量的多少,当事件发生的概率越大,其自信息就越小,反之亦然。

数学定义

自信息定义为时间发生的概率的负对数。 具体来说,设事件 x i x_i xi 发生的概率为 p ( x i ) p(x_i) p(xi),则该事件的自信息量 I ( x i ) I(x_i) I(xi) 定义为:
I ( x i ) = − log ⁡ 2 p ( x i ) I(x_i) = - \log_2 p(x_i) I(xi)=log2p(xi)

函数对应的图像表示如下图所示,其中 p p p 表示事件发生的概率。

在这里插入图片描述

自信息的含义、性质和应用

  • 小概率事件提供更多的信息:小概率事件发生时,提供的信息量较大;大概率事件发生时,提供的信息量较小。
  • 不确定性与信息量:自信息表示事件发生前的不确定性和事件发生后提供的信息量。小概率事件发生前的不确定性大,发生后提供的信息量大;大概率事件则相反。
  • 自信息与互信息的关系互信息是已知一个事件后另一个事件的不确定性减少的量。互信息可以表示为两个事件的自信息之差。

二、信息:衡量系统的混乱程度

自信息描述的是随机变量的某个事件发生所带来的的信息量,而信息通常用来描述整个随机分布所带来的信息量,更具有统计特性。

信息也叫香农代表一个系统中信息量的总和。信息量总和越大,表明这个系统的不确定性就越大。

信息 H(X)

信息定义为对所有可能事件所带来的信息量求期望

一个随机变量 X X X H ( x ) H(x) H(x) 定义为:

H ( X ) = E x ∼ p [ I ( x ) ] = − E x ∼ p [ log ⁡ p ( x ) ] = − ∑ x p ( x ) log ⁡ p ( x ) = − ∫ x p ( x ) log ⁡ p ( x ) d x \begin{aligned} H(X) &= E_{x \sim p}[I(x)]=-E_{x \sim p}[\log p(x)]\\ &=-\sum_x p(x)\log p(x)\\ &=-\int_x p(x) \log p(x)dx \end{aligned} H(X)=Exp[I(x)]=Exp[logp(x)]=xp(x)logp(x)=xp(x)logp(x)dx

信息是各项自信息的累加值。在同样的定义域内,的关系为脉冲分布信息<高斯分布信息<均匀分布信息。可以通过数学证明,当随机变量分布为均匀分布时即状态数最多时,最大。代表了随机分布的混乱程度。

联合 H(X,Y)

推广至多维随机变量的联合分布,对于服从联合分布为 p ( x , y ) p(x,y) p(x,y) 的一对离散随机变量 ( X , Y ) (X,Y) (X,Y),其联合信息为:
H ( X , Y ) = − ∑ x , y p ( x , y ) log ⁡ p ( x , y ) H(X,Y)=-\sum_{x,y} p(x,y) \log p(x,y) H(X,Y)=x,yp(x,y)logp(x,y)

三、条件H(Y|X) = 联合H(X,Y) - 信息H(X)

条件的定义为:在 X X X 给定条件下, Y Y Y 的条件概率分布的 X X X 的数学期望。
H ( Y ∣ X ) = E x ∼ p [ H ( Y ∣ X = x ) ] = ∑ x p ( x ) H ( Y ∣ X = x ) = − ∑ x p ( x ) ∑ y p ( y ∣ x ) log ⁡ p ( y ∣ x ) = − ∑ x ∑ y p ( x , y ) log ⁡ ( y ∣ x ) = − ∑ x , y p ( x , y ) log ⁡ p ( y ∣ x ) \begin{aligned} H(Y|X)&=E_{x \sim p}[H(Y|X=x)]\\ &=\sum_{x} p(x) H(Y|X=x)\\ &=-\sum_x p(x) \sum_y p(y|x) \log p(y|x)\\ &=-\sum_x \sum_y p(x,y) \log(y|x)\\ &=-\sum_{x,y} p(x,y) \log p(y|x) \end{aligned} H(YX)=Exp[H(YX=x)]=xp(x)H(YX=x)=xp(x)yp(yx)logp(yx)=xyp(x,y)log(yx)=x,yp(x,y)logp(yx)

条件 H ( Y ∣ X ) H(Y|X) H(YX) 等于联合 H ( X , Y ) H(X,Y) H(X,Y) 捡去信息 H ( X ) H(X) H(X),即 H ( Y ∣ X ) = H ( X , Y ) − H ( X ) H(Y|X) = H(X,Y) - H(X) H(YX)=H(X,Y)H(X)

证明如下:
H ( X , Y ) = − ∑ x , y p ( x , y ) log ⁡ p ( x , y ) = − ∑ x , y p ( x , y ) log ⁡ ( p ( y ∣ x ) p ( x ) ) = − ∑ x , y p ( x , y ) log ⁡ p ( y ∣ x ) − ∑ x , y p ( x , y ) log ⁡ p ( x ) = H ( Y ∣ X ) − ∑ x , y p ( x , y ) log ⁡ p ( x ) = H ( Y ∣ X ) − ∑ x ∑ y p ( x , y ) log ⁡ p ( x ) = H ( Y ∣ X ) − ∑ x log ⁡ p ( x ) ∑ y p ( x , y ) = H ( Y ∣ X ) − ∑ x p ( x ) log ⁡ p ( x ) = H ( Y ∣ X ) − H ( X ) \begin{aligned} H(X,Y) &= -\sum_{x,y} p(x,y) \log p(x,y)\\ &=-\sum_{x,y} p(x,y) \log (p(y|x)p(x))\\ &=-\sum_{x,y}p(x,y) \log p(y|x)-\sum_{x,y} p(x,y) \log p(x)\\ &=H(Y|X) - \sum_{x,y} p(x,y) \log p(x)\\ &=H(Y|X) - \sum_x \sum_y p(x,y) \log p(x)\\ &=H(Y|X) - \sum_x \log p(x) \sum_y p(x,y)\\ &=H(Y|X) - \sum_x p(x) \log p(x)\\ &=H(Y|X) - H(X) \end{aligned} H(X,Y)=x,yp(x,y)logp(x,y)=x,yp(x,y)log(p(yx)p(x))=x,yp(x,y)logp(yx)x,yp(x,y)logp(x)=H(YX)x,yp(x,y)logp(x)=H(YX)xyp(x,y)logp(x)=H(YX)xlogp(x)yp(x,y)=H(YX)xp(x)logp(x)=H(YX)H(X)

四、互信息 I(X,Y)

互信息定义为一个随机变量由于已知另一个随机变量而减少的不确定性,或者说从贝叶斯角度考虑,由于新的观测数据y到来而导致x分布的不确定性下降程度

假设两个离散随机变量 X X X Y Y Y,他们的联合概率分布函数为 p ( x , y ) p(x,y) p(x,y),边缘概率分布函数分别为 p ( x ) p(x) p(x) p ( y ) p(y) p(y)。那么互信息 I ( X , Y ) I(X,Y) I(X,Y) 为联合分布 p ( x , y ) p(x,y) p(x,y) p ( x ) p ( y ) p(x)p(y) p(x)p(y) 之间的相对,即:
I ( X , Y ) = ∑ x ∑ y p ( x , y ) log ⁡ p ( x , y ) p ( x ) p ( y ) I(X,Y) = \sum_x \sum_y p(x,y)\log \frac{p(x,y)}{p(x)p(y)} I(X,Y)=xyp(x,y)logp(x)p(y)p(x,y)

连续随机变量的情形下,求和被替换成二重定积分:
I ( X , Y ) = ∫ Y ∫ X p ( x , y ) log ⁡ ( p ( x , y ) p ( x ) p ( y ) ) d x d y I(X,Y) = \int_Y \int_X p(x,y) \log(\frac{p(x,y)}{p(x)p(y)})dx dy I(X,Y)=YXp(x,y)log(p(x)p(y)p(x,y))dxdy

其中, p ( x , y ) p(x,y) p(x,y) X X X Y Y Y 的联合概率密度函数,而 p ( x ) p(x) p(x) p ( y ) p(y) p(y) 分别是 X X X Y Y Y 的边缘概率密度函数。

经过推导,互信息可以等价的表示成:
I ( X , Y ) = H ( X ) − H ( X ∣ Y ) = H ( Y ) − H ( Y ∣ X ) = H ( X ) + H ( Y ) − H ( X , Y ) = H ( X , Y ) − H ( X ∣ Y ) − H ( Y ∣ X ) \begin{aligned} I(X,Y) &= H(X) - H(X|Y)\\ &= H(Y) - H(Y|X) \\ &= H(X) + H(Y) - H(X,Y)\\ &= H(X,Y)-H(X|Y) - H(Y|X) \end{aligned} I(X,Y)=H(X)H(XY)=H(Y)H(YX)=H(X)+H(Y)H(X,Y)=H(X,Y)H(XY)H(YX)

直观上,互信息度量 X 和 Y 共享的信息:它度量知道这两个变量其中一个,对另一个不确定度减少的程度。例如,如果 X 和 Y 相互独立,则知道 X 不对 Y 提供任何信息,反之亦然,所以它们的互信息为零。在另一个极端,如果 X 是 Y 的一个确定性函数,且 Y 也是 X 的一个确定性函数,那么传递的所有信息被 X 和 Y 共享:知道 X 决定 Y 的值,反之亦然。因此,在此情形互信息与 Y(或 X)单独包含的不确定度相同,称作 Y(或 X)的。而且,这个互信息与 X 的和 Y 的相同。(这种情形的一个非常特殊的情况是当 X 和 Y 为相同随机变量时。)

此外,互信息是非负的,而且是对称的(即 I ( X , Y ) = I ( Y , X ) I(X,Y) = I(Y,X) I(X,Y)=I(Y,X))。

五、总结

对于随机变量 X X X Y Y Y ,他们的、联合、条件以及互信息之间的关系如图所示。

在这里插入图片描述


References

  1. 什么是「互信息」?
  2. 自信息和互信息、信息

http://www.ppmy.cn/devtools/146138.html

相关文章

PDF书籍《手写调用链监控APM系统-Java版》第5章 插桩插件与bytebuddy字节码增强

本人阅读了 Skywalking 的大部分核心代码&#xff0c;也了解了相关的文献&#xff0c;对此深有感悟&#xff0c;特此借助巨人的思想自己手动用JAVA语言实现了一个 “调用链监控APM” 系统。本书采用边讲解实现原理边编写代码的方式&#xff0c;看本书时一定要跟着敲代码。 作者…

如何实现底部导航栏

文章目录 1 概念介绍2 使用方法3 示例代码我们在上一章回中介绍了TextField Widget,本章回中将介绍BottomNavigationBar Widget。闲话休提,让我们一起Talk Flutter吧。 1 概念介绍 我们在本章回中将介绍一个新的Widget:BottomNavigationBar,它就是我们经常在App中看到了底部…

【ES6复习笔记】模板字符串(3)

介绍 模板字符串是 ES6 引入的一种新的字符串声明方式&#xff0c;它使用反引号&#xff08;&#xff09;来定义字符串&#xff0c;而不是单引号&#xff08;&#xff09;或双引号&#xff08;"&#xff09;。模板字符串可以包含变量、表达式和换行符&#xff0c;这使得它…

mongodb和Cassandra

mongodb的一致性问题&#xff1a; 15.MongoDB的一致性(读关注与写关注)_mongo w选项-CSDN博客 孤儿节点问题&#xff1a; 技术干货 | MongoDB 偶遇孤儿文档及处理方法-腾讯云开发者社区-腾讯云 分片集群MongoDB迁移前清除孤儿文档 由数据迁移至MongoDB导致的数据不一致问题…

ctfshow-web 151-170-文件上传

我们首先想到就是上传一句话木马。但是看源代码限制了png。 &#xff08;1&#xff09;改前端代码。 这里是前端限制了上传文件类型&#xff0c;那我们就改一下就好了嘛,改成php。 这里直接修改不行&#xff0c;给大家推荐一篇简短文章&#xff0c;大家就会了&#xff08;一开始…

前端经典面试合集(二)——Vue/React/Node/工程化工具/计算机网络

1. 说说 Vue 中的 Diff 算法 Vue 的 Diff 算法 主要用于优化虚拟 DOM 和实际 DOM 之间的比较过程。它通过以下几种策略来提高性能&#xff1a; 最小化对 DOM 的操作&#xff1a;Vue 通过在内存中构建一个虚拟 DOM 树&#xff0c;在虚拟 DOM 树与真实 DOM 树之间进行比较和更新…

Linux | 零基础Ubuntu卸载MySQL Server 零痕迹

目录 介绍 移除MySQL软件包 自动移除依赖项 清理残留文件 检查是否还有残留文件 重启系统 介绍 难免会出现一些迷人的操作&#xff0c;让整个数据库都作废了&#xff0c;又改不了文件&#xff0c;修复不了问题&#xff0c;只能重装了&#xff0c;但又卸载不干净&#xf…

mac系统升级后Homebrew:Mac os 使用brew工具时报错No remote ‘origin‘

现象 #brew update Warning: No remote origin in /opt/homebrew/Library/Taps/homebrew/homebrew-cask, skipping update! Warning: No remote origin in /opt/homebrew/Library/Taps/homebrew/homebrew-core, skipping update! Warning: No remote origin in /opt/homebrew/…