我谈《概率论与数理统计》的知识体系

server/2025/1/26 17:40:14/

在这里插入图片描述
学习《概率论与数理统计》二十多年后,在廖老师的指导下,才厘清了各章之间的关系。首先,这是两个学科综合的一门课程,这一门课程中还有术语冲突的问题。这一门课程一条线两个分支,脉络很清晰。

概率论与统计学

概率论与统计学是数学的两个分支,它们密切相关但有着不同的侧重点和目标。

  1. 概率论
    概率论是一门研究随机现象及其规律性的数学学科。它处理的是在给定条件下某个事件发生的可能性大小的问题。概率论通过定义样本空间、事件以及概率测度等概念来描述不确定性,并基于这些概念发展出一系列理论工具,如随机变量、分布函数、期望值、方差等。概率论的研究对象可以是离散型或连续型的随机变量,也可以是多维随机变量和随机过程。

  2. 统计学:
    统计学则是利用数据来推断概率模型的参数或进行预测的一门科学。它关注如何收集、整理、分析和解释数据,以从数据中提取有用的信息并作出决策或得出结论。统计学分为描述性统计和推断性统计两大类:前者侧重于总结数据特征(如均值、中位数、标准差等),后者则涉及到对未知总体的估计和假设检验等问题。统计学还涉及实验设计、抽样方法、回归分析等多个方面。

数理统计是统计学的一个分支,它依赖于概率论的理论基础,并结合数学方法来研究如何有效地收集、分析和解释数据。数理统计主要关注的是从样本数据中得出关于总体的结论,以及评估这些结论的可靠性。

知识体系

分支一:从随机现象到样本空间到随机事件再到概率。

从随机事件到随机变量:为了进行定量的数学处理,必须把随机现象的结果数量化,这就是引入随机变量的原因。

分支二:从随机现象到样本空间到随机变量的取值到分布,再到采样到随机样本,根据样本统计推断,估计分布。
概率论与数理统计的教材中缺少采样的部分,就使这条线断了。

随机变量

随机变量的取值是随机变量定义在样本空间上的实值函数。

随机变量既是变量也是函数。
从变量的角度来看,随机变量是指在随机试验或者随机过程中可能取不同数值的一种变量,它的数值受随机因素影响,无法事先确切预知。
从函数的角度来看,随机变量是定义在样本空间(随机试验所有可能结果组成的集合)上的一个实值函数。它将随机试验的所有可能结果(样本点)映射到实数集合上,每一个样本点对应一个实数值。随机变量的本质是对不确定事件结果的一种量化表示,使得原本非数值化的随机现象可以用数学语言来描述。

随机变量结合了变量的不确定性属性与函数的映射特性,它通过函数的方式将随机事件的结果量化,并通过概率论的语言来描述这些结果出现的可能性分布。

随机变量的分布

有了随机变量,然后就可以谈分布了。

定义 定义在样本空间Ω上的实值函数 X = X ( ω ) X=X(ω) X=X(ω)称为随机变量,常用大写字母X, Y, Z等表示随机变量,其取值用小写字母x, y, z等表示。假如一个随机变量仅可能取有限个或可列个值,则称其为离散随机变量。假如一个随机变量的可能取值充满数轴上的一个区间(a, b),则称其为连续随机变量,其中a可以是 − ∞ -\infty ,b可以是 + ∞ +\infty +

连续型随机变量用概率密度函数描述分布,离散型随机变量用分布律描述分布。
以后当我们提到一个随机变量 X X X的“概率分布”时,指的是它的分布函数;或者,当 X X X是连续型随机变量时,指的是它的概率密度;当 X X X是离散型随机变量时,指的是它的分布律。

总之,分布描述随机变量取值的概率。

采样与随机样本

有了分布谈采样(抽样),就有了样本。

抽样(Sampling)是选择样本的过程或方法。它是指根据一定的规则或程序从总体中抽取部分单位作为样本的方法。抽样的目的是为了能够通过研究样本而对总体做出合理的推断。抽样方法有很多种,比如简单随机抽样、分层抽样、系统抽样等。

定义 设 X X X是具有分布函数 F F F的随机变量,若 X 1 , X 2 , ⋯ , X n X_1, X_2, \cdots, X_n X1,X2,,Xn是具有同一分布函数 F F F的、相互独立的随机变量,则称 X 1 , X 2 , ⋯ , X n X_1, X_2,\cdots, X_n X1,X2,,Xn为从分布函数 F F F(或总体 F F F、或总体 X X X)得到的容量为 n n n的简单随机样本,简称样本,它们的观察值 x 1 , x 2 , ⋯ , x n x_1, x_2,\cdots, x_n x1,x2,,xn称为样本值,又称为 X X X n n n个独立的观察值。

在统计学中,样本是从总体(Population)中选取的一部分个体或观测值。它用来代表整个总体,并用于估计总体的特征或参数。

在这里插入图片描述

统计推断

之后就是统计推断。

样本是进行统计推断的依据。在统计学中,我们通常无法对整个总体进行测量或观察,因此需要从总体中抽取一部分个体组成样本。通过对样本的分析,我们可以对总体的特征进行估计和推断。

统计推断的基本问题可以分为两大类,一类是估计问题,另一类是假设检验问题。

Comments

概率论与数理统计理论性比较强,很抽象,但是这是一个很实用的学科,相比高等代数和数学分析来说与我们更加接近。

然而这门课老师竟然讲成了一门抽象的理论课。凡是只讲怎么代入公式计算,没有解释,没有剖析,不讲整个知识体系以及逻辑关系,那样的概率老师都应该回家卖红薯。

我的概率论与统计学不是任课老师讲明白的,而是15年前的博士生导师讲明白的,是不是很离奇?


http://www.ppmy.cn/server/161624.html

相关文章

GPSd定时检测保活TCP GPS源

为了在 TCP GPS 源丢失连接时自动重新连接,可以编写一个监控脚本,定期检查 gpspipe 输出中的 TCP 源数据是否存在。如果检测到丢失,则使用 gpsdctl 或直接命令重新添加 TCP 源。 1、工具 检查并安装必要工具,本例需要使用 gpspi…

React+AntDesign实现类似Chatgpt交互界面

以下是一个基于React和Ant Design搭建的简单ChatGPT风格前端交互界面代码框架示例,该示例实现了基本的用户输入、发送请求以及展示回复的功能。假设后端有一个模拟接口来处理请求并返回回复。 1. 项目初始化: 确保你已经安装了Node.js和npm。通过以下命…

Redis支持数据类型详解

4 数据类型 Redis支持多种数据类型:string(字符串),hash(哈希),list(列表),set(集合)、zset(sorted set 有序集合&#x…

免费GPU算力,不花钱部署DeepSeek-R1

在人工智能和大模型技术飞速发展的今天,越来越多的开发者和研究者希望能够亲自体验和微调大模型,以便更好地理解和应用这些先进的技术。然而,高昂的GPU算力成本往往成为了阻碍大家探索的瓶颈。幸运的是,腾讯云Cloud Studio提供了免…

迅为RK3588开发板实时系统编译-Preemption系统/ Xenomai系统编译-编译Linux实时系统-单独编译1

本小节单独编译镜像的顺序如下所示: 单独编译 uboot ->单独编译 kernel ->单独编译 recovery ->单独编译 buildroot 各个镜像编译完成后,最终打包镜像 update.img 的方式来编译 buildroot 镜像 update.img。 第一步:编译 uboot 首先…

消融效果

消融效果是模拟物体逐渐从屏幕上消失或溶解的过程,它通常利用噪声纹理实现,使物体按照某种规则逐渐透明或完全不可见。这种效果常用于: 角色死亡、传送场景、 魔法消失,比如燃烧、消失等 1、基本原理 通过对比噪声纹理值与消融进…

naivecv的设计与实现(2): 读写gray和rgb图像

图像读写并不是图像处理的核心,仅仅作为调试工具, 是一种手段而非目的。 图像文件格式的选择 正因如此,对gray和rgb图像的读写,存在多种方法。 最常见的三种图像文件格式: bmppngjpg 实际上有更简单的方式&#xf…

网络爬虫技术如何影响网络安全的

随着网络的发展和网络爬虫技术的普及,一些人收集某些需要的信息,会使用网络爬虫进行数据抓取。网络爬虫一方面会消耗网络系统的网络资源,同时可能会造成核心数据被窃取,因此对企业来讲如何反爬虫显得非常重要。 一、什么是网络爬…