我谈《概率论与数理统计》的知识体系

在这里插入图片描述
学习《概率论与数理统计》二十多年后，在廖老师的指导下，才厘清了各章之间的关系。首先，这是两个学科综合的一门课程，这一门课程中还有术语冲突的问题。这一门课程一条线两个分支，脉络很清晰。

概率论与统计学

概率论与统计学是数学的两个分支，它们密切相关但有着不同的侧重点和目标。

概率论：
概率论是一门研究随机现象及其规律性的数学学科。它处理的是在给定条件下某个事件发生的可能性大小的问题。概率论通过定义样本空间、事件以及概率测度等概念来描述不确定性，并基于这些概念发展出一系列理论工具，如随机变量、分布函数、期望值、方差等。概率论的研究对象可以是离散型或连续型的随机变量，也可以是多维随机变量和随机过程。
统计学：
统计学则是利用数据来推断概率模型的参数或进行预测的一门科学。它关注如何收集、整理、分析和解释数据，以从数据中提取有用的信息并作出决策或得出结论。统计学分为描述性统计和推断性统计两大类：前者侧重于总结数据特征（如均值、中位数、标准差等），后者则涉及到对未知总体的估计和假设检验等问题。统计学还涉及实验设计、抽样方法、回归分析等多个方面。

数理统计是统计学的一个分支，它依赖于概率论的理论基础，并结合数学方法来研究如何有效地收集、分析和解释数据。数理统计主要关注的是从样本数据中得出关于总体的结论，以及评估这些结论的可靠性。

知识体系

分支一：从随机现象到样本空间到随机事件再到概率。

从随机事件到随机变量：为了进行定量的数学处理，必须把随机现象的结果数量化，这就是引入随机变量的原因。

分支二：从随机现象到样本空间到随机变量的取值到分布，再到采样到随机样本，根据样本统计推断，估计分布。
概率论与数理统计的教材中缺少采样的部分，就使这条线断了。

随机变量

随机变量的取值是随机变量定义在样本空间上的实值函数。

随机变量既是变量也是函数。
从变量的角度来看，随机变量是指在随机试验或者随机过程中可能取不同数值的一种变量，它的数值受随机因素影响，无法事先确切预知。
从函数的角度来看，随机变量是定义在样本空间（随机试验所有可能结果组成的集合）上的一个实值函数。它将随机试验的所有可能结果（样本点）映射到实数集合上，每一个样本点对应一个实数值。随机变量的本质是对不确定事件结果的一种量化表示，使得原本非数值化的随机现象可以用数学语言来描述。

随机变量结合了变量的不确定性属性与函数的映射特性，它通过函数的方式将随机事件的结果量化，并通过概率论的语言来描述这些结果出现的可能性分布。

随机变量的分布

有了随机变量，然后就可以谈分布了。

定义定义在样本空间Ω上的实值函数 $X = X (ω)$ 称为随机变量，常用大写字母X, Y, Z等表示随机变量，其取值用小写字母x, y, z等表示。假如一个随机变量仅可能取有限个或可列个值，则称其为离散随机变量。假如一个随机变量的可能取值充满数轴上的一个区间(a, b)，则称其为连续随机变量，其中a可以是 $-\infty$ ，b可以是 $+\infty$ 。

连续型随机变量用概率密度函数描述分布，离散型随机变量用分布律描述分布。
以后当我们提到一个随机变量 $X$ 的“概率分布”时，指的是它的分布函数；或者，当 $X$ 是连续型随机变量时，指的是它的概率密度；当 $X$ 是离散型随机变量时，指的是它的分布律。

总之，分布描述随机变量取值的概率。

采样与随机样本

有了分布谈采样（抽样），就有了样本。

抽样（Sampling）是选择样本的过程或方法。它是指根据一定的规则或程序从总体中抽取部分单位作为样本的方法。抽样的目的是为了能够通过研究样本而对总体做出合理的推断。抽样方法有很多种，比如简单随机抽样、分层抽样、系统抽样等。

定义设 $X$ 是具有分布函数 $F$ 的随机变量，若 $X_1, X_2, \cdots, X_n$ 是具有同一分布函数 $F$ 的、相互独立的随机变量，则称 $X_1, X_2,\cdots, X_n$ 为从分布函数 $F$ （或总体 $F$ 、或总体 $X$ ）得到的容量为 $n$ 的简单随机样本，简称样本，它们的观察值 $x_1, x_2,\cdots, x_n$ 称为样本值，又称为 $X$ 的 $n$ 个独立的观察值。