独立性
- 1. 独立性的定义
- 2. 独立性的充分条件
- 3. 独立向量的分布和期望
- 3.1. 独立向量的分布
- 3.2. 独立随机变量乘积期望
- 3.2.1. 独立的随机变量意味着不相关
- 3.2.2. 独立随机变量和的分布
- 4. 独立随机变量的存在性
- 4.1. 有限个独立随机变量的构造
- 4.2. 无穷个独立随机变量的构造
本文主要介绍概率极限理论中的大数定律,内容包括:
-
Chebyshev弱大数定律, 三角阵列的弱定律(截断方法)得到的Khinchin弱大数定律;
-
强大数定律的两种证明方法: 由Borel-Cantelli引理得到的强大数定律, 随机级数收敛方法得到的强大数定律. 此外给出了更新理论和大偏差理论.
1. 独立性的定义
概率论与测度论的分水岭: 引入条件概率与独立性这两个概念意味着测度论的终结, 概率论的开始.测度论是研究概率的一种工具(例如可以用纯代数的方法研究概率:Free probability), 因此概率论中最重要的概念本质上不依赖于测度. 下面是本节-独立性的思维导图.
-
两个事件独立,两个随机变量独立,两个 σ \sigma σ-代数独立的定义; 三者之间的关联:4. 两个事件独立是两个随机变量独立的特殊情况(定理2.1.2); 2. 两个随机变量独 立是两个 σ \sigma σ-代数独立的特殊情况(定理 2.1.1).
-
多个事件独立,多个随机变量独立,多个 σ \sigma σ-代数独立的定义;三者之间的关联:
-
多个随机变量独立是多个 σ \sigma σ-代数独立的特殊情况(定理2.1.3).
1.1. 两个事件、两个随机变量、两个 σ \sigma σ-代数独立
定义 (两个事件、两个随机变量、两个 σ \sigma σ-代数独立)
- (i) 若 P ( A ∩ B ) = P ( A ) P ( B ) P(A \cap B)=P(A) P(B) P(A∩B)=P(A)P(B) ,则两个事件 A A A 和 B B B 是独立的;\
- (ii) 两个随机变量 X \mathrm{X} X 和 Y \mathrm{Y} Y 是独立的, 如果对于所有的 C , D ∈ R C, D \in R C,D∈R
P ( X ∈ C , Y ∈ D ) = P ( X ∈ C ) P ( Y ∈ D ) P(X \in C, Y \in D)=P(X \in C) P(Y \in D) P(X∈C,Y∈D)=P(X∈C)P(Y∈D)
即事件 A = { X ∈ C } A=\{X \in C\} A={X∈C} 和 B = { Y ∈ D } B=\{Y \in D\} B={Y∈D} 是独立的.\- (iii) 若对所有 A ∈ F A \in \mathscr{F} A∈F, B ∈ G B \in \mathscr{G} B∈G, 事件 A A A和 B B B都是独立的, 则两个 σ \sigma σ-代数 F \mathscr{F} F, G \mathcal{G} G独立.
定理2.1.1 (随机变量独立与 σ \sigma σ代数独立的关系)]
- (i) 若 X X X, Y Y Y独立, 则 σ ( X ) \sigma(\mathrm{X}) σ(X), σ ( Y ) \sigma(\mathrm{Y}) σ(Y)独立.
- (ii) 若 F \mathscr{F} F, G \mathscr{G} G 独立, X ∈ F X\in\mathcal{F} X∈F, Y ∈ G Y\in\mathcal{G} Y∈G, X X X, Y Y Y独立.
证明:根据定义证明即可.
定理 2.1.2 (事件独立与随机变量独立的关系)
- (i) 若 A A A, B B B独立, 则 A c A^{c} Ac和 B B B, A A A和 B c B^{c} Bc, A c A^{c} Ac和 B c B^{c} Bc也独立.\
- (ii) 相反,事件 A A A 和 B B B独立, 当且仅当它们的示性随机变量 1 A 1_{A} 1A, 1 B 1_{B} 1B独立.
将其简化为有限多对象的情况,即如果每个有限子集合中的对 象都独立,那么无限集合中的对象( σ \sigma σ代数、随机变量或集合)就是独立的.
1.2. 多事件、多个 σ \sigma σ-代数、多个随机变、多个事件独立
定义 (无穷多事件、多个 σ \sigma σ-代数、多个随机变、多个事件独立)
(i) 多个 σ \sigma σ-代数 F 1 , F 2 , … , F n \mathcal{F}_{1}, \mathcal{F}_{2}, \ldots, \mathcal{F}_{n} F1,F2,…,Fn 独立,如果任意 A i ∈ F i , A_{i} \in \mathcal{F}_{i} , Ai∈Fi, 对 i = 1 , … , n i=1, \ldots, n i=1,…,n ,有
P ( ∩ i = 1 n A i ) = ∏ i = 1 n P ( A i ) P\left(\cap_{i=1}^{n} A_{i}\right)=\prod_{i=1}^{n} P\left(A_{i}\right) P(∩i=1nAi)=i=1∏nP(Ai)
(ii) 随机变量 X 1 , … , X n X_{1}, \ldots, X_{n} X1,…,Xn 独立,如果对 i = 1 , … , n i=1, \ldots, n i=1,…,n ,任意 B i ∈ R B_{i} \in \mathcal{R} Bi∈R 有
P ( ∩ i = 1 n { X i ∈ B i } ) = ∏ i = 1 n P ( X i ∈ B i ) P\left(\cap_{i=1}^{n}\left\{X_{i} \in B_{i}\right\}\right)=\prod_{i=1}^{n} P\left(X_{i} \in B_{i}\right) P(∩i=1n{Xi∈Bi})=i=1∏nP(Xi∈Bi)
(iii) 集合 A 1 , … , A n A_{1}, \ldots, A_{n} A1,…,An 独立如果任意 I ⊂ { 1 , … n } I \subset\{1, \ldots n\} I⊂{1,…n} 有 P ( ∩ i ∈ I A i ) = ∏ i ∈ I P ( A i ) P\left(\cap_{i \in I} A_{i}\right)=\prod_{i \in I} P\left(A_{i}\right) P(∩i∈IAi)=∏i∈IP(Ai).
定理2.1.3 (多个事件独立与多个随机变量独立的关系) 令 A 1 , A 2 , … A n A_{1}, A_{2}, \ldots A_{n} A1,A2,…An 独立. (i) A 1 c , A 2 , … , A n A_{1}^{c}, A_{2}, \ldots, A_{n} A1c,A2,…,An 是独立的; (ii) 1 A 1 , … , 1 A n 1_{A_{1}}, \ldots, 1_{A_{n}} 1A1,…,1An 是独立.
1.3. 成对独立和独立的关系
示例2.1.4与习题2.1.7,习题2.1.8):独立的事件是成对独立的,而相反是不正确的 三个随机变量独立,而有了第四个不独立的例子.
2. 独立性的充分条件
证明多个随机变量独立等价于联合分布等于边际分布的乘积.
为证明随机变量X和Y是独立的,必须检查所有Borel集合A和B独立,直接证明过于繁琐,有必要给出一些充分性条件(定理2.1.7).
引理2.1.5 (sigma代数并上全集后的独立性) 集类 A 1 ∪ { Ω } , A 2 ∪ { Ω } , … , A n ∪ { Ω } ⊂ F \mathcal{A}_{1} \cup\{\Omega\}, \mathcal{A}_{2} \cup\{\Omega\}, \ldots, \mathcal{A}_{n} \cup\{\Omega\} \subset \mathcal{F} A1∪{Ω},A2∪{Ω},…,An∪{Ω}⊂F 独立,对任意 A i ∈ A i A_{i} \in \mathcal{A}_{i} Ai∈Ai ,
P ( ∩ i = 1 n A i ) = ∏ i = 1 n P ( A i ) P\left(\cap_{i=1}^{n} A_{i}\right)=\prod_{i=1}^{n} P\left(A_{i}\right) P(∩i=1nAi)=i=1∏nP(Ai)
定理2.1 .7 (各独立pi类生成的sigma代数独立) 假设 A 1 , A 2 , … , A n \mathcal{A}_{1}, \mathcal{A}_{2}, \ldots, \mathcal{A}_{n} A1,A2,…,An 独立,任意 A i \mathcal{A}_{i} Ai 是 π \pi π 类. 则 σ ( A 1 ) , σ ( A 2 ) , … , σ ( A n ) \sigma\left(\mathcal{A}_{1}\right), \sigma\left(\mathcal{A}_{2}\right), \ldots, \sigma\left(\mathcal{A}_{n}\right) σ(A1),σ(A2),…,σ(An) 独立.
习题2.1.9 两个集类独立,生成的 σ \sigma σ代数不独立
推论2.1 .8 (随机变量独立只需分布函数独立性) 为让 X 1 , … , X n X_{1}, \ldots, X_{n} X1,…,Xn 独立,只要对所有 x 1 , … , x n ∈ ( − ∞ , ∞ ] x_{1}, \ldots, x_{n} \in(-\infty, \infty] x1,…,xn∈(−∞,∞] 有
P ( X 1 ≤ x 1 , … , X n ≤ x n ) = ∏ i = 1 n P ( X i ≤ x i ) P\left(X_{1} \leq x_{1}, \ldots, X_{n} \leq x_{n}\right)=\prod_{i=1}^{n} P\left(X_{i} \leq x_{i}\right) P(X1≤x1,…,Xn≤xn)=i=1∏nP(Xi≤xi)
习题2.1.1和2.1.2 密度函数和离散随机变量的独立性
假设 X 1 , … , X n X_{1}, \ldots, X_{n} X1,…,Xn 是独立随机变量,且 X i X_{i} Xi 有分布 μ i \mu_{i} μi ,则 ( X 1 , … , X n ) \left(X_{1}, \ldots, X_{n}\right) (X1,…,Xn) 有分布 μ 1 × ⋯ × μ n \mu_{1} \times \cdots \times \mu_{n} μ1×⋯×μn.
3. 独立向量的分布和期望
首先给出第一节【独立性的第二个判定方法】(第一个判别法推论),即独立随机变量的不相交集合的函数是独立的(定理2.1.10),以此证明两个独立的随机变量意味着不相关(定理2.1.12,定理2.1.13),不过互不相关的随机变量不一定相互独立.
3.1. 独立向量的分布
引理 2.1.9 假设 F i , j , 1 ≤ i ≤ n , 1 ≤ j ≤ m ( i ) \mathcal{F}_{i, j}, 1 \leq i \leq n, 1 \leq j \leq m(i) Fi,j,1≤i≤n,1≤j≤m(i) 独立,令 G i = σ ( ∪ j F i , j ) \mathcal{G}_{i}=\sigma\left(\cup_{j} \mathcal{F}_{i, j}\right) Gi=σ(∪jFi,j). 则 G 1 , … , G n \mathcal{G}_{1}, \ldots, \mathcal{G}_{n} G1,…,Gn 独立.
定理 2.1.10(独立随机变量的不相交集合的函数独立) 若 1 ≤ i ≤ n , 1 ≤ j ≤ m ( i ) , X i , j 1 \leq i \leq n, 1 \leq j \leq m(i), X_{i, j} 1≤i≤n,1≤j≤m(i),Xi,j 独立, f i : R m ( i ) → R f_{i}: \mathbf{R}^{m(i)} \rightarrow \mathbf{R} fi:Rm(i)→R 可测,则 f i ( X i , 1 , … , X i , m ( i ) ) f_{i}\left(X_{i, 1}, \ldots, X_{i, m(i)}\right) fi(Xi,1,…,Xi,m(i)) 独 立.
习题2.1.6 从定义的方法直接得出两个独立随机变量各自可测函数独立.
如果 X 1 , … , X n X_{1}, \ldots, X_{n} X1,…,Xn 是独立的,那么 X = X 1 X=X_{1} X=X1 和 Y = X 2 ⋯ X n Y=X_{2} \cdots X_{n} Y=X2⋯Xn 是独立的.
独立随机变量 X 1 , … , X n X_{1}, \ldots, X_{n} X1,…,Xn “和” S m = X 1 + ⋯ + X m S_{m}=X_{1}+\cdots+X_{m} Sm=X1+⋯+Xm ,由定理2.1.10,那么 S n − S m S_{n}-S_{m} Sn−Sm 独立于事件
{ max 1 ≤ k ≤ m S k > x } \left\{\max _{1 \leq k \leq m} S_{k}>x\right\} {1≤k≤mmaxSk>x}
的示性函数.
3.2. 独立随机变量乘积期望
定理2.1.12 (多维独立随机变量函数的期望) 假设 X X X 和 Y Y Y 独立,并且有分布 μ \mu μ 和 ν \nu ν. 若 h : R 2 → R h: \mathbf{R}^{2} \rightarrow \mathbf{R} h:R2→R 是可测函数, h ≥ 0 h \geq 0 h≥0 或 E ∣ h ( X , Y ) ∣ < ∞ E|h(X, Y)|<\infty E∣h(X,Y)∣<∞ ,则
E h ( X , Y ) = ∬ h ( x , y ) μ ( d x ) ν ( d y ) E h(X, Y)=\iint h(x, y) \mu(d x) \nu(d y) Eh(X,Y)=∬h(x,y)μ(dx)ν(dy)
特别地,如果 h ( x , y ) = f ( x ) g ( y ) h(x, y)=f(x) g(y) h(x,y)=f(x)g(y) ,其中 f , g : R → R f, g: \mathbf{R} \rightarrow \mathbf{R} f,g:R→R 可测, f , g ≥ 0 f, g \geq 0 f,g≥0 或 E ∣ f ( X ) ∣ E|f(X)| E∣f(X)∣ 和 E ∣ g ( Y ) ∣ < ∞ E|g(Y)|<\infty E∣g(Y)∣<∞ 则
E f ( X ) g ( Y ) = E f ( X ) ⋅ E g ( Y ) E f(X) g(Y)=E f(X) \cdot E g(Y) Ef(X)g(Y)=Ef(X)⋅Eg(Y)
习题2.1.14 计算独立随机变量乘积的分布函数
3.2.1. 独立的随机变量意味着不相关
推论2.1.13 独立的随机变量意味着不相关 如果 X 1 , … , X n X_{1}, \ldots, X_{n} X1,…,Xn 独立,且(a) 对所有 i i i X i ≥ 0 X_{i} \geq 0 Xi≥0 ,或(b) 对所有 i , E ∣ X i ∣ < ∞ i, E\left|X_{i}\right|<\infty i,E∣Xi∣<∞ ,则
E ( ∏ i = 1 n X i ) = ∏ i = 1 n E X i E\left(\prod_{i=1}^{n} X_{i}\right)=\prod_{i=1}^{n} E X_{i} E(i=1∏nXi)=i=1∏nEXi
举例2.1.14和习题2.1.4 说明不相关的随机变量不一定独立.
不相关 一个随机变量族 X i , i ∈ I X_{i} , i \in I Xi,i∈I 和 E X i 2 < ∞ E X_{i}^{2}<\infty EXi2<∞ ,如果是不相关的 E ( X i X j ) = E X i E X j 1 E\left(X_{i} X_{j}\right)=E X_{i} E X_{j_{1}} E(XiXj)=EXiEXj1 任意 i ≠ j i \neq j i=j.
3.2.2. 独立随机变量和的分布
定理2.1.12的推论, 得到多个独立随机变量和的分布公式(定理2.1.15,定理2.1.16)
定理 2.1.15 (独立随机变量和的分市函数) 若 X X X 和 Y Y Y 独立, F ( x ) = P ( X ≤ x ) F(x)=P(X \leq x) F(x)=P(X≤x) ,且 G ( y ) = P ( Y ≤ y ) G(y)=P(Y \leq y) G(y)=P(Y≤y) ,则
P ( X + Y ≤ z ) = ∫ F ( z − y ) d G ( y ) P(X+Y \leq z)=\int F(z-y) d G(y) P(X+Y≤z)=∫F(z−y)dG(y)
右侧积分称为 F F F 和 G G G 的卷积,定义为 F ∗ G ( z ) F * G(z) F∗G(z).
习题2.1.13 X X X 和 Y Y Y 不独立,同样也能满足上述公式的例子.
特例2.1.16 (独立随机变量和的分布) 假设 X X X 有密度 f , Y f , Y f,Y 分布函数为 G G G ,两者相互 独立. 则 X + Y X+Y X+Y 有密度
h ( x ) = ∫ f ( x − y ) d G ( y ) h(x)=\int f(x-y) d G(y) h(x)=∫f(x−y)dG(y)
当 Y Y Y 有密度 g g g ,上式可写为 h ( x ) = ∫ f ( x − y ) g ( y ) d y h(x)=\int f(x-y) g(y) d y h(x)=∫f(x−y)g(y)dy
习题2.1.5推出两个独立随机变量求和为 0 的概率公式,且证得具有连续分布的独立随机变量相等的概率为 0.
习题2.1.10推出两个独立整数值随机变量求和为 n n n 的概率公式.
两个标准的例子:多个独立伽马分布随机变量和的分布,多个独立高斯分布随机变量和的分布.
习题2.1.11和习题2.1.12 利用习题2.1.10证明两个独立Poission分布随机变量和的分布.\
利用习题2.1.10证明多个独立Binomial分布随机变量和的分布.
4. 独立随机变量的存在性
4.1. 有限个独立随机变量的构造
给定有限个随机变量的分布函数 F i , 1 ≤ i ≤ n F_{i}, 1 \leq i \leq n Fi,1≤i≤n ,容易构造带有分布函数 P ( X i ≤ x ) = F i ( x ) P\left(X_{i} \leq x\right)=F_{i}(x) P(Xi≤x)=Fi(x) 的 X 1 , … , X n X_{1}, \ldots, X_{n} X1,…,Xn.
有限个独立随机变量的构造 令 Ω = R n , F = R n , X i ( ω 1 , … , ω n ) = ω i ( ω ∈ R n \Omega=\mathbf{R}^{n}, \mathcal{F}=\mathcal{R}^{n}, X_{i}\left(\omega_{1}, \ldots, \omega_{n}\right)=\omega_{i}\left(\omega \in \mathbf{R}^{n}\right. Ω=Rn,F=Rn,Xi(ω1,…,ωn)=ωi(ω∈Rn 的 i i i 个坐标 ) ) ) ,令 P P P 是 R n \mathcal{R}^{n} Rn 上 的测度,有
P ( ( a 1 , b 1 ] × ⋯ × ( a n , b n ] ) = ( F 1 ( b 1 ) − F 1 ( a 1 ) ) ⋯ ( F n ( b n ) − F n ( a n ) ) P\left(\left(a_{1}, b_{1}\right] \times \cdots \times\left(a_{n}, b_{n}\right]\right)=\left(F_{1}\left(b_{1}\right)-F_{1}\left(a_{1}\right)\right) \cdots\left(F_{n}\left(b_{n}\right)-F_{n}\left(a_{n}\right)\right) P((a1,b1]×⋯×(an,bn])=(F1(b1)−F1(a1))⋯(Fn(bn)−Fn(an))
若 μ i \mu_{i} μi 是有分布函数 F i F_{i} Fi 的测度,则 P = μ 1 × ⋯ × μ n P=\mu_{1} \times \cdots \times \mu_{n} P=μ1×⋯×μn.
4.2. 无穷个独立随机变量的构造
为构造无穷多个带有分布函数的独立随机变量 X 1 , X 2 , … X_{1}, X_{2}, \ldots X1,X2,… ,我们想把有限维的方法用到无穷维 上
R N = { ( ω 1 , ω 2 , … ) : ω i ∈ R } = { functions ω : N → R } \mathbf{R}^{\mathbf{N}}=\left\{\left(\omega_{1}, \omega_{2}, \ldots\right): \omega_{i} \in \mathbf{R}\right\}=\{\text { functions } \omega: \mathbf{N} \rightarrow \mathbf{R}\} RN={(ω1,ω2,…):ωi∈R}={ functions ω:N→R}
其中, N = { 1 , 2 , … } , N \mathbf{N}=\{1,2, \ldots\} , \mathbf{N} N={1,2,…},N 是自然数.
无穷个独立随机变量的构造 定义 X i ( ω ) = ω i X_{i}(\omega)=\omega_{i} Xi(ω)=ωi ,配备 R N \mathbf{R}^{\mathbf{N}} RN 以乘积 σ \sigma σ-代数 R N \mathcal{R}^{\mathbf{N}} RN ,这 由形式为 { ω : ω i ∈ B i , 1 ≤ i ≤ n } \left\{\omega: \omega_{i} \in B_{i}, 1 \leq i \leq n\right\} {ω:ωi∈Bi,1≤i≤n} 的有限维集合生成,其中, B i ∈ R B_{i} \in \mathcal{R} Bi∈R. 为把有限维 P P P 存在性 拓展到无穷维的 R N \mathcal{R}^{\mathrm{N}} RN ,需要科尔莫戈罗夫延拓定理.
习题2.1.15 可以不用科尔莫戈罗夫延拓定理构造出抛硬币的无穷序列
其他可测空间的情形下,科尔莫戈罗夫延拓定理不成立,
无穷个取值于其他可测空间的独立随机变量的构造 有一类nice空间足以满足我们所有的结果,即科尔莫戈罗夫定理在这一空间的推广是自然的.
nice空间 ( S , S ) (S, \mathcal{S}) (S,S) 被称为nice空间,如果存在从 S S S 到 R \mathbf{R} R 的 1 − 1 1-1 1−1 映射 φ \varphi φ 使得 φ \varphi φ 和 φ − 1 \varphi^{-1} φ−1都可测.
这样的空间通常被称为标准的Borel空间,下一个结果表明,在应用中产生的大多数空间都是很好(nice)的.
定理2.1.22 (nice空间的判定) 如果 S S S 是完备可分度量空间 M M M 的Borel子集,且 S \mathcal{S} S 是 S S S 的Borel子集的集合,则 ( S , S ) (S, \mathcal{S}) (S,S) 是 nice空间.
该分析的一个有趣的结果是,对于一个完全可分度量空间的Borel子集,连续体假设是正确的:即所有的集要么是有限的、可数无限的,要么是具有实数的基数.