概率论占比更多,三分之二左右
数理统计会少一些
事件之间的概率
ab互斥,不是ab独立
古典概型吃高中基础,考的不会很多
条件概率公式,要记
公式不要全记,很多有名称的公式是通过基础公式转换而来的
目的在于解决一些问题的解决经常需要相同的一套流程
所以干脆在这个基础上直接转换出流程的公式
随机变量X的分布
一维随机变量及其分布,,这一章很重要,而且是后续学习的理论基础
有很多的离散分布类型,重点部分为二项分布和泊松分布
均匀分布和指数分布
连续这一块有正态分布,正态分布很重要,贯穿后面的数理统计
对于这个公式的考察,概率不大
正态分布使用之前要先转换为标准化变量,才方便计算
离散型函数
一般还是考连续型
单调函数y=g(x)
二维随机变量分布
联合密度函数,两个随机变量之间满足的二重积分关系
正则性,联合密度函数的区域面积为1,求出k的未知数
求出k之后,f(x,y)这个二维随机变量的函数就确认了,然后就用x+y<=4限制的区间对函数的积分范围进行限制
边缘分布,则是只观察这个二维随机变量函数的其中一个是怎么变化的
条件分布
二维联合分布、密度函数的独立性
卷积公式,z=x+y,密度函数的相加
最值的函数,即在该点的情况下,max的值为多个随机变量中最大或最小的那个F()概率
(各个随机变量互相独立,而且同概率分布函数)
随机变量的数字特征
对于概率密度连续函数--期望的求解
对于方差,一维连续分布
---切比雪夫不等式,游离知识体系外(考察较少,如果要使用也一般会直接说明)
***背***常用分布的期望和方差(连续型中的各种概率分布)
告诉一个具体的分布类型,然后求期望和方差,运用上面的公式
--二项分布中的npq算连续型方差,p是成功的概率,q是失败的概率,p+q=1
<<<<<<<<<
二维分布的特征数
协方差(只在二维的随机变量情况下)
相关系数底下的两个是标准差的意思,是两个随机变量的方差的根号相乘,
相比于协方差的求法,协方差的性质更重要
方差,协方差都是可以乘法分配律使用的
<<<<<<<<<<<<<<<<<<
大数定律与中心极限定理(过于数学化,反而考察内容较少)但出题是会出题的
大数定理--记形,变量均值->期望均值(求)
中心极限定理
<<<<<<<<<<<<<<<<<6、7、8章
数理统计
(至少是三四十分的情况)
统计量的概念,,对于一个统计量,最常见的就是这个统计量的均值和方差
多个样本共同的均值和方差
三大抽样分布的出题>>给你一个奇奇怪怪的统计量,然后可以变成三大抽样分布
>>>>>>>>>>>>>>>>>>>>>>>>>.
配出常数c,使得c*统计量Y结果服从卡方分布
t分布,参与构成t分布,需要x和y两个统计量一个满足标准正态分布,一个满足卡方分布
然后这两个分布里用的数据尽量不要重合--为了可以让两个统计量有独立的信息提供
F分布---F(1,2)两个数是两个独立统计量x和y的自由度
t分布是一个标准正态一个卡方
f分布是一个卡方加另一个一个卡方
对于标准正态分布的xi,均值和方差s方,可以满足另一些式子
在其中抽样,配凑
<<<<<<<<<<<<<<<<<<<<
数理统计,第七章,参数估计
是估计,也就是说是一种数据量稀少的情况下,要用什么方法还可以得出下一个未知量的结果
包括的知识点----点估计,估计优良性标准,区间估计
矩估计
是已给的常数,不是一个新的变量
写个 ^ 是为了表示这是估计出来的量
最大似然估计
例题
优良性标准
这个例题,第一问利用了样本量估计的无偏估计量等于期望
第二问利用了有效性的方差比较,(对于相合性一般不考察)
区间估计
在第一步,统计量的选择是一个小步骤
如何选择呢
对例题的解
这里的T分布,因为标准差未知,所以使用
判断已知哪些量----选择合适的代换式t,还是卡方,还是标准正态
额外的练习---区间估计也差不多只考这种题了
<<<<<<<<<<<<<<<<
终于也是来到了最后一章,假设检验,但这章似乎只考一个式子,好像是个大题
和上一章的参数估计有着千丝万缕的联系
--
随机变量X的分布函数中含有未知参数θ
--建立假设H0,--背择假设H1
“检验是否等于10”----不等于则为背择假设
对于假设,会抽多个样本出来进行判断,
原假设正确,但是样本量计算结果在拒绝域
原假设错误,拒绝域的假设正确,但样本量计算结果在原假设的区间
第一类错误的概率更常用一些,显著性水平(but no care)
总体 X 不一定要服从正态分布才能使用置信区间
置信度,是只要处在 相信的可能数值区间,就算相信,的概率
先设置区间,然后才得出了这个区间的置信度
置信区间的估计是针对某个统计量(如样本均值、样本比例等),目的是为了估计总体参数的可能范围。
在 X 的正态概率密度曲线 中,从均值到置信的边界的那一段距离,而这段距离有表可以查出来,一一对应
z可以说是概率密度曲线中的一个特殊的点,而这个点减去均值,才是置信区间的长度
无偏估计量是指通过样本数据(如样本均值、样本方差等)对总体参数进行估计时,所得到的估计量的期望值恰好等于总体参数的真实值。
两个无偏估计。。。。
、
指数分布的期望和方差
先定义了分布类型,再讲述概率分布和概率密度函数两种曲线形式
最大似然估计的目的是估计统计模型中的未知参数。具体来说,给定某种假设的统计模型和一组样本数据,最大似然估计通过最大化似然函数来估计模型中的参数。
对数似然函数:为了便于计算和优化,通常我们使用似然函数的对数,即对数似然函数(log-likelihood function)。对数似然函数是似然函数的自然对数:
假设检验需要选择统计量
需要先建立统计量模型
满足t分布之后,具体的信息会给表
--------
显著性水平(α)是指在零假设 H0H_0H0 为真的情况下,拒绝零假设的概率。具体来说,α代表的是发生第一类错误(即错误地拒绝了正确的零假设)的概率。通常,显著性水平设为 0.05 意味着,如果零假设 H0 为真,那么有 5% 的概率会错误地拒绝 H0。