检验统计量与p值笔记

server/2025/1/13 9:38:15/

一、背景

        以雨量数据为例,当获得一个站点一年的日雨量数据后,我们需要估计该站点的雨量的概率分布情况,因此我们利用有参估计的方式如极大似然法估计得到了假定该随机变量服从某一分布的参数,从而得到该站点的概率密度函数(连续型随机变量)。但是我们并不知道这样的拟合是否准确,因此需要进行检验,我们称这个过程为假设检验

二、原理

        假设检验的一般步骤:(1)建立假设(2)寻找检验统计量(3)确定显著性水平或决定域(4)做出判断

        在第一步中,我们称做出的假设为原假设零假设 H0 而对立的假设称为备择假设 H1。在做出了假设之后,需要选择合适的检验统计量,但无论是什么检验统计量,其目的是为了衡量样本与假设的理论样本之间的偏差,因此这个偏差越小则证明我们的假设越准确,根据检验统计量的不同,我们可以得到不同的假设检验方法,如 t 检验,主要用于检验样本均值与假设均值是否存在显著误差;卡方检验,用于离散型随机变量检验分类的频数差异...

        当确立定检验统计量后进行计算,得到样本与理论之间的检验统计量结果,我们观察这个结果,如果这个结果比较大,我们就认为原假设不可靠,拒接原假设;如果这个结果比较小,我们就接受这个假设。但是有一个问题,不同的检验统计量有不同的形式和临界值表,这在对比过程中无法进行统一,所以我们引入了 p 值和显著性水平的概念(个人理解...)

        p 值为定义为假设检验中中假设原假设为真时观测到的至少与实际观察样本相同的样本的概率。说人话就是,在 p 值就是概率,在零假设成立的情况下,观察到当前数据或更极端数据的可能性。而观察到当前数据或更极端数据是基于检验统计量的,由于不同的检验方法都可以用 p 来判断,人们在假设检验中预先设定的一个阈值,用于决定是否拒绝零假设。决定拒绝零假设的标准,显著性水平设定了一个标准,帮助我们判断 p 值是否足够小,从而决定是否拒绝零假设,如果 p值 ≤ α,我们拒绝零假设,认为结果是显著的;如果 p值 > α,我们不能拒绝零假设,认为结果不显著。

        这里蕴含的逻辑是:p 表示的是在假设原假设成立条件下,观察到的数据的可能性,表示当前观察的是已经发生了,计算它的概率,如果很小(小于某一显著性水平),表示这个已经发生的事发生概率很小(但它却发生了),因此我们要拒绝(个人理解...)

        为什么 p 是基于检验统计量的:在假设检验中,我们通过对样本数据的计算得到一个检验统计量,根据检验统计量的值我们计算对应的 p值,即在零假设成立的条件下,观察到当前统计量或比当前统计量更极端的结果的概率,而 p 值概念中的观察到当前数据就是指观察到当前样本结果,而更极端结果就是值比计算出来的检验统计量还糟糕的概率

三、举例

        现在我有一个站点从1980-2012年的日雨量数据,假设其服从正态分布,利用极大似然法得到参数后,通过 KS 检验其是否符合正态分布。KS 的检验统计量如下:

       

        计算得到的检验统计量为 Dn = 0.181,假设服从正态分布,那么 p 值就是 P(D>Dn),就是当前情况以及更糟的概率。设显著性水平 0.05,如果 p < 0.05 概率太低了,却发生了,拒绝!反之接受。


http://www.ppmy.cn/server/157979.html

相关文章

【网络】计算机网络的分类 局域网 (LAN) 广域网 (WAN) 城域网 (MAN)个域网(PAN)

局域网是通过路由器接入广域网的 分布范围 局域网Local Area Network&#xff1a;小范围覆盖&#xff0c;速度高&#xff0c;延迟低(办公室&#xff0c;家庭&#xff0c;校园&#xff0c;网络) 广域网Wide Area Network 大范围覆盖&#xff0c;速度相对低&#xff0c;延迟高…

【会话详解】

会话详解 概述 会话&#xff1a; 用户通过浏览器访问多个Web资源的过程&#xff0c;从打开浏览器开始访问特定网站&#xff0c;直到关闭浏览器的过程称为会话&#xff08;Session&#xff09;。会话管理是Web应用中跟踪和存储用户状态的重要机制。 有状态会话&#xff1a; …

使用conda出现requests.exceptions.HTTPError 解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

openstack下如何生成centos9 centos10 和Ubuntu24 镜像

如何生成一个centos 10和centos 9 的镜像1. 下载 对应的版本 wget https://cloud.centos.org/centos/10-stream/x86_64/images/CentOS-Stream-GenericCloud-x86_64-10-latest.x86_64.qcow2 wget https://cloud.centos.org/centos/9-stream/x86_64/images/CentOS-Stream-Gener…

react与nodejs实现流式传输,并可以进行中断(fetch聊天版)

一、前端 1.首先我们直观流的接收&#xff0c;后面再来流的中断 // 创建一个新的 AbortControllerconst controller new AbortController();setAbortController(controller); // 保存控制器以便之后使用const responseStream: any await fetch("你的后端地址url",{…

使用RSyslog将Nginx Access Log写入Kafka

个人博客地址&#xff1a;使用RSyslog将Nginx Access Log写入Kafka | 一张假钞的真实世界 环境说明 CentOS Linux release 7.3.1611kafka_2.12-0.10.2.2nginx/1.12.2rsyslog-8.24.0-34.el7.x86_64.rpm 创建测试Topic $ ./kafka-topics.sh --zookeeper 192.168.72.25:2181/k…

多个表单使用相同的 ref 和 rules,表单验证规则不生效

在 Vue 和 Element UI 中&#xff0c;如果多个表单使用相同的 ref 和 rules&#xff0c;可能会导致表单验证规则不生效。这是因为 ref 是唯一的&#xff0c;多个表单共享同一个 ref 会导致冲突。 解决方法&#xff1a; 1. 为每个表单设置不同的 ref 为每个表单设置不同的 re…

python在excel表某一列之后插入六列并命名名字

要在 Python 中使用 openpyxl 包在 Excel 表的某一列之后插入六列并命名这些新列&#xff0c;可以按照以下步骤进行操作。这包括加载 Excel 文件、插入新列&#xff0c;并为新列添加标题名称。 安装 openpyxl 确保已经安装 openpyxl 如果还没有安装&#xff0c;可以使用以下命…