推断统计中非参数检验之卡方检验、列联表分析和游程检验

news/2025/2/14 8:20:28/

一、(卡方检验):赛马比赛的赛道会影响成绩吗

在这里插入图片描述
这里以一个实例赛马比赛的赛道是否会影响成绩为例,实际就是检验获胜频数与期望频数之间有无显著性差异。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

import pandas as pd'''step1 调用包'''
from scipy.stats import chisquare
import numpy as np'''step2 读(导)入数据'''
# f_obs = np.array([29,19,18,25,17,10,15,11])
# f_exp = np.array([18,18,18,18,18,18,18,18])
data = pd.read_excel('data_chi2.xlsx')
f_obs=data.qi
f_exp=data.ping
'''Step3  卡方检验'''
chi = chisquare(f_obs,f_exp)
print('卡方统计量值为:',np.round(chi[0],3))
print('\n P值为:',np.round(chi[1],3))

在这里插入图片描述
在这里插入图片描述
这里我们进行卡方分析的导入的包是从 scipy 中导入 chisquare进行分析,同时这里我们读取或者直接导入数据都是可以的,都可以经过分析产生一样的结果。经过分析我们这里求出的p值为0.022,是小于0.05的,此时我们应该拒绝原假设,认为二者分布有显著性差异,即赛马比赛的赛道会影响成绩。
二、(列联表分析):感冒与是否喝牛奶有关吗?
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
原假设是行变量与列变量之间是相互独立的,也就是是否感冒与是否喝牛奶之间没有关系,同时此时的检验统计量选择的卡方检验,决策方法依然是采用p值进行决策。
在这里插入图片描述
在这里插入图片描述

'''step1 调用包'''
from  scipy.stats import chi2_contingency
import numpy as np'''step2 读(导)入数据'''
data = np.array([[43,96], [28,84]])'''Step3  列联表分析(卡方检验)'''
chi = chi2_contingency(data)
print('卡方统计量值为:',np.round(chi[0],3))
print('\n P值为:',np.round(chi[1],3))

在这里插入图片描述
在这里插入图片描述
从这里我们可以看出此时的p值为0.37,此时不能拒绝原假设,认为感冒与喝牛奶之间相互独立,感冒与否与是否喝牛奶之间没有关联。
三、(游程检验):足球裁判执法公平吗?
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

'''step1 调用包'''
from statsmodels.sandbox.stats.runs import runstest_1samp
import numpy as np'''step2 读(导)入数据'''
seq =np.array([1,0,1,1,0,1,1,0,1,0,0,1,1,0,0,0,1,0,1,0,1,0,0,0,0,1,1,1])'''Step3  游程检验'''
res = runstest_1samp(seq)
print('Z统计量值为:',np.round(res[0],3))
print('\n P值为:',np.round(res[1],3))

在这里插入图片描述
从这里我们可以看到此时的p值为0.563,我们不能拒绝原假设,认为此时的变量取值是随机的,也就是足球裁判执法是公平的。
从这我们也可以归纳出假设检验的基本步骤就是读入数据之后选择合适的数据输入形式,此时根据不同的检验统计量,不一样的检验方法的检验统计量也不同。


http://www.ppmy.cn/news/1033909.html

相关文章

研究机构:PayPal稳定币PYUSD有望成为「数字资产」的重要用例

作者:Greg Cipolaro,NYDIG 全球研究主管 编译:WEEX 唯客 本文主要探讨两个话题:1. 过去两周,Crypto ETF 的申请数量激增,它们的审核流程是怎样的?2. 金融科技巨头 PayPal 已推出自己的稳定币 PY…

NPCon:AI模型技术与应用峰会北京站 (参会感受)

8月12日,我有幸参加了在北京皇家格兰云天大酒店举行的“AI模型技术与应用峰会”。 这次会议邀请了很多技术大咖,他们围绕: 六大论点 大模型涌现,如何部署训练架构与算力芯片 LLM 应用技术栈与Agent全景解析 视觉GPU推理服务部署 …

[笔记] libpcap编译及使用

文章目录 前言libpcap库安装安装编译./configure 时 报错:Neither flex nor lex was found libpcap库使用总结 前言 官网 libpcap库安装 环境: centos 7.9 安装编译 libpcap 下载 tar -zxvf libpcap-1.10.4 cd libpcap-1.10.4 ./configure make &am…

设置返回列表元素上限

我正在「拾陆楼」和朋友们讨论有趣的话题,你⼀起来吧?拾陆楼知识星球入口 在get_cell ,get_nets,get_xx等操作时返回的值上限是100,后面的就用...省略了,如果要修改这个上限,需要用下面命令: s…

海归事迹|记斯坦福大学博士后王成坤

王成坤,国内博士毕业后即赴美国斯坦福大学从事5年博士后研究,期间累计发表SCI论文23篇,总影响因子300,授权专利6项。现为南京医科大学高层次引进人才、教授、博士研究生导师、独立学术带头人。本期知识人网小编特做介绍。 百度百科…

ROS2 学习(二)工作空间,节点

工作空间介绍 workspace 是存放整个项目的大目录。 其中包含: src:源码。 build:编译文件。 install:安装空间,存放编译成功后的目标文件。 log:日志。 我们新建一个工作空间目录,其中包…

麦肯锡发布《2023科技趋势展望报告》,生成式AI、下一代软件开发成为趋势,软件测试如何贴合趋势?

近日,麦肯锡公司发布了《2023科技趋势展望报告》。报告列出了15个趋势,并把他们分为5大类,人工智能革命、构建数字未来、计算和连接的前沿、尖端工程技术和可持续发展。 类别一:人工智能革命 生成式AI 生成型人工智能标志着人工智…

实习笔记(一)

自定义注解: 自定义注解中有三个元注解Target,Retention,Document /*** 系统日志注解** author Mark sunlightcsgmail.com*/ Target(ElementType.METHOD) Retention(RetentionPolicy.RUNTIME) Documented public interface SysLog {String value() default "…