Mann-whitney 检验算法
1、Mann-whitney 算法简介
曼-惠特尼U检验又称“曼-惠特尼秩和检验”,是由H.B.Mann和D.R.Whitney于1947年提出的 [1] 。它假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。
2、Mann-whitney 算法步骤
具体步骤如下:
第一步: 将两组数据混合,并按照大小顺序编排等级。最小的数据等级为 1,第二小的数据 等级为 2,以此类推(若有数据相等的情形,则取这几个数据排序的平均值作为其等级)。
第二步: 分别求出两个样本的等级和 W1、 W 2。
第三步: 计算曼 -惠特尼 U 检验统计量, n1 为第一个样本的量, n2 为第二个样本的量:
选择 U1 和 U2 中最小者与临界值 Ua比较,当 U < Ua 时,拒绝 H0,接受 H1。在原假设为真的情况下, 随机变量 U 的均值和方差分别为,当 n1 和 n2都不小于 10 时,随机变量近似服从正态分布:
第四步: 作出判断。设第一个总体的均值为 μ 1,第二个总体的均值为 μ 2,则有:
3、时空扫描举例分析
假设一个区域A分成n个子区域s1,s2….sn,如下图,A区域各空间位置病例表示为 x1,x2 … xn,将病例数从小到大排列为,用 Rj 表示病例数 xj 所在的秩数,根据Mann-whitney 检验算法,由【si , sj】区域计算其所包含的病例数的秩和,如:
其【si , sj】区域均值和方差表示为 , ,中心极限定理得到其秩和可化解为:。以此可取其最大值表示为聚集性可能性最高的区域,最小值表示为聚集性可能性最低的区域。