威尔科克森符号秩检验(Wilcoxon signed-rank test)是一种非参数统计检验方法,用于比较两个相关样本或配对样本的差异。它可以用于评估两组相关观测值是否具有统计学上的显著差异。
威尔科克森符号秩检验的基本原理是将差异值的绝对值转化为秩次,然后根据秩次的和来评估样本差异是否具有统计学意义。下面是威尔科克森符号秩检验的详细步骤:
-
假设检验:
- 零假设(H0):两个相关样本的差异中位数为零,即两个样本没有显著差异。
- 备择假设(H1):两个相关样本的差异中位数不为零,即两个样本存在显著差异。
-
收集数据:收集两组相关样本的观测值,并计算它们之间的差异。
-
计算差异的绝对值并排序:对于每对相关样本的差异,计算其绝对值,并按照绝对值的大小对差异进行排序,忽略零差异。
-
分配秩次:为排序后的差异值分配秩次。如果有多个差异值相同,则将它们分配相同的秩次,并取平均秩次。
-
计算秩次和:分别计算正差异和负差异的秩次和。正差异是指差异值大于零的样本对应的秩次之和,负差异是指差异值小于零的样本对应的秩次之和。
-
计算检验统计量:将较小的秩次和作为检验统计量。如果样本量较小(通常小于30),可以使用查表法来查找对应的临界值。如果样本量较大,则可以使用正态分布的近似方法来计算检验统计量的P值。
-
判断显著性:将检验统计量与显著性水平进行比较。如果P值小于显著性水平(通常为0.05),则拒绝零假设,认为两个样本之间存在显著差异。
威尔科克森符号秩检验的优点是它不需要对数据进行正态分布的假设,并且适用于小样本和非连续数据。然而,它对数据的排序很敏感,可能会导致在某些情况下的秩次和过
以下是一个完整且正确的威尔科克森符号秩检验的例子:
假设我们想要比较一个治疗前后的医学测试的得分差异。我们有一个包含10个患者的样本,他们在治疗前后进行了医学测试,得分如下:
治疗前得分 = [6, 3, 7, 4, 8, 5, 2, 4, 5, 9] 治疗后得分 = [4, 2, 6, 3, 7, 4, 2, 4, 5, 10]
步骤1:计算差异值 计算每个患者的差异值,即治疗前得分减去治疗后得分。
差异值 = [2, 1, 1, 1, 1, 1, 0, 0, 0, -1]
步骤2:计算绝对值并排序 计算差异值的绝对值,并按照绝对值的大小进行排序。
绝对值 = [2, 1, 1, 1, 1, 1, 0, 0, 0, 1]
排序 = [0, 0, 0, 1, 1, 1, 1, 1, 1, 2]
步骤3:计算符号秩次 为每个差异值的绝对值分配符号秩次。正差异值的符号秩次为其在排序列表中的位置,负差异值的符号秩次为其在排序列表中的位置的相反数。
符号秩次 = [1.5, 1.5, 1.5, 6.5, 6.5, 6.5, 6.5, 6.5, 6.5, 10]
在这个示例中,差异值为0的出现了3次,因此它们分配的符号秩次是1.5的平均值。同样,差异值为1的出现了6次,分配的符号秩次是6.5的平均值。
步骤4:计算秩次和 计算正差异和负差异的秩次和。
正差异的秩次和 = 1.5 + 6.5 + 6.5 + 6.5 + 6.5 + 6.5 = 34
负差异的秩次和 = 1.5 + 1.5 + 1.5 = 4.5
步骤5:计算检验统计量 选择较小的秩次和作为检验统计量。在这个例子中,较小的秩次和为4.5。
步骤6:判断显著性 根据样本量为10,我们可以使用查表法或计算p值来判断检验统计量的显著性。一般而言,对于小样本,建议使用查表法。
对于显著性水平为α = 0.05,查表可得临界值为W_crit = 17(双尾检验)。由于我们的检验统计量为4.5,它小于临界值,因此我们可以在α = 0.05的显著性水平下拒绝原假设,即存在治疗前后得分的差异。
这就是一个完整的威尔科克森符号秩检验的例子。请注意,这个例子仅用于说明目的,实际应用中可能需要进行更多的计算和假设检验的条件检查。