如何设置?如何分析?一文解释清楚用户研究的可用性测试问卷!

news/2024/11/24 22:00:53/

可用性测试问卷

经过长期的研究和市场验证,目前已沉淀出很多标准化的可用性问卷,不同的问卷的评估针对性不一样,可以满足大部分用研需求。使用标准化的问卷是因为这些问卷是经过大量的使用后验证校准后产生的,是被认可具有通识性的衡量标准,这些问卷都具备客观性、重复性、量化、经济、沟通、科学的普适性的优质属性。

2.1 标准化的可用性测试问卷

问卷类型主要可以分为以下两大类:列表中的问卷大部分是需要缴纳一定的费用后才能使用,但其中系统可用性整体评估问卷、软件可用性问卷、场景后问卷是标准可用性问卷中可以免费使用的。应用广泛且被专家推荐的测试问卷是:软件可用性问卷主要针对系统或功能进行整体评估,问题设计精炼清晰,使用快捷方便;单项难易度问题追求的是心理测试的简单和适用性,有5分和7分制,7分制的可靠性更高;主观脑力负荷问题是在线测试,灵敏性更好。综合评估下,软件可用性问卷(Software Usability Scale,SUS)是设计日常中最合适最经济实用的测试问卷。

2.2 软件可用性问卷(SUS)

软件可用性问卷是可用性测试结束时的主观性评估问卷,应用广泛,测试后该问卷使用占比约43%。整个问卷共10题,每题为5分制,奇数项为正面描述,偶数项为反面描述,可以通过修改问题文案聚焦测试范围;如有需要可以将偶数项的问题调整为正面描述,但数据验证调整为正面描述的问卷结果与包含负面描述的问卷差异不大,不影响问卷的测试结论。在完成测试任务后,用户需快速完成各个题目,不进行过多思考,若用户因某些原因无法完成其中某个题目,则视为选择中间值。

2.3 可用性、易用性抽取

问卷整体可以抽取部分题目作为子测量表来作为单独的问卷有针对性的进行可用性和易学性测量,可用性由问卷中1-3、5-9题构成,易学性由问卷中4、10题构成。研究表明使用子测量表对量表的可信度的减低可忽略不计(0.92 → 0.91),并且使用子测量表可减少答题时间。

2.4 分值计算

得分计算:范围在0-4,每题进行转化分值;奇数题(正面):原始分减去1,(x-1);偶数题(负面):5减去原始分,(5-x)
SUS总分= 所有转化过的分值相加 * 2.5, 多样本算SUS总分均值
可用性总分=所有转化过的可用性分数相加3.125
易用性总分=所有转化过的易用性分数相加
12.5

统计学描述方法

可用性测试因为耗费时间较长,能够参与测试的用户资源稀缺,回收样本量小能够收集到的样本量一般会比较小。样本量小的情况下这个样本量所能概括的整体是范围比较大的,会存在较大误差,那么在较为严谨的报告中,可能需要对所得分数和除测试样本外的分值预期进行描述,这时候会涉及到统计学中常用的描述方式,即通过置信度及置信区间来描述,根据置信区间的下边界看软件是否低于行业标准。

3.1 相关概念

置信区间是指在一定概率下包含样本位置总体参数的这部分数值区间,通过计算置信区间来描述测试结果的概率。置信区间宽度和样本量之间是一个逆平方根的关系, 样本量越小,误差越大,未知样本数据可能所在的区间更大。
置信度就是说,你测得的均值,和总体真实情况的差距小于这个给定的值的概率,应该是1-α;换句话描述,即我们有1-α的信心认为,你测得的这个均值和总体的实际期望很接近了(测得的均值就是总体期望是很草率的,但是说,我有95%的把握认为我测得的均值,非常接近总体的期望了)。研究员可以选择0%-100%之间的任意数值的置信度,通常设为90%或95%(最常用)。
临界值是在原假设下,检验统计量在分布图上的点,这些点定义一组要求否定原假设的值。

3.2 置信区间计算

置信区间= (样本平均值-误差幅度)~(样本平均值+误差幅度)=(x -(x- μ))~(x +(x- μ))
x = 样本平均值
误差幅度=临界值
(样本标准差/样本量的平方根),即:(x - μ) = α* (s / sqrt(n))
α=临界值(Excel函数=TINV(1-置信度,样本量-1))
μ=被检验的基准值(行业标准)
s=样本的标准差(Excel函数=STDEVP(N1,N2,…))
n=样本量*
tips:临界值可以通过所设置信度和样本量在t分布表中查找相应的值


http://www.ppmy.cn/news/961260.html

相关文章

通过准确性、可解释性、校准度和忠实度,对ChatGPT的能力进行全面评估

作者:李博,方格翔,杨洋,王泉森,叶蔚,赵文,张世琨单位:北京大学知识计算实验室(KCL)论文:https://arxiv.org/abs/2304.11633代码和数据开源&#x…

IB考试45分是如何做到的?

回顾一下两年前的iB成绩, 2020年在IBO的最终考试当中,全球人仅有126个人的成绩达到了45分,占整体全体IB考生的1%,40分以上占全体IB课程考生的15%。满分45分是全球名校争抢的对象。 在这样的环境下,IB45分是如何做到的…

IB究竟在考什么?IB真的有传闻中的那么难吗?

提起学习“国际课程之王”IB的感受,学生们估计都能开一个“吐槽大会”了,IB很难,不少人学IB,GET到的第一个技能,就是“熬夜”。 ▲IB学生做的搞笑图:凌晨三点,唯一一扇亮着灯的窗户一定是属于IB…

如何判断你的孩子是否适合IB课程?

IB课程最开始是IBO为外交官子女开设全球统一标准的课程,后为全球学生开设从幼儿园到大学预科的课程,为学生提供智力、情感、个人发展、社会技能等方面的教育。 IB课程分为标准难度课程和具有挑战性的高难度课程。要求学生至少选择6门课加Theory of Knowl…

IB地理学什么?适合什么人学习?

IB精选:IB地理学什么?快速搞懂自己适不适合修读地理! 核心目的 IB地理科是一个很特别的科目,目的是要帮助同学掌握一些认识和了解现实世界的技能。这个现实世界包括了两大部分。 第一个部分是自然环境,当中包括生态系…

测试工程师会被ChatGPT取代吗?

2022年底,ChatGPT横空出世,如今已火爆全球。ChatGPT不仅在科技圈引发了地震,更是引起了全社会的广泛关注,也让很多行业的从业者产生了担忧。 ChatGPT会取代教师吗?ChatGPT会让媒体工作者失业吗?ChatGPT会改…

[测试] 调查问卷相关测试

项目介绍:发起问卷,管理问卷信息,把问卷结果通过可视化方式呈现出来 一、测试用例 功能测试:界面、用户管理、题目管理、问卷管理、活动管理 用例编号用例标题模块优先级测试环境测试步骤测试数据预期结果WJ-jiemia-001验证界面…

银行测试的优势在哪里?

为什么做金融类软件测试举个栗子,银行里的软件测试工程师。横向跟互联网公司里的测试来说,薪资相对稳定,加班少甚至基本没有,业务稳定。实在是测试类岗位中的香饽饽!一、什么是金融行业金融业是指经营金融商品的特殊行…