可用性度量与测量
可用性度量量化了人们使用系统的效果,通过标准化问卷捕捉任务成功率和时间等绩效以及主观满意度。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
可用性度量是交互质量的定量测量,包括有效性和效率等绩效测量以及自我报告的满意度测量,用于对系统的可用性进行基准测试、比较和跟踪。
Scope
本主题涵盖评估的定量方面:绩效指标,如任务成功率、任务完成时间和错误计数;通过标准化工具(如系统可用性量表)获得的自我报告指标;以及这些度量的分析和报告,包括置信区间和基准测试。它探讨了如何收集可靠数据并进行解释。它不包括可用性测试中涉及的行为定性观察,也不包括交互认知模型中涉及的预测性认知模型。
Core questions
- 哪些绩效指标能捕捉有效性和效率?
- 标准化问卷如何衡量感知可用性和满意度?
- 如何用适当的不确定性来总结可用性数据?
- 如何利用度量进行基准测试和设计比较?
Key concepts
- 任务成功率
- 任务完成时间
- 错误率
- 系统可用性量表 (SUS)
- 满意度评分
- 置信区间
- 基准测试
- 效率和有效性指标
Key theories
- 绩效和满意度指标
- 可用性通过互补维度进行衡量:客观绩效(如任务完成、时间、错误)和通过评分捕捉的主观满意度,这些共同构成了可用性的有效性、效率和满意度组成部分。
- 标准化可用性问卷
- 经过验证的工具,如系统可用性量表和IBM问卷,能提供可靠、可比较的感知可用性分数,从而实现跨系统和随时间的基准测试。
- 小样本用户研究的统计学
- 由于可用性研究通常样本量较小,因此需要适当的方法、置信区间、比例的调整-Wald区间以及对显著性检验的谨慎,才能得出站得住脚的结论。
Clinical relevance
定量的可用性度量使团队能够设定目标、跟踪进展并向利益相关者证明设计决策的合理性;SUS等标准化分数提供了比较产品的通用语言,并用于行业报告和某些监管可用性文档中。
History
随着可用性工作的成熟,该领域开发了标准化工具:Brooke的系统可用性量表于1996年问世,IBM满意度问卷在此之前不久。Tullis和Albert以及Sauro和Lewis的著作在21世纪初和21世纪10年代巩固了度量和小样本统计,使定量用户体验测量成为实践的常规部分。
Key figures
- Thomas Tullis
- Bill Albert
- Jeff Sauro
- James R. Lewis
- John Brooke
Related topics
Seminal works
- brooke1996
- tullis2013
- sauro2016
Frequently asked questions
- 什么是系统可用性量表?
- 系统可用性量表(SUS)是一个简短的十项问卷,能得出一个0到100的单一分数,反映用户对系统可用性的感知。由于它快速、可靠且广泛使用,SUS分数可以在不同产品之间进行比较,并与既定基准进行对照。
- 为什么报告可用性指标的置信区间?
- 可用性研究通常样本量较小,因此单一平均值可能具有误导性。置信区间显示了真实指标的合理值范围,传达了估计值周围的不确定性程度,并防止从有限数据中得出过于自信的结论。