什么是系统可用性量表？

系统可用性量表（SUS）是一个简短的十项问卷，能得出一个0到100的单一分数，反映用户对系统可用性的感知。由于它快速、可靠且广泛使用，SUS分数可以在不同产品之间进行比较，并与既定基准进行对照。

为什么报告可用性指标的置信区间？

可用性研究通常样本量较小，因此单一平均值可能具有误导性。置信区间显示了真实指标的合理值范围，传达了估计值周围的不确定性程度，并防止从有限数据中得出过于自信的结论。

可用性度量量化了人们使用系统的效果，通过标准化问卷捕捉任务成功率和时间等绩效以及主观满意度。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

Learn & explore

视频即将推出

可用性度量是交互质量的定量测量，包括有效性和效率等绩效测量以及自我报告的满意度测量，用于对系统的可用性进行基准测试、比较和跟踪。

本主题涵盖评估的定量方面：绩效指标，如任务成功率、任务完成时间和错误计数；通过标准化工具（如系统可用性量表）获得的自我报告指标；以及这些度量的分析和报告，包括置信区间和基准测试。它探讨了如何收集可靠数据并进行解释。它不包括可用性测试中涉及的行为定性观察，也不包括交互认知模型中涉及的预测性认知模型。

绩效和满意度指标: 可用性通过互补维度进行衡量：客观绩效（如任务完成、时间、错误）和通过评分捕捉的主观满意度，这些共同构成了可用性的有效性、效率和满意度组成部分。
标准化可用性问卷: 经过验证的工具，如系统可用性量表和IBM问卷，能提供可靠、可比较的感知可用性分数，从而实现跨系统和随时间的基准测试。
小样本用户研究的统计学: 由于可用性研究通常样本量较小，因此需要适当的方法、置信区间、比例的调整-Wald区间以及对显著性检验的谨慎，才能得出站得住脚的结论。

定量的可用性度量使团队能够设定目标、跟踪进展并向利益相关者证明设计决策的合理性；SUS等标准化分数提供了比较产品的通用语言，并用于行业报告和某些监管可用性文档中。

随着可用性工作的成熟，该领域开发了标准化工具：Brooke的系统可用性量表于1996年问世，IBM满意度问卷在此之前不久。Tullis和Albert以及Sauro和Lewis的著作在21世纪初和21世纪10年代巩固了度量和小样本统计，使定量用户体验测量成为实践的常规部分。

什么是系统可用性量表？: 系统可用性量表（SUS）是一个简短的十项问卷，能得出一个0到100的单一分数，反映用户对系统可用性的感知。由于它快速、可靠且广泛使用，SUS分数可以在不同产品之间进行比较，并与既定基准进行对照。
为什么报告可用性指标的置信区间？: 可用性研究通常样本量较小，因此单一平均值可能具有误导性。置信区间显示了真实指标的合理值范围，传达了估计值周围的不确定性程度，并防止从有限数据中得出过于自信的结论。