ScholarGate
助手

可用性度量与测量

可用性度量量化了人们使用系统的效果,通过标准化问卷捕捉任务成功率和时间等绩效以及主观满意度。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

可用性度量是交互质量的定量测量,包括有效性和效率等绩效测量以及自我报告的满意度测量,用于对系统的可用性进行基准测试、比较和跟踪。

Scope

本主题涵盖评估的定量方面:绩效指标,如任务成功率、任务完成时间和错误计数;通过标准化工具(如系统可用性量表)获得的自我报告指标;以及这些度量的分析和报告,包括置信区间和基准测试。它探讨了如何收集可靠数据并进行解释。它不包括可用性测试中涉及的行为定性观察,也不包括交互认知模型中涉及的预测性认知模型。

Core questions

  • 哪些绩效指标能捕捉有效性和效率?
  • 标准化问卷如何衡量感知可用性和满意度?
  • 如何用适当的不确定性来总结可用性数据?
  • 如何利用度量进行基准测试和设计比较?

Key concepts

  • 任务成功率
  • 任务完成时间
  • 错误率
  • 系统可用性量表 (SUS)
  • 满意度评分
  • 置信区间
  • 基准测试
  • 效率和有效性指标

Key theories

绩效和满意度指标
可用性通过互补维度进行衡量:客观绩效(如任务完成、时间、错误)和通过评分捕捉的主观满意度,这些共同构成了可用性的有效性、效率和满意度组成部分。
标准化可用性问卷
经过验证的工具,如系统可用性量表和IBM问卷,能提供可靠、可比较的感知可用性分数,从而实现跨系统和随时间的基准测试。
小样本用户研究的统计学
由于可用性研究通常样本量较小,因此需要适当的方法、置信区间、比例的调整-Wald区间以及对显著性检验的谨慎,才能得出站得住脚的结论。

Clinical relevance

定量的可用性度量使团队能够设定目标、跟踪进展并向利益相关者证明设计决策的合理性;SUS等标准化分数提供了比较产品的通用语言,并用于行业报告和某些监管可用性文档中。

History

随着可用性工作的成熟,该领域开发了标准化工具:Brooke的系统可用性量表于1996年问世,IBM满意度问卷在此之前不久。Tullis和Albert以及Sauro和Lewis的著作在21世纪初和21世纪10年代巩固了度量和小样本统计,使定量用户体验测量成为实践的常规部分。

Key figures

  • Thomas Tullis
  • Bill Albert
  • Jeff Sauro
  • James R. Lewis
  • John Brooke

Related topics

Seminal works

  • brooke1996
  • tullis2013
  • sauro2016

Frequently asked questions

什么是系统可用性量表?
系统可用性量表(SUS)是一个简短的十项问卷,能得出一个0到100的单一分数,反映用户对系统可用性的感知。由于它快速、可靠且广泛使用,SUS分数可以在不同产品之间进行比较,并与既定基准进行对照。
为什么报告可用性指标的置信区间?
可用性研究通常样本量较小,因此单一平均值可能具有误导性。置信区间显示了真实指标的合理值范围,传达了估计值周围的不确定性程度,并防止从有限数据中得出过于自信的结论。

Methods for this concept

Related concepts