ScholarGate
助手

可用性测试

可用性测试通过观察代表性用户尝试执行实际任务,评估界面,从而识别用户遇到困难、成功或出错的地方。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

可用性测试是一种评估方法,其中代表性用户使用系统执行代表性任务,同时观察者记录他们的行为、错误和评论,以发现可用性问题并衡量性能。

Scope

本主题涵盖使用真实用户对界面进行实证评估:规划测试任务、招募代表性参与者、进行出声思维和观察会话,以及收集性能数据和口头报告。它涉及发现和解决问题的形成性测试,以及用于衡量性能的总结性测试,同时考虑样本量。它不包括专家检查方法,例如启发式评估(单独处理),也不包括指标的统计处理(在可用性指标和测量中处理)。

Core questions

  • 如何选择实际的测试任务和代表性参与者?
  • 出声思维协议是什么?它提供哪种数据?
  • 形成性可用性测试和总结性可用性测试在目的上有何不同?
  • 需要多少参与者才能发现大多数可用性问题?

Key concepts

  • 代表性任务
  • 代表性用户
  • 出声思维协议
  • 形成性测试与总结性测试
  • 任务成功与完成
  • 促进者和主持人效应
  • 样本量
  • 观察与记录

Key theories

出声思维协议
要求用户在执行任务时口头表达他们的想法,可以外化他们的推理和困惑点;Ericsson和Simon对口头报告的分析确定了此类报告何时能有效反映工作记忆的内容。
小样本形成性测试
实证研究表明,少量参与者可以发现大部分可用性问题,这支持了进行多轮小型迭代测试,而不是一次大型研究。
测试规划与促进
有效的可用性测试依赖于精心选择的任务、避免引导参与者的中立促进者,以及仔细的记录,以便观察到的困难反映的是界面本身,而非测试设置。

Clinical relevance

可用性测试是了解真实用户如何使用产品的最直接方式,并广泛应用于软件、网络和设备开发;在医疗设备等受监管领域,总结性可用性测试提供证据表明目标用户可以无危险错误地操作系统。

History

借鉴人因测试传统,可用性测试在20世纪80年代和90年代成为软件开发的核心。Ericsson和Simon在1980年的工作奠定了口头报告使用的基础,Dumas和Redish等人的实用指南规范了测试的规划和执行方式。由Virzi和Nielsen引发的关于最佳样本量的辩论,塑造了现代形成性实践。

Debates

多少用户足以发现可用性问题?
有影响力的研究认为,少量用户可以揭示大多数问题,但批评者指出这取决于问题的频率和任务覆盖范围,因此对于复杂系统或总结性主张,可能需要更大规模或重复的测试。

Key figures

  • Jakob Nielsen
  • Joseph Dumas
  • Janice Redish
  • K. Anders Ericsson
  • Herbert A. Simon

Related topics

Seminal works

  • nielsen1993
  • ericsson1980
  • virzi1992

Frequently asked questions

什么是出声思维法?
在出声思维法中,参与者被要求在执行任务时大声说出他们的想法。这能实时揭示他们的预期、困惑和推理,帮助评估者不仅理解用户在哪里失败,而且理解为什么失败。
可用性测试需要专门的实验室吗?
不需要。虽然配备录音设备的专用实验室很有用,但有价值的可用性测试可以在办公室、参与者自己的环境中或通过互联网远程进行。最重要的是实际任务、代表性用户和仔细观察,而不是昂贵的设施。

Methods for this concept

Related concepts