ユーザビリティ指標と測定
ユーザビリティ指標は、タスクの成功率や所要時間などのパフォーマンス、および標準化された質問票による主観的な満足度を捉えることで、人々がシステムをどの程度うまく使用できるかを定量化します。
Definition
ユーザビリティ指標とは、システムのユーザビリティをベンチマーク、比較、追跡するために使用される、有効性や効率性などのパフォーマンス測定値や満足度の自己申告測定値を含む、インタラクションの品質に関する定量的測定値です。
Scope
このトピックでは、評価の定量的側面について扱います。具体的には、タスク成功率、タスク所要時間、エラー数などのパフォーマンス指標、System Usability Scaleなどの標準化されたツールによる自己申告指標、および信頼区間やベンチマーキングを含むこれらの測定値の分析と報告です。信頼性の高い数値を収集し、それらを解釈する方法について説明します。ユーザビリティテストで扱われる行動の定性的観察や、インタラクションの認知モデルで扱われる予測的認知モデルは対象外です。
Core questions
- 有効性と効率性を捉えるパフォーマンス指標にはどのようなものがありますか?
- 標準化された質問票は、知覚されたユーザビリティと満足度をどのように測定しますか?
- ユーザビリティデータは、適切な不確実性とともにどのように要約されるべきですか?
- 指標は、設計のベンチマーキングと比較にどのように使用できますか?
Key concepts
- タスク成功率
- タスク所要時間
- エラー率
- System Usability Scale (SUS)
- 満足度評価
- 信頼区間
- ベンチマーキング
- 効率性および有効性指標
Key theories
- パフォーマンスと満足度指標
- ユーザビリティは、タスク完了、時間、エラーなどの客観的なパフォーマンスと、評価を通じて捉えられる主観的な満足度という補完的な側面から測定され、これらがユーザビリティの有効性、効率性、満足度という構成要素を具体化します。
- 標準化されたユーザビリティ質問票
- System Usability ScaleやIBMの質問票などの検証済みツールは、知覚されたユーザビリティの信頼性のある比較可能なスコアを提供し、システム間および経時的なベンチマーキングを可能にします。
- 小規模サンプルユーザー調査のための統計
- ユーザビリティ研究はしばしば小規模なサンプルで行われるため、正当な結論を導き出すためには、適切な方法、信頼区間、割合に対する調整済みウォルド区間、および有意性検定への注意が必要です。
Clinical relevance
定量的なユーザビリティ指標により、チームは目標を設定し、進捗を追跡し、設計上の決定を利害関係者に正当化することができます。SUSなどの標準化されたスコアは、製品を比較するための共通言語を提供し、業界の報告書や一部の規制上のユーザビリティ文書で使用されています。
History
ユーザビリティ研究が成熟するにつれて、この分野では標準化されたツールが開発されました。BrookeのSystem Usability Scaleは1996年に登場し、IBMの満足度質問票はその少し前に発表されました。TullisとAlbert、およびSauroとLewisによるテキストは、2000年代から2010年代にかけて指標と小規模サンプル統計を統合し、定量的なUX測定を実践の日常的な一部としました。
Key figures
- Thomas Tullis
- Bill Albert
- Jeff Sauro
- James R. Lewis
- John Brooke
Related topics
Seminal works
- brooke1996
- tullis2013
- sauro2016
Frequently asked questions
- System Usability Scaleとは何ですか?
- System Usability Scale (SUS) は、ユーザーがシステムに対して知覚するユーザビリティを反映する0から100までの単一のスコアを生成する、短い10項目の質問票です。迅速で信頼性が高く、広く使用されているため、SUSスコアは製品間で比較したり、確立されたベンチマークと比較したりすることができます。
- ユーザビリティ指標の信頼区間を報告する理由は何ですか?
- ユーザビリティ研究はしばしば小規模なサンプルで行われるため、単一の平均値だけでは誤解を招く可能性があります。信頼区間は、真の指標の妥当な値の範囲を示し、推定値を取り巻く不確実性の程度を伝え、限られたデータからの過信的な結論を防ぎます。