Kullanılabilirlik Metrikleri ve Ölçümü
Kullanılabilirlik metrikleri, insanların bir sistemi ne kadar iyi kullandığını nicel olarak belirler; görev başarısı ve süre gibi performansın yanı sıra standartlaştırılmış anketler aracılığıyla öznel memnuniyeti de ölçmektedir.
Tanım
Kullanılabilirlik metrikleri, bir sistemin kullanılabilirliğini kıyaslamak, karşılaştırmak ve izlemek için kullanılan, etkililik ve verimlilik gibi performans ölçümlerini ve öz bildirime dayalı memnuniyet ölçümlerini içeren, etkileşim kalitesinin nicel ölçümleridir.
Kapsam
Bu konu, değerlendirmenin nicel yönünü kapsamaktadır: görev başarı oranı, görevde geçirilen süre ve hata sayıları gibi performans metrikleri; Sistem Kullanılabilirlik Ölçeği gibi standartlaştırılmış araçlardan elde edilen öz bildirim metrikleri; ve güven aralıkları ile kıyaslama dahil olmak üzere bu ölçümlerin analizi ve raporlanması. Güvenilir sayıların nasıl toplanacağı ve yorumlanacağı ele alınmaktadır. Kullanılabilirlik testi kapsamında ele alınan davranışın nitel gözlemini veya etkileşimin bilişsel modelleri kapsamında ele alınan tahmine dayalı bilişsel modelleri kapsamamaktadır.
Temel sorular
- Hangi performans metrikleri etkililik ve verimliliği yakalamaktadır?
- Standartlaştırılmış anketler algılanan kullanılabilirliği ve memnuniyeti nasıl ölçmektedir?
- Kullanılabilirlik verileri uygun belirsizlikle nasıl özetlenmelidir?
- Metrikler, tasarımları kıyaslamak ve karşılaştırmak için nasıl kullanılabilir?
Anahtar kavramlar
- görev başarı oranı
- görevde geçirilen süre
- hata oranı
- Sistem Kullanılabilirlik Ölçeği (SUS)
- memnuniyet derecelendirmesi
- güven aralığı
- kıyaslama
- verimlilik ve etkililik metrikleri
Temel kuramlar
- Performans ve memnuniyet metrikleri
- Kullanılabilirlik, tamamlanan görev, süre ve hatalar gibi nesnel performans ile derecelendirmeler aracılığıyla yakalanan öznel memnuniyet gibi tamamlayıcı boyutlar boyunca ölçülmektedir; bunlar birlikte kullanılabilirliğin etkililik, verimlilik ve memnuniyet bileşenlerini işlevselleştirmektedir.
- Standartlaştırılmış kullanılabilirlik anketleri
- Sistem Kullanılabilirlik Ölçeği ve IBM anketleri gibi doğrulanmış araçlar, algılanan kullanılabilirliğin güvenilir, karşılaştırılabilir puanlarını vermekte, bu da sistemler arasında ve zaman içinde kıyaslama yapılmasına olanak tanımaktadır.
- Küçük örneklemli kullanıcı araştırmaları için istatistikler
- Kullanılabilirlik çalışmaları genellikle küçük örneklemlere sahip olduğundan, savunulabilir sonuçlar çıkarmak için uygun yöntemler, güven aralıkları, oranlar için ayarlanmış Wald aralıkları ve anlamlılık testinde dikkatli olunması gerekmektedir.
Klinik önem
Nicel kullanılabilirlik metrikleri, ekiplerin hedefler belirlemesine, ilerlemeyi izlemesine ve tasarım kararlarını paydaşlara gerekçelendirmesine olanak tanımaktadır; SUS gibi standartlaştırılmış puanlar, ürünleri karşılaştırmak için ortak bir dil sağlamakta ve sektör raporlamasında ve bazı düzenleyici kullanılabilirlik dokümantasyonunda kullanılmaktadır.
Tarihçe
Kullanılabilirlik çalışmaları olgunlaştıkça, alan standartlaştırılmış araçlar geliştirmiştir: Brooke'un Sistem Kullanılabilirlik Ölçeği 1996'da, IBM memnuniyet anketleri ise kısa bir süre önce ortaya çıkmıştır. Tullis ve Albert ile Sauro ve Lewis'in metinleri, 2000'li ve 2010'lu yıllarda metrikleri ve küçük örneklem istatistiklerini bir araya getirerek nicel kullanıcı deneyimi (UX) ölçümünü pratiğin rutin bir parçası haline getirmiştir.
Öne çıkan isimler
- Thomas Tullis
- Bill Albert
- Jeff Sauro
- James R. Lewis
- John Brooke
İlgili konular
Temel eserler
- brooke1996
- tullis2013
- sauro2016
Sıkça sorulan sorular
- Sistem Kullanılabilirlik Ölçeği nedir?
- Sistem Kullanılabilirlik Ölçeği (SUS), kullanıcıların bir sistemin algılanan kullanılabilirliğini yansıtan 0 ile 100 arasında tek bir puan veren kısa, on maddelik bir ankettir. Hızlı, güvenilir ve yaygın olarak kullanıldığı için SUS puanları ürünler arasında ve belirlenmiş kıyaslama noktalarına göre karşılaştırılabilmektedir.
- Kullanılabilirlik metrikleri için neden güven aralıkları raporlanmalıdır?
- Kullanılabilirlik çalışmaları genellikle küçük örneklemlere sahip olduğundan, tek bir ortalama yanıltıcı olabilmektedir. Güven aralıkları, gerçek metrik için olası değerler aralığını göstermekte, bir tahminin etrafındaki belirsizliğin ne kadar olduğunu iletmekte ve sınırlı verilerden aşırı güvenli sonuçlar çıkarılmasını önlemektedir.