Tests d'utilisabilité
Les tests d'utilisabilité évaluent une interface en observant des utilisateurs représentatifs alors qu'ils tentent d'accomplir des tâches réalistes, identifiant les points où ils rencontrent des difficultés, réussissent ou commettent des erreurs.
Definition
Les tests d'utilisabilité sont une méthode d'évaluation dans laquelle des utilisateurs représentatifs accomplissent des tâches représentatives avec un système, tandis que des observateurs enregistrent leur comportement, leurs erreurs et leurs commentaires, afin de découvrir les problèmes d'utilisabilité et de mesurer les performances.
Scope
Ce sujet couvre l'évaluation empirique des interfaces avec de vrais utilisateurs : la planification des tâches de test, le recrutement de participants représentatifs, la conduite de sessions de réflexion à voix haute (think-aloud) et d'observation, et la collecte de données de performance ainsi que de rapports verbaux. Il aborde les tests formatifs pour identifier et corriger les problèmes, et les tests sommatifs pour évaluer les performances, ainsi que les considérations relatives à la taille de l'échantillon. Il ne couvre pas les méthodes d'inspection par des experts, telles que l'évaluation heuristique, qui sont traitées séparément, ni le traitement statistique des métriques, abordé sous les métriques et la mesure de l'utilisabilité.
Core questions
- Comment sont choisies les tâches de test réalistes et les participants représentatifs ?
- Qu'est-ce que le protocole de réflexion à voix haute (think-aloud) et quel type de données fournit-il ?
- En quoi les tests d'utilisabilité formatifs et sommatifs diffèrent-ils dans leur objectif ?
- Combien de participants sont nécessaires pour trouver la plupart des problèmes d'utilisabilité ?
Key concepts
- tâches représentatives
- utilisateurs représentatifs
- protocole de réflexion à voix haute (think-aloud)
- tests formatifs vs sommatifs
- succès et achèvement des tâches
- effets de facilitation et de modérateur
- taille de l'échantillon
- observation et enregistrement
Key theories
- Protocole de réflexion à voix haute (think-aloud)
- Demander aux utilisateurs de verbaliser leurs pensées pendant l'exécution des tâches extériorise leur raisonnement et leurs points de confusion ; l'analyse des rapports verbaux par Ericsson et Simon a établi quand de tels rapports reflètent validement le contenu de la mémoire de travail.
- Tests formatifs à petit échantillon
- Des études empiriques suggèrent qu'un petit nombre de participants permet de découvrir une grande proportion des problèmes d'utilisabilité, ce qui soutient les tests itératifs avec plusieurs petites séries plutôt qu'une seule grande étude.
- Planification et facilitation des tests
- Des tests d'utilisabilité efficaces reposent sur des tâches bien choisies, un facilitateur neutre qui évite d'influencer les participants, et un enregistrement minutieux, afin que les difficultés observées reflètent l'interface plutôt que la configuration du test.
Clinical relevance
Les tests d'utilisabilité sont le moyen le plus direct de comprendre comment de vraies personnes utilisent un produit et sont largement appliqués dans le développement de logiciels, de sites web et d'appareils ; dans les domaines réglementés tels que les dispositifs médicaux, les tests d'utilisabilité sommatifs fournissent la preuve que les utilisateurs prévus peuvent utiliser un système sans erreurs dangereuses.
History
S'appuyant sur les traditions des tests des facteurs humains, les tests d'utilisabilité sont devenus centraux dans le développement de logiciels dans les années 1980 et 1990. Les travaux d'Ericsson et Simon en 1980 ont fondé l'utilisation des rapports verbaux, et des guides pratiques de Dumas et Redish, entre autres, ont standardisé la planification et l'exécution des tests. Le débat sur la taille optimale de l'échantillon, initié par Virzi et Nielsen, a façonné la pratique formative moderne.
Debates
- Combien d'utilisateurs sont suffisants pour trouver les problèmes d'utilisabilité ?
- Des études influentes ont soutenu qu'un petit nombre d'utilisateurs révèle la plupart des problèmes, mais les critiques notent que cela dépend de la fréquence des problèmes et de la couverture des tâches, de sorte que des tests plus importants ou répétés peuvent être nécessaires pour les systèmes complexes ou les affirmations sommatives.
Key figures
- Jakob Nielsen
- Joseph Dumas
- Janice Redish
- K. Anders Ericsson
- Herbert A. Simon
Related topics
Seminal works
- nielsen1993
- ericsson1980
- virzi1992
Frequently asked questions
- Qu'est-ce que la méthode de réflexion à voix haute (think-aloud) ?
- Dans la méthode de réflexion à voix haute, les participants sont invités à exprimer à voix haute ce qu'ils pensent pendant qu'ils accomplissent les tâches. Cela révèle leurs attentes, leur confusion et leur raisonnement en temps réel, aidant les évaluateurs à comprendre non seulement où les utilisateurs échouent, mais aussi pourquoi.
- Les tests d'utilisabilité nécessitent-ils un laboratoire spécialisé ?
- Non. Bien que des laboratoires dédiés avec équipement d'enregistrement soient utiles, des tests d'utilisabilité précieux peuvent être réalisés dans un bureau, dans l'environnement propre du participant, ou à distance via Internet. Ce qui importe le plus, ce sont des tâches réalistes, des utilisateurs représentatifs et une observation attentive, et non des installations coûteuses.