Kiểm thử khả năng sử dụng
Kiểm thử khả năng sử dụng đánh giá một giao diện bằng cách quan sát những người dùng đại diện khi họ thực hiện các tác vụ thực tế, xác định những điểm họ gặp khó khăn, thành công hoặc mắc lỗi.
Definition
Kiểm thử khả năng sử dụng là một phương pháp đánh giá trong đó người dùng đại diện thực hiện các tác vụ đại diện với một hệ thống trong khi người quan sát ghi lại hành vi, lỗi và nhận xét của họ, nhằm phát hiện các vấn đề về khả năng sử dụng và đo lường hiệu suất.
Scope
Chủ đề này bao gồm việc đánh giá thực nghiệm các giao diện với người dùng thực: lập kế hoạch các tác vụ kiểm thử, tuyển chọn những người tham gia đại diện, thực hiện các phiên nói to và quan sát, cũng như thu thập cả dữ liệu hiệu suất và báo cáo bằng lời nói. Nó đề cập đến kiểm thử định hình để tìm và khắc phục sự cố, và kiểm thử tổng kết để đánh giá hiệu suất, cùng với các cân nhắc về kích thước mẫu. Nó không bao gồm các phương pháp kiểm tra của chuyên gia như đánh giá heuristic, được xử lý riêng, cũng như việc xử lý thống kê các số liệu, được xử lý trong các số liệu và đo lường khả năng sử dụng.
Core questions
- Làm thế nào để chọn các tác vụ kiểm thử thực tế và người tham gia đại diện?
- Giao thức nói to là gì và nó cung cấp loại dữ liệu nào?
- Kiểm thử khả năng sử dụng định hình và tổng kết khác nhau về mục đích như thế nào?
- Cần bao nhiêu người tham gia để tìm ra hầu hết các vấn đề về khả năng sử dụng?
Key concepts
- các tác vụ đại diện
- người dùng đại diện
- giao thức nói to
- kiểm thử định hình so với tổng kết
- thành công và hoàn thành tác vụ
- hiệu ứng tạo điều kiện và điều phối viên
- kích thước mẫu
- quan sát và ghi nhật ký
Key theories
- Giao thức nói to
- Yêu cầu người dùng nói ra suy nghĩ của họ trong khi thực hiện các tác vụ sẽ thể hiện lý do và những điểm gây nhầm lẫn của họ; phân tích của Ericsson và Simon về các báo cáo bằng lời nói đã xác định khi nào các báo cáo đó phản ánh một cách hợp lệ nội dung của bộ nhớ làm việc.
- Kiểm thử định hình với mẫu nhỏ
- Các nghiên cứu thực nghiệm cho thấy một số lượng nhỏ người tham gia có thể phát hiện ra một tỷ lệ lớn các vấn đề về khả năng sử dụng, hỗ trợ kiểm thử lặp lại với nhiều vòng nhỏ thay vì một nghiên cứu lớn.
- Lập kế hoạch và tạo điều kiện kiểm thử
- Các bài kiểm thử khả năng sử dụng hiệu quả dựa trên các tác vụ được lựa chọn kỹ lưỡng, một người tạo điều kiện trung lập tránh dẫn dắt người tham gia, và việc ghi chép cẩn thận, để những khó khăn được quan sát phản ánh giao diện chứ không phải thiết lập kiểm thử.
Clinical relevance
Kiểm thử khả năng sử dụng là cách trực tiếp nhất để xem cách người dùng thực sử dụng một sản phẩm và được áp dụng rộng rãi trong phát triển phần mềm, web và thiết bị; trong các lĩnh vực được quản lý như thiết bị y tế, kiểm thử khả năng sử dụng tổng kết cung cấp bằng chứng rằng người dùng dự định có thể vận hành một hệ thống mà không mắc lỗi nguy hiểm.
History
Dựa trên truyền thống kiểm thử yếu tố con người, kiểm thử khả năng sử dụng trở thành trọng tâm của phát triển phần mềm vào những năm 1980 và 1990. Công trình năm 1980 của Ericsson và Simon đã đặt nền tảng cho việc sử dụng các báo cáo bằng lời nói, và các hướng dẫn thực hành của Dumas và Redish cùng những người khác đã chuẩn hóa cách lập kế hoạch và thực hiện các bài kiểm thử. Cuộc tranh luận về kích thước mẫu tối ưu, được khơi dậy bởi Virzi và Nielsen, đã định hình thực tiễn định hình hiện đại.
Debates
- Cần bao nhiêu người dùng là đủ để tìm ra các vấn đề về khả năng sử dụng?
- Các nghiên cứu có ảnh hưởng đã lập luận rằng một số lượng nhỏ người dùng có thể phát hiện ra hầu hết các vấn đề, nhưng các nhà phê bình lưu ý rằng điều này phụ thuộc vào tần suất vấn đề và mức độ bao phủ tác vụ, vì vậy có thể cần các bài kiểm thử lớn hơn hoặc lặp lại đối với các hệ thống phức tạp hoặc các tuyên bố tổng kết.
Key figures
- Jakob Nielsen
- Joseph Dumas
- Janice Redish
- K. Anders Ericsson
- Herbert A. Simon
Related topics
Seminal works
- nielsen1993
- ericsson1980
- virzi1992
Frequently asked questions
- Phương pháp nói to là gì?
- Trong phương pháp nói to, người tham gia được yêu cầu nói to những gì họ đang nghĩ khi thực hiện các tác vụ. Điều này tiết lộ kỳ vọng, sự nhầm lẫn và lý do của họ trong thời gian thực, giúp người đánh giá hiểu không chỉ người dùng thất bại ở đâu mà còn tại sao.
- Kiểm thử khả năng sử dụng có cần phòng thí nghiệm đặc biệt không?
- Không. Mặc dù các phòng thí nghiệm chuyên dụng với thiết bị ghi âm rất hữu ích, nhưng kiểm thử khả năng sử dụng có giá trị có thể được thực hiện trong văn phòng, trong môi trường riêng của người tham gia hoặc từ xa qua internet. Điều quan trọng nhất là các tác vụ thực tế, người dùng đại diện và quan sát cẩn thận, chứ không phải các cơ sở đắt tiền.