اختبار قابلية الاستخدام
يقوم اختبار قابلية الاستخدام بتقييم الواجهة من خلال ملاحظة المستخدمين النموذجيين وهم يحاولون إنجاز مهام واقعية، وتحديد نقاط الصعوبة أو النجاح أو الخطأ لديهم.
Definition
اختبار قابلية الاستخدام هو طريقة تقييم يقوم فيها مستخدمون ممثلون بأداء مهام ممثلة باستخدام نظام بينما يسجل المراقبون سلوكهم وأخطائهم وتعليقاتهم، بهدف اكتشاف مشكلات قابلية الاستخدام وقياس الأداء.
Scope
يغطي هذا الموضوع التقييم التجريبي للواجهات مع مستخدمين حقيقيين: تخطيط مهام الاختبار، وتجنيد مشاركين ممثلين، وإجراء جلسات التفكير بصوت عالٍ والملاحظة، وجمع بيانات الأداء والتقارير اللفظية. ويتناول الاختبار التكويني (formative testing) لإيجاد المشكلات وإصلاحها، والاختبار التجميعي (summative testing) لتقييم الأداء، بالإضافة إلى اعتبارات حجم العينة. ولا يغطي هذا الموضوع أساليب فحص الخبراء مثل التقييم الإرشادي (heuristic evaluation)، والتي تُعالج بشكل منفصل، ولا المعالجة الإحصائية للمقاييس، والتي تُعالج ضمن مقاييس وقياس قابلية الاستخدام.
Core questions
- كيف يتم اختيار مهام الاختبار الواقعية والمشاركين الممثلين؟
- ما هو بروتوكول التفكير بصوت عالٍ وما نوع البيانات التي يقدمها؟
- كيف تختلف اختبارات قابلية الاستخدام التكوينية والتجميعية في الغرض؟
- كم عدد المشاركين المطلوبين للعثور على معظم مشكلات قابلية الاستخدام؟
Key concepts
- المهام التمثيلية
- المستخدمون النموذجيون
- بروتوكول التفكير بصوت عالٍ
- الاختبار التكويني مقابل الاختبار التجميعي
- نجاح المهمة وإنجازها
- تأثيرات التيسير والمشرف
- حجم العينة
- الملاحظة والتسجيل
Key theories
- بروتوكول التفكير بصوت عالٍ
- يؤدي مطالبة المستخدمين بالتعبير عن أفكارهم بصوت عالٍ أثناء أداء المهام إلى إظهار منطقهم ونقاط ارتباكهم؛ وقد أثبت تحليل إريكسون وسايمون للتقارير اللفظية متى تعكس هذه التقارير محتويات الذاكرة العاملة بشكل صحيح.
- الاختبار التكويني بعينات صغيرة
- تشير الدراسات التجريبية إلى أن عددًا صغيرًا من المشاركين يكشف عن نسبة كبيرة من مشكلات قابلية الاستخدام، مما يدعم الاختبار التكراري بعدة جولات صغيرة بدلاً من دراسة واحدة كبيرة.
- تخطيط الاختبار والتيسير
- تعتمد اختبارات قابلية الاستخدام الفعالة على مهام مختارة جيدًا، وميسر محايد يتجنب توجيه المشاركين، وتسجيل دقيق، بحيث تعكس الصعوبات الملاحظة الواجهة بدلاً من إعداد الاختبار.
Clinical relevance
يُعد اختبار قابلية الاستخدام الطريقة الأكثر مباشرة لمعرفة كيفية استخدام الأشخاص الحقيقيين للمنتج، ويُطبق على نطاق واسع في تطوير البرمجيات والويب والأجهزة؛ وفي المجالات المنظمة مثل الأجهزة الطبية، يوفر اختبار قابلية الاستخدام التجميعي (summative usability testing) دليلاً على أن المستخدمين المقصودين يمكنهم تشغيل النظام دون أخطاء خطيرة.
History
بالاعتماد على تقاليد اختبار العوامل البشرية، أصبح اختبار قابلية الاستخدام محورياً في تطوير البرمجيات في الثمانينيات والتسعينيات. وقد أسس عمل إريكسون وسايمون عام 1980 لاستخدام التقارير اللفظية، وقامت الأدلة العملية لدومس وريديش وآخرين بتوحيد كيفية تخطيط الاختبارات وتشغيلها. وقد شكل النقاش حول حجم العينة الأمثل، الذي أثاره فيرزي ونيلسن، الممارسة التكوينية الحديثة.
Debates
- كم عدد المستخدمين الكافي للعثور على مشكلات قابلية الاستخدام؟
- جادلت دراسات مؤثرة بأن عددًا صغيرًا من المستخدمين يكشف عن معظم المشكلات، لكن النقاد يشيرون إلى أن هذا يعتمد على تكرار المشكلة وتغطية المهام، لذلك قد تكون هناك حاجة إلى اختبارات أكبر أو متكررة للأنظمة المعقدة أو المطالبات التجميعية.
Key figures
- Jakob Nielsen
- Joseph Dumas
- Janice Redish
- K. Anders Ericsson
- Herbert A. Simon
Related topics
Seminal works
- nielsen1993
- ericsson1980
- virzi1992
Frequently asked questions
- ما هي طريقة التفكير بصوت عالٍ؟
- في طريقة التفكير بصوت عالٍ، يُطلب من المشاركين التعبير بصوت عالٍ عما يفكرون فيه أثناء إنجاز المهام. يكشف هذا عن توقعاتهم وارتباكهم ومنطقهم في الوقت الفعلي، مما يساعد المقيمين على فهم ليس فقط أين يفشل المستخدمون ولكن لماذا.
- هل يتطلب اختبار قابلية الاستخدام مختبرًا خاصًا؟
- لا. بينما تُعد المختبرات المخصصة المزودة بمعدات التسجيل مفيدة، يمكن إجراء اختبار قابلية الاستخدام القيم في مكتب، أو في بيئة المشارك الخاصة، أو عن بُعد عبر الإنترنت. الأهم هو المهام الواقعية، والمستخدمون النموذجيون، والملاحظة الدقيقة، وليس المرافق باهظة الثمن.