การใช้งานและการประเมินผล
การใช้งานและการประเมินผลเป็นส่วนหนึ่งของ HCI ที่เกี่ยวข้องกับการกำหนดว่าระบบเชิงโต้ตอบสามารถใช้งานได้ดีเพียงใด และด้วยวิธีการทั้งเชิงประจักษ์และเชิงวิเคราะห์สำหรับการวัดและปรับปรุงระบบดังกล่าว
Definition
การใช้งาน (Usability) คือระดับที่ระบบสามารถถูกใช้โดยผู้ใช้ที่ระบุ เพื่อบรรลุเป้าหมายที่ระบุได้อย่างมีประสิทธิผล มีประสิทธิภาพ และมีความพึงพอใจในบริบทการใช้งานที่ระบุ; การประเมินผล (evaluation) คือการประยุกต์ใช้วิธีการเชิงประจักษ์และเชิงวิเคราะห์อย่างเป็นระบบเพื่อวัดการใช้งานและระบุปัญหา
Scope
ขอบเขตนี้ครอบคลุมคำจำกัดความของการใช้งานและวิธีการที่ใช้ในการประเมิน: การทดสอบการใช้งานเชิงประจักษ์กับผู้ใช้, วิธีการตรวจสอบ เช่น การประเมินตามหลักการฮิวริสติกและการเดินสำรวจเชิงประชาน (cognitive walkthroughs), ตัวชี้วัดการใช้งานและแบบสอบถามสำหรับการวัดประสิทธิผล ประสิทธิภาพ และความพึงพอใจ รวมถึงแบบจำลองทางประชานที่คาดการณ์ประสิทธิภาพการโต้ตอบ นอกจากนี้ยังกล่าวถึงวิธีการวางแผน ดำเนินการ และตีความการประเมินผล อย่างไรก็ตาม ไม่ครอบคลุมการรวบรวมความต้องการของผู้ใช้ในเบื้องต้น ซึ่งอยู่ภายใต้วิธีการวิจัยผู้ใช้ และหลักการออกแบบที่กำลังถูกประเมิน ซึ่งอยู่ภายใต้การออกแบบการโต้ตอบ
Sub-topics
Core questions
- การใช้งานถูกนิยามและแบ่งออกเป็นองค์ประกอบที่วัดผลได้อย่างไร?
- เมื่อใดที่การประเมินควรใช้ผู้ใช้จริงเทียบกับการตรวจสอบโดยผู้เชี่ยวชาญ?
- ปัญหาการใช้งานถูกระบุ จัดลำดับความสำคัญ และนำกลับไปปรับปรุงการออกแบบได้อย่างไร?
- แบบจำลองทางประชานอย่างง่ายสามารถคาดการณ์เวลาการโต้ตอบก่อนการทดสอบได้อย่างไร?
Key concepts
- การใช้งาน (ประสิทธิผล, ประสิทธิภาพ, ความพึงพอใจ)
- บริบทการใช้งาน
- การทดสอบการใช้งาน
- การประเมินตามหลักการฮิวริสติก
- การเดินสำรวจเชิงประชาน
- ระเบียบวิธีคิดดัง (think-aloud protocol)
- ตัวชี้วัดการใช้งาน
- วิศวกรรมการใช้งานแบบประหยัด
Key theories
- การใช้งานในฐานะประสิทธิผล ประสิทธิภาพ และความพึงพอใจ
- คำจำกัดความ ISO 9241 กำหนดการใช้งานว่าเป็นระดับที่ผู้ใช้ที่ระบุสามารถบรรลุเป้าหมายที่ระบุได้อย่างมีประสิทธิผล มีประสิทธิภาพ และมีความพึงพอใจในบริบทที่ระบุ ทำให้การใช้งานเป็นคุณสมบัติที่วัดผลได้และขึ้นอยู่กับบริบท มากกว่าที่จะเป็นคุณสมบัติภายใน
- วิศวกรรมการใช้งานแบบประหยัด
- Nielsen แย้งว่าวิธีการที่รวดเร็วและประหยัด การทดสอบผู้ใช้ด้วยกลุ่มตัวอย่างขนาดเล็ก การประเมินตามหลักการฮิวริสติก และการคิดดังแบบง่าย สามารถค้นพบปัญหาการใช้งานส่วนใหญ่ได้ด้วยต้นทุนที่น้อยกว่าการศึกษาที่ซับซ้อน ทำให้การประเมินผลเป็นไปได้ในโครงการจริง
- วิธีการเชิงประจักษ์และวิธีการตรวจสอบในฐานะส่วนเสริม
- การทดสอบผู้ใช้เผยให้เห็นสิ่งที่ผู้ใช้จริงทำ ในขณะที่วิธีการตรวจสอบช่วยให้ผู้เชี่ยวชาญสามารถคาดการณ์ปัญหาได้โดยไม่ต้องมีผู้ใช้ การรวมวิธีการทั้งสองเข้าด้วยกันจะช่วยให้พบปัญหาได้มากกว่าการใช้วิธีใดวิธีหนึ่งเพียงอย่างเดียว
Clinical relevance
การประเมินการใช้งานอย่างเป็นระบบถูกนำมาใช้ในอุตสาหกรรมซอฟต์แวร์และผลิตภัณฑ์เพื่อลดข้อผิดพลาด สนับสนุนเวลา และลดการละทิ้งการใช้งาน ในโดเมนที่มีการควบคุม เช่น อุปกรณ์ทางการแพทย์ การประเมินการใช้งานทั้งแบบ formative และ summative เป็นส่วนสำคัญที่จำเป็นในการแสดงให้เห็นว่าผลิตภัณฑ์สามารถใช้งานได้อย่างปลอดภัย
History
วิศวกรรมการใช้งาน (Usability engineering) พัฒนาขึ้นในช่วงปลายทศวรรษ 1980 และ 1990 เมื่อซอฟต์แวร์เข้าสู่ตลาดมวลชน Nielsen และ Molich ได้นำเสนอการประเมินตามหลักการฮิวริสติกในปี 1990 และหนังสือของ Nielsen ในปี 1993 ได้ประมวลวิธีการใช้งานแบบประหยัด (discount usability methods) มาตรฐาน ISO 9241 ได้กำหนดคำจำกัดความของการใช้งานอย่างเป็นทางการ และการประเมินผลได้กลายเป็นขั้นตอนปกติของการออกแบบโดยยึดผู้ใช้เป็นศูนย์กลาง
Key figures
- Jakob Nielsen
- Rolf Molich
- Ben Shneiderman
- Clayton Lewis
Related topics
Seminal works
- nielsen1993
- nielsen1990
- iso9241
Frequently asked questions
- การใช้งานเหมือนกับประสบการณ์ผู้ใช้หรือไม่?
- ไม่ การใช้งานเกี่ยวข้องกับว่าผู้ใช้สามารถบรรลุเป้าหมายได้อย่างมีประสิทธิผล มีประสิทธิภาพ และน่าพึงพอใจเพียงใด ซึ่งสามารถวัดผลได้และมุ่งเน้นไปที่งานเป็นหลัก ประสบการณ์ผู้ใช้กว้างกว่า ครอบคลุมประสบการณ์ทั้งหมดที่รู้สึกได้ รวมถึงอารมณ์ สุนทรียภาพ และความหมาย การใช้งานที่ดีมักจะจำเป็นสำหรับประสบการณ์ที่ดี แต่ไม่เพียงพอด้วยตัวมันเอง
- ต้องใช้ผู้ใช้กี่คนสำหรับการทดสอบการใช้งาน?
- สำหรับการทดสอบแบบ formative ที่มุ่งเน้นการค้นหาปัญหา กลุ่มตัวอย่างขนาดเล็กมักจะเพียงพอ งานวิจัยที่มีอิทธิพลชี้ให้เห็นว่าผู้ใช้เพียงไม่กี่คนสามารถเผยให้เห็นปัญหาจำนวนมาก ดังนั้นการทำซ้ำด้วยการทดสอบขนาดเล็กหลายครั้งมักจะมีคุณค่ามากกว่าการศึกษาขนาดใหญ่เพียงครั้งเดียว การทดสอบแบบ summative ที่ประมาณค่าตัวชี้วัดอย่างแม่นยำจำเป็นต้องมีกลุ่มตัวอย่างที่ใหญ่ขึ้นและเลือกมาอย่างระมัดระวัง