ตัวชี้วัดและการวัดความสามารถในการใช้งาน
ตัวชี้วัดความสามารถในการใช้งานจะวัดว่าผู้คนใช้งานระบบได้ดีเพียงใด โดยรวบรวมประสิทธิภาพ เช่น ความสำเร็จของงานและเวลา รวมถึงความพึงพอใจส่วนตัวผ่านแบบสอบถามมาตรฐาน
Definition
ตัวชี้วัดความสามารถในการใช้งานคือการวัดเชิงปริมาณของคุณภาพการปฏิสัมพันธ์ รวมถึงการวัดประสิทธิภาพ เช่น ประสิทธิผลและประสิทธิภาพ และการวัดความพึงพอใจที่รายงานตนเอง ซึ่งใช้ในการเปรียบเทียบมาตรฐาน เปรียบเทียบ และติดตามความสามารถในการใช้งานของระบบ
Scope
หัวข้อนี้ครอบคลุมด้านเชิงปริมาณของการประเมิน: ตัวชี้วัดประสิทธิภาพ เช่น อัตราความสำเร็จของงาน เวลาที่ใช้ในงาน และจำนวนข้อผิดพลาด; ตัวชี้วัดการรายงานตนเองจากเครื่องมือมาตรฐาน เช่น System Usability Scale; และการวิเคราะห์และการรายงานมาตรการเหล่านี้ รวมถึงช่วงความเชื่อมั่นและการเปรียบเทียบมาตรฐาน หัวข้อนี้กล่าวถึงวิธีการรวบรวมตัวเลขที่เชื่อถือได้และตีความตัวเลขเหล่านั้น ไม่ครอบคลุมการสังเกตพฤติกรรมเชิงคุณภาพ ซึ่งกล่าวถึงภายใต้การทดสอบความสามารถในการใช้งาน และไม่ครอบคลุมแบบจำลองการรับรู้เชิงคาดการณ์ ซึ่งกล่าวถึงภายใต้แบบจำลองการรับรู้ของการปฏิสัมพันธ์
Core questions
- ตัวชี้วัดประสิทธิภาพใดที่สามารถวัดประสิทธิผลและประสิทธิภาพได้?
- แบบสอบถามมาตรฐานวัดความสามารถในการใช้งานและความพึงพอใจที่รับรู้ได้อย่างไร?
- ข้อมูลความสามารถในการใช้งานควรสรุปอย่างไรด้วยความไม่แน่นอนที่เหมาะสม?
- สามารถใช้ตัวชี้วัดเพื่อเปรียบเทียบและเปรียบเทียบการออกแบบได้อย่างไร?
Key concepts
- อัตราความสำเร็จของงาน
- เวลาที่ใช้ในงาน
- อัตราข้อผิดพลาด
- System Usability Scale (SUS)
- ระดับความพึงพอใจ
- ช่วงความเชื่อมั่น
- การเปรียบเทียบมาตรฐาน
- ตัวชี้วัดประสิทธิภาพและประสิทธิผล
Key theories
- ตัวชี้วัดประสิทธิภาพและความพึงพอใจ
- ความสามารถในการใช้งานวัดได้ตามมิติที่เสริมกัน: ประสิทธิภาพเชิงวัตถุประสงค์ เช่น การทำงานให้สำเร็จ เวลา และข้อผิดพลาด และความพึงพอใจเชิงอัตวิสัยที่รวบรวมผ่านการให้คะแนน ซึ่งรวมกันแล้วจะทำให้ส่วนประกอบของประสิทธิผล ประสิทธิภาพ และความพึงพอใจของความสามารถในการใช้งานเป็นรูปธรรม
- แบบสอบถามความสามารถในการใช้งานมาตรฐาน
- เครื่องมือที่ผ่านการตรวจสอบความถูกต้อง เช่น System Usability Scale และแบบสอบถามของ IBM ให้คะแนนความสามารถในการใช้งานที่รับรู้ที่เชื่อถือได้และเปรียบเทียบได้ ทำให้สามารถเปรียบเทียบมาตรฐานระหว่างระบบและตลอดเวลาได้
- สถิติสำหรับการวิจัยผู้ใช้กลุ่มตัวอย่างขนาดเล็ก
- เนื่องจากการศึกษาความสามารถในการใช้งานมักมีกลุ่มตัวอย่างขนาดเล็ก จึงจำเป็นต้องมีวิธีการที่เหมาะสม ช่วงความเชื่อมั่น ช่วง Wald ที่ปรับปรุงแล้วสำหรับสัดส่วน และความระมัดระวังในการทดสอบนัยสำคัญ เพื่อให้ได้ข้อสรุปที่สามารถป้องกันได้
Clinical relevance
ตัวชี้วัดความสามารถในการใช้งานเชิงปริมาณช่วยให้ทีมสามารถกำหนดเป้าหมาย ติดตามความคืบหน้า และให้เหตุผลในการตัดสินใจออกแบบแก่ผู้มีส่วนได้ส่วนเสีย คะแนนมาตรฐาน เช่น SUS เป็นภาษาทั่วไปสำหรับการเปรียบเทียบผลิตภัณฑ์ และใช้ในการรายงานอุตสาหกรรมและในเอกสารความสามารถในการใช้งานตามข้อกำหนดบางอย่าง
History
เมื่อการทำงานด้านความสามารถในการใช้งานเติบโตขึ้น สาขาได้พัฒนาเครื่องมือมาตรฐาน: System Usability Scale ของ Brooke ปรากฏขึ้นในปี 1996 และแบบสอบถามความพึงพอใจของ IBM ก่อนหน้านั้นไม่นาน ตำราของ Tullis และ Albert และของ Sauro และ Lewis ได้รวบรวมตัวชี้วัดและสถิติกลุ่มตัวอย่างขนาดเล็กในช่วงทศวรรษ 2000 และ 2010 ทำให้การวัด UX เชิงปริมาณเป็นส่วนหนึ่งของการปฏิบัติงานตามปกติ
Key figures
- Thomas Tullis
- Bill Albert
- Jeff Sauro
- James R. Lewis
- John Brooke
Related topics
Seminal works
- brooke1996
- tullis2013
- sauro2016
Frequently asked questions
- System Usability Scale คืออะไร?
- System Usability Scale (SUS) เป็นแบบสอบถามสั้นๆ สิบข้อที่ให้คะแนนเดียวตั้งแต่ 0 ถึง 100 ซึ่งสะท้อนถึงความสามารถในการใช้งานที่ผู้ใช้รับรู้ของระบบ เนื่องจากรวดเร็ว เชื่อถือได้ และใช้กันอย่างแพร่หลาย คะแนน SUS จึงสามารถนำมาเปรียบเทียบระหว่างผลิตภัณฑ์และเทียบกับเกณฑ์มาตรฐานที่กำหนดไว้ได้
- เหตุใดจึงต้องรายงานช่วงความเชื่อมั่นสำหรับตัวชี้วัดความสามารถในการใช้งาน?
- การศึกษาความสามารถในการใช้งานมักมีกลุ่มตัวอย่างขนาดเล็ก ดังนั้นค่าเฉลี่ยเดียวอาจทำให้เข้าใจผิดได้ ช่วงความเชื่อมั่นแสดงช่วงของค่าที่เป็นไปได้สำหรับตัวชี้วัดที่แท้จริง สื่อสารว่ามีความไม่แน่นอนมากน้อยเพียงใดรอบการประมาณค่า และป้องกันการสรุปที่มั่นใจเกินไปจากข้อมูลที่จำกัด