การกรองแบบร่วมมือ (Collaborative Filtering)
การกรองแบบร่วมมือแนะนำรายการโดยใช้ประโยชน์จากรูปแบบพฤติกรรมของผู้ใช้จำนวนมาก โดยแนะนำรายการที่ผู้ใช้ที่มีความชอบคล้ายกันเคยเลือก
Definition
การกรองแบบร่วมมือคาดการณ์ความชอบของผู้ใช้สำหรับรายการจากรูปแบบความชอบที่แสดงออกโดยผู้ใช้จำนวนมากในรายการจำนวนมาก โดยใช้ความคล้ายคลึงกันระหว่างผู้ใช้หรือรายการ (วิธีการแบบเพื่อนบ้าน) หรือปัจจัยแฝงที่เรียนรู้ซึ่งสร้างเมทริกซ์ผู้ใช้-รายการขึ้นใหม่ (วิธีการแบบจำลอง)
Scope
หัวข้อนี้ครอบคลุมการแนะนำจากเมทริกซ์การโต้ตอบระหว่างผู้ใช้กับรายการโดยไม่มีเนื้อหารายการ: วิธีการแบบเพื่อนบ้าน (memory-based) โดยใช้ความคล้ายคลึงกันระหว่างผู้ใช้กับผู้ใช้ และรายการกับรายการ และวิธีการแบบจำลอง โดยเฉพาะการแยกตัวประกอบเมทริกซ์ออกเป็นปัจจัยแฝงของผู้ใช้และรายการ หัวข้อนี้กล่าวถึงมาตรวัดความคล้ายคลึง การจัดการกับความเบาบางและความสามารถในการปรับขนาด ข้อเสนอแนะโดยนัย และข้อจำกัดของการเริ่มต้นแบบเย็น (cold-start) โดยจะกล่าวถึงกระบวนทัศน์หลักของการทำงานร่วมกัน โดยละเว้นการขยายแบบผสมผสานและแบบคำนึงถึงบริบท และการประเมินผลไว้ในหัวข้อที่เกี่ยวข้อง
Core questions
- วิธีการแบบเพื่อนบ้านใช้ความคล้ายคลึงกันระหว่างผู้ใช้กับผู้ใช้ หรือรายการกับรายการ เพื่อคาดการณ์ความชอบได้อย่างไร?
- การแยกตัวประกอบเมทริกซ์เรียนรู้ปัจจัยแฝงสำหรับผู้ใช้และรายการได้อย่างไร?
- ความเบาบางและความสามารถในการปรับขนาดของเมทริกซ์ผู้ใช้-รายการได้รับการจัดการอย่างไร?
- ข้อเสนอแนะโดยนัย เช่น การคลิกหรือการซื้อ ถูกนำมาใช้ได้อย่างไร?
- เหตุใดการกรองแบบร่วมมือจึงประสบปัญหาในสถานการณ์เริ่มต้นแบบเย็น (cold-start)?
Key concepts
- เมทริกซ์การโต้ตอบระหว่างผู้ใช้กับรายการ
- ความคล้ายคลึงกันระหว่างผู้ใช้กับผู้ใช้ และรายการกับรายการ
- วิธีการแบบเพื่อนบ้าน (memory-based)
- การแยกตัวประกอบเมทริกซ์
- ปัจจัยแฝง
- ความเบาบางของข้อมูล
- ข้อเสนอแนะโดยนัย
- ปัญหาการเริ่มต้นแบบเย็น (cold-start problem)
Key theories
- การกรองแบบร่วมมือโดยใช้เพื่อนบ้าน
- การคาดการณ์เกิดขึ้นจากการให้คะแนนของผู้ใช้ที่คล้ายกันหรือรายการที่คล้ายกัน โดยรูปแบบที่อิงตามรายการมักจะมีความเสถียรและปรับขนาดได้ดีกว่า เนื่องจากความคล้ายคลึงกันของรายการกับรายการเปลี่ยนแปลงช้าและสามารถคำนวณล่วงหน้าได้
- โมเดลปัจจัยแฝงจากการแยกตัวประกอบเมทริกซ์
- การแยกตัวประกอบเมทริกซ์ผู้ใช้-รายการที่เบาบางออกเป็นเวกเตอร์ปัจจัยผู้ใช้และรายการที่มีมิติต่ำ ซึ่งผลคูณภายในประมาณค่าความชอบ จะจับมิติความชอบแฝงและโดยทั่วไปมีประสิทธิภาพดีกว่าวิธีการแบบเพื่อนบ้าน ดังที่เน้นย้ำโดยรางวัล Netflix Prize
Clinical relevance
การกรองแบบร่วมมือเป็นเครื่องมือสำคัญสำหรับการแนะนำขนาดใหญ่ในอีคอมเมิร์ซ การสตรีม และแพลตฟอร์มโซเชียล ซึ่งข้อมูลการโต้ตอบที่อุดมสมบูรณ์ช่วยให้ระบบสามารถนำเสนอรายการที่เกี่ยวข้องในแคตตาล็อกที่หลากหลาย แนวคิดการแยกตัวประกอบเมทริกซ์และปัจจัยแฝงเป็นรากฐานสำคัญของการแนะนำสมัยใหม่ รวมถึงระบบแนะนำแบบโครงข่ายประสาทเทียม
History
การกรองแบบร่วมมือมีต้นกำเนิดในระบบช่วงกลางทศวรรษ 1990 เช่น GroupLens สำหรับ Usenet news อัลกอริทึมแบบรายการของ Sarwar และคณะในปี 2001 ได้ปรับปรุงความสามารถในการปรับขนาด และรางวัล Netflix Prize (2006-2009) ได้ผลักดันวิธีการแยกตัวประกอบเมทริกซ์ ซึ่งสรุปโดย Koren, Bell และ Volinsky ให้เป็นที่รู้จักอย่างกว้างขวาง โมเดลปัจจัยแฝงยังคงเป็นรากฐานสำคัญของระบบแนะนำร่วมสมัย
Key figures
- Joseph Konstan
- John Riedl
- Yehuda Koren
- George Karypis
- Badrul Sarwar
Related topics
Seminal works
- sarwar2001
- koren2009
- ekstrand2011
Frequently asked questions
- ความแตกต่างระหว่างการกรองแบบร่วมมือที่อิงผู้ใช้กับการกรองแบบร่วมมือที่อิงรายการคืออะไร?
- วิธีการที่อิงผู้ใช้จะแนะนำรายการที่ผู้ใช้ที่คล้ายกับผู้ใช้เป้าหมายชอบ ในขณะที่วิธีการที่อิงรายการจะแนะนำรายการที่คล้ายกับรายการที่ผู้ใช้เป้าหมายเคยชอบ โดยความคล้ายคลึงกันของรายการคำนวณจากรูปแบบการให้คะแนนร่วมกัน วิธีการที่อิงรายการมักจะปรับขนาดได้ดีกว่า เนื่องจากความคล้ายคลึงกันของรายการมีความเสถียรมากกว่าและสามารถคำนวณล่วงหน้าได้
- เหตุใดการแยกตัวประกอบเมทริกซ์จึงได้รับความนิยมอย่างมาก?
- การแยกตัวประกอบเมทริกซ์จะบีบอัดเมทริกซ์ผู้ใช้-รายการขนาดใหญ่และเบาบางให้เป็นปัจจัยแฝงที่กะทัดรัดซึ่งจับความชอบพื้นฐาน จัดการกับความเบาบางได้อย่างราบรื่น และคาดการณ์ความชอบที่ไม่เคยเห็นได้อย่างแม่นยำ ผลลัพธ์ที่แข็งแกร่งในการแข่งขัน Netflix Prize ได้ตอกย้ำให้เป็นเทคนิคการกรองแบบร่วมมือที่เป็นมาตรฐาน