การจัดมาตราส่วนหลายมิติ
การจัดมาตราส่วนหลายมิติจะจัดวางวัตถุในพื้นที่มิติที่ต่ำกว่า เพื่อให้ระยะห่างระหว่างวัตถุสามารถสร้างเมทริกซ์ความไม่คล้ายคลึงกันที่กำหนดขึ้นมาใหม่ได้อย่างใกล้เคียงที่สุด
Definition
การจัดมาตราส่วนหลายมิติเป็นกลุ่มของวิธีการที่ฝังวัตถุเป็นจุดในพื้นที่มิติที่ต่ำกว่า เพื่อให้ระยะห่างระหว่างจุดประมาณค่าความไม่คล้ายคลึงกันแบบคู่ที่สังเกตได้ภายใต้เกณฑ์การสูญเสียที่เลือก
Scope
หัวข้อนี้ครอบคลุมการจัดมาตราส่วนแบบคลาสสิก (เมตริก) ซึ่งมีการกู้คืนการจัดเรียงได้อย่างแม่นยำจากระยะทางแบบยุคลิดผ่านการแยกองค์ประกอบไอเกนของเมทริกซ์ระยะทางที่จัดกึ่งกลางสองครั้ง และการจัดมาตราส่วนแบบไม่ใช้เมตริก ซึ่งจะรักษาระดับลำดับของความไม่คล้ายคลึงกันเท่านั้นโดยการลดเกณฑ์ความเครียดให้เหลือน้อยที่สุด นอกจากนี้ยังกล่าวถึงความสัมพันธ์กับการวิเคราะห์พิกัดหลักและการประเมินความเหมาะสม
Core questions
- เมื่อกำหนดเฉพาะความไม่คล้ายคลึงกันแบบคู่เท่านั้น จะสามารถจัดวางวัตถุในพื้นที่มิติที่ต่ำกว่าได้อย่างไร?
- เมื่อใดที่สามารถกู้คืนการจัดเรียงได้อย่างแม่นยำ และเมื่อใดที่ต้องปรับความเหมาะสมให้เหมาะสมที่สุดแบบวนซ้ำ?
- คุณภาพของโซลูชันการจัดมาตราส่วนวัดได้อย่างไร?
- การจัดมาตราส่วนแบบเมตริกมีความสัมพันธ์กับการวิเคราะห์องค์ประกอบหลักและการวิเคราะห์พิกัดหลักอย่างไร?
Key theories
- การจัดมาตราส่วนแบบคลาสสิก (เมตริก)
- เมื่อความไม่คล้ายคลึงกันเป็นระยะทางแบบยุคลิด การจัดกึ่งกลางสองครั้งของเมทริกซ์ระยะทางกำลังสองจะให้เมทริกซ์กึ่งบวกที่แน่นอน ซึ่งเวกเตอร์ไอเกนนำจะให้พิกัด โดยกู้คืนการจัดเรียงได้ถึงการหมุนและการเลื่อน
- การจัดมาตราส่วนแบบไม่ใช้เมตริกและการลดความเครียด
- เมื่อลำดับของความไม่คล้ายคลึงกันมีความหมายเท่านั้น การแปลงแบบโมโนโทนิกและการลดฟังก์ชันความเครียดแบบวนซ้ำจะปรับการจัดเรียงที่ระยะห่างมีความสัมพันธ์แบบโมโนโทนิกกับความไม่คล้ายคลึงกัน
Clinical relevance
การจัดมาตราส่วนหลายมิติใช้ในการแสดงข้อมูลความคล้ายคลึงกัน เช่น การตัดสินใจทางประสาทสัมผัส ระยะทางทางพันธุกรรมหรือทางภูมิศาสตร์ และความใกล้เคียงของเอกสารหรือเครือข่าย โดยเปลี่ยนเมทริกซ์ความไม่คล้ายคลึงกันให้เป็นแผนที่ที่ตีความได้
History
การจัดมาตราส่วนแบบเมตริกได้รับการกำหนดอย่างเป็นทางการในช่วงกลางศตวรรษที่ 20 และเชื่อมโยงกับพิกัดหลักโดย Gower ในขณะที่ Kruskal และ Shepard ได้นำเสนอการจัดมาตราส่วนแบบไม่ใช้เมตริกโดยอิงจากการลดความเครียดแบบโมโนโทนิก ซึ่งเป็นการขยายวิธีการไปยังข้อมูลความไม่คล้ายคลึงกันแบบอันดับ
Key figures
- Warren Torgerson
- Joseph Kruskal
- John Gower
Related topics
Seminal works
- mardia1979
- coxcox2001
- borg2005
Frequently asked questions
- MDS แบบคลาสสิกเกี่ยวข้องกับ PCA อย่างไร?
- เมื่อความไม่คล้ายคลึงกันเป็นระยะทางแบบยุคลิดที่คำนวณจากข้อมูล การจัดมาตราส่วนแบบคลาสสิกจะให้การจัดเรียงมิติที่ต่ำกว่าแบบเดียวกันกับการวิเคราะห์องค์ประกอบหลักของข้อมูลที่จัดกึ่งกลาง
- ความเครียดในการจัดมาตราส่วนหลายมิติคืออะไร?
- ความเครียดคือการวัดความคลาดเคลื่อนที่ทำให้เป็นมาตรฐานระหว่างระยะห่างระหว่างจุดที่ปรับแล้วกับความไม่คล้ายคลึงกันเป้าหมาย โดยความเครียดที่ต่ำกว่าบ่งชี้ถึงการจัดเรียงที่เหมาะสมกว่า