เหตุใดจึงไม่แก้สมการปกติโดยตรง?

สมการปกติเกี่ยวข้องกับผลคูณของเมทริกซ์ออกแบบกับเมทริกซ์สลับเปลี่ยนของมัน ซึ่งจะยกกำลังสองของเลขสภาพ และอาจทำให้ความแม่นยำลดลงอย่างรุนแรงสำหรับปัญหาที่มีสภาพไม่ดีปานกลาง การแก้ปัญหาผ่าน QR หรือ SVD ทำงานกับเมทริกซ์ดั้งเดิมและมีความเสถียรมากกว่ามาก

การประมาณค่ากำลังสองน้อยที่สุดแตกต่างจากการประมาณค่าแบบมินิแมกซ์อย่างไร?

การประมาณค่ากำลังสองน้อยที่สุดจะลดผลรวม (หรือปริพันธ์) ของกำลังสองของความคลาดเคลื่อน ซึ่งกระจายความคลาดเคลื่อนและไวต่อค่าผิดปกติ (outliers) ในขณะที่มินิแมกซ์จะลดความคลาดเคลื่อนที่ใหญ่ที่สุด การประมาณค่ากำลังสองน้อยที่สุดนำไปสู่สมการเชิงเส้นและคำนวณได้ง่ายกว่า มินิแมกซ์ให้ความคลาดเคลื่อนที่เล็กสม่ำเสมอ

การประมาณค่ากำลังสองน้อยที่สุด

การประมาณค่ากำลังสองน้อยที่สุด (Least-squares approximation) เป็นการค้นหาฟังก์ชันหรือเวกเตอร์พารามิเตอร์ที่ทำให้ผลรวมของกำลังสองของส่วนเหลือ (squared residuals) มีค่าน้อยที่สุด ซึ่งให้ความเหมาะสมที่สุดในเชิงยุคลิด (L2) และเป็นเครื่องมือมาตรฐานสำหรับการปรับแบบจำลองให้เข้ากับข้อมูลที่มีสัญญาณรบกวนหรือข้อมูลที่มีจำนวนตัวแปรอิสระมากกว่าจำนวนข้อมูล (overdetermined data)

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

การประมาณค่ากำลังสองน้อยที่สุด คือการกำหนดองค์ประกอบของชุดการประมาณค่าที่เลือก ซึ่งทำให้ค่า L2 norm (ผลรวมหรือปริพันธ์ของกำลังสองของส่วนเหลือ) ของความคลาดเคลื่อนจากฟังก์ชันเป้าหมายหรือชุดข้อมูลมีค่าน้อยที่สุด

Scope

หัวข้อนี้ครอบคลุมปัญหาการประมาณค่ากำลังสองน้อยที่สุดเชิงเส้น (linear least-squares problem) การกำหนดลักษณะเฉพาะผ่านสมการปกติ (normal equations) และการฉายเชิงตั้งฉาก (orthogonal projection) การหาผลเฉลยที่เสถียรโดยการแยกตัวประกอบ QR (QR factorization) และการแยกค่าเอกฐาน (singular value decomposition) การประมาณค่า L2 แบบต่อเนื่องโดยพหุนามเชิงตั้งฉาก (orthogonal polynomials) และประเด็นด้านสภาพ (conditioning issues) ที่แยกแยะวิธีการหาผลเฉลยที่เชื่อถือได้ออกจากวิธีการที่ไม่น่าเชื่อถือ

Core questions

ผลเฉลยกำลังสองน้อยที่สุดมีลักษณะทางเรขาคณิตอย่างไรในฐานะการฉายเชิงตั้งฉาก?
เหตุใดสมการปกติจึงแก้ปัญหาได้ในทางทฤษฎี แต่กลับคุกคามความแม่นยำในทางปฏิบัติ?
การแยกตัวประกอบ QR และ SVD ให้ผลเฉลยที่เสถียรได้อย่างไร และเมื่อใดที่ SVD มีความจำเป็น?
พหุนามเชิงตั้งฉากทำให้การประมาณค่ากำลังสองน้อยที่สุดแบบต่อเนื่องมีสภาพดีได้อย่างไร?

Key theories

สมการปกติและการฉายเชิงตั้งฉาก: ผลเฉลยกำลังสองน้อยที่สุดทำให้ส่วนเหลือตั้งฉากกับปริภูมิย่อยที่ใช้ประมาณค่า ซึ่งนำไปสู่สมการปกติ ในทางเรขาคณิต การประมาณค่าที่ดีที่สุดคือการฉายเชิงตั้งฉากของข้อมูลลงบนปริภูมิย่อยนั้น
การหาผลเฉลยที่เสถียรผ่านการแยกตัวประกอบเชิงตั้งฉาก: เนื่องจากการสร้างสมการปกติจะยกกำลังสองของเลขสภาพ (condition number) ผลเฉลยกำลังสองน้อยที่สุดที่แม่นยำจึงคำนวณได้โดยการแยกตัวประกอบ QR หรือสำหรับปัญหาที่มีอันดับไม่เต็มหรือใกล้เอกฐาน (near-singular problems) โดยการแยกค่าเอกฐานและพซูโดอินเวอร์สที่เกี่ยวข้อง

Mechanisms

สำหรับระบบที่ไม่ต่อเนื่องที่มีจำนวนตัวแปรอิสระมากกว่าจำนวนข้อมูล (discrete overdetermined system) การแยกตัวประกอบ QR ของเมทริกซ์ออกแบบ (design matrix) จะช่วยลดปัญหาการประมาณค่ากำลังสองน้อยที่สุดให้เป็นการแก้สมการสามเหลี่ยมที่มีสภาพดี (well-conditioned triangular solve) ซึ่งหลีกเลี่ยงการยกกำลังสองของสภาพในสมการปกติ สำหรับปัญหาที่มีอันดับไม่เต็ม (rank-deficient problems) SVD จะให้ผลเฉลยกำลังสองน้อยที่สุดที่มีนอร์มน้อยที่สุดผ่านมัวร์-เพนโรส พซูโดอินเวอร์ส (Moore-Penrose pseudoinverse) และเผยให้เห็นภาวะอันดับไม่เต็มใกล้เคียง (near-rank-deficiency) ผ่านค่าเอกฐานขนาดเล็ก ในบริบทต่อเนื่อง การขยายในพหุนามเชิงตั้งฉากจะทำให้ปัญหาเป็นแนวทแยง (diagonalizes) ดังนั้นสัมประสิทธิ์จึงถูกคำนวณอย่างอิสระในรูปของผลคูณภายใน (inner products)

Clinical relevance

การประมาณค่ากำลังสองน้อยที่สุดเป็นแกนหลักของการปรับข้อมูลและการถดถอยในสาขาวิทยาศาสตร์และวิศวกรรมศาสตร์ การประมาณค่าพารามิเตอร์และการสอบเทียบ การสร้างสัญญาณและภาพขึ้นใหม่ และปัญหาเชิงเส้นย่อย (linearized subproblems) ภายในกระบวนการหาค่าเหมาะที่สุดแบบไม่เชิงเส้น (nonlinear optimization) การวิเคราะห์สภาพของมันเป็นแนวทางในการเลือกการทำให้เป็นระเบียบ (regularization choices) เมื่อข้อมูลมีสัญญาณรบกวนหรือแบบจำลองมีพารามิเตอร์มากเกินไป (over-parameterized)

History

วิธีการกำลังสองน้อยที่สุดได้รับการตีพิมพ์โดย Legendre ในปี 1805 และพัฒนาโดย Gauss พร้อมกับการให้เหตุผลเชิงความน่าจะเป็น การประมวลผลเชิงตัวเลขของวิธีการนี้ได้รับการเปลี่ยนแปลงในศตวรรษที่ยี่สิบโดยอัลกอริทึมการแยกตัวประกอบเชิงตั้งฉาก โดยเฉพาะอย่างยิ่งการใช้ QR และ SVD ที่นำโดย Golub ซึ่งเข้ามาแทนที่แนวทางสมการปกติที่ไม่เสถียรในซอฟต์แวร์คุณภาพสูง

Key figures

Carl Friedrich Gauss
Adrien-Marie Legendre
Gene H. Golub
Ake Bjorck

Seminal works

bjorck1996
trefethen1997

Frequently asked questions

เหตุใดจึงไม่แก้สมการปกติโดยตรง?: สมการปกติเกี่ยวข้องกับผลคูณของเมทริกซ์ออกแบบกับเมทริกซ์สลับเปลี่ยนของมัน ซึ่งจะยกกำลังสองของเลขสภาพ และอาจทำให้ความแม่นยำลดลงอย่างรุนแรงสำหรับปัญหาที่มีสภาพไม่ดีปานกลาง การแก้ปัญหาผ่าน QR หรือ SVD ทำงานกับเมทริกซ์ดั้งเดิมและมีความเสถียรมากกว่ามาก
การประมาณค่ากำลังสองน้อยที่สุดแตกต่างจากการประมาณค่าแบบมินิแมกซ์อย่างไร?: การประมาณค่ากำลังสองน้อยที่สุดจะลดผลรวม (หรือปริพันธ์) ของกำลังสองของความคลาดเคลื่อน ซึ่งกระจายความคลาดเคลื่อนและไวต่อค่าผิดปกติ (outliers) ในขณะที่มินิแมกซ์จะลดความคลาดเคลื่อนที่ใหญ่ที่สุด การประมาณค่ากำลังสองน้อยที่สุดนำไปสู่สมการเชิงเส้นและคำนวณได้ง่ายกว่า มินิแมกซ์ให้ความคลาดเคลื่อนที่เล็กสม่ำเสมอ