Matris Ayrıştırmaları
Matris ayrıştırmaları, bir matrisi daha basit çarpanların (üçgensel, ortogonal veya köşegen) bir çarpımı olarak ifade eder; bu çarpanlardan çözümler, en küçük kareler uyumları ve spektral bilgiler kararlı bir şekilde okunabilmektedir.
Tanım
Matris ayrıştırması, bir matrisin özel yapıya sahip iki veya daha fazla matrisin çarpımı olarak temsil edilmesidir; bu temsil, temel problemlerin (sistem çözme, veri uyarlama, rank veya norm hesaplama gibi) basit ve sayısal olarak kararlı hale gelmesi için seçilmektedir.
Kapsam
Bu konu, QR ayrıştırmasını (Householder yansımaları ve Givens rotasyonları veya Gram-Schmidt aracılığıyla), simetrik pozitif tanımlı matrisler için Cholesky ayrıştırmasını ve tekil değer ayrıştırmasını, ayrıca bunların en küçük kareler problemlerinde, rank belirlemede ve düşük ranklı yaklaşıklıkta kullanımını kapsamaktadır.
Temel sorular
- QR ayrıştırması, kötü koşullandırılmış normal denklemleri oluşturmadan en küçük kareler problemlerini nasıl çözmektedir?
- Cholesky ayrıştırması ne zaman uygulanabilir ve simetrik pozitif tanımlı matrisler için genel LU'dan neden daha ucuz ve daha kararlıdır?
- Tekil değer ayrıştırması, rank, norm ve düşük ranklı yaklaşıklık hakkında hangi bilgileri ortaya koymaktadır?
- Hangi ortogonalizasyon şeması (Householder, Givens veya Gram-Schmidt) doğruluğu en iyi şekilde korumaktadır?
Temel kuramlar
- QR ayrıştırması ve ortogonalizasyon
- Herhangi bir matris, ortonormal sütunlara sahip Q ve üst üçgensel R ile A = QR olarak yazılabilir; Householder yansımaları ile hesaplandığında geriye doğru kararlıdır ve doğrusal en küçük kareler çözümlerine standart bir yol sunar.
- Tekil değer ayrıştırması
- Her matris, U ve V ortogonal, S ise negatif olmayan tekil değerlere sahip köşegen bir matris olmak üzere A = U S V-devrik olarak çarpanlara ayrılır; SVD, rankı, 2-normu ve koşul sayısını, dört temel alt uzayı ve Eckart-Young teoremi aracılığıyla optimal düşük ranklı yaklaşıklığı ortaya koyar.
- Cholesky ayrıştırması
- Simetrik pozitif tanımlı bir matris, L alt üçgensel olmak üzere A = L L-devrik olarak çarpanlara ayrılır; bu ayrıştırma, kararlılık için pivotlama gerektirmez ve genel LU'nun yaklaşık yarısı kadar maliyetlidir.
Mekanizmalar
Householder QR, ortogonal yansımalar kullanarak köşegenin altındaki sıfırları her seferinde bir sütun olacak şekilde oluşturur ve Q'yu dolaylı olarak biriktirir; Givens rotasyonları ise tek tek girdileri sıfırlar ve seyrek veya güncelleme bağlamları için uygundur. Cholesky, simetri ve pozitif tanımlılığı kullanarak L'yi doğrudan hesaplar. SVD, iki aşamada hesaplanır: ortogonal dönüşümlerle bidiagonalizasyon ve ardından bidiagonal formun iteratif diyagonalizasyonu; bu süreçte tüm ara nicelikler iyi koşullandırılmış olarak kalır.
Klinik önem
Matris ayrıştırmaları, en küçük kareler veri uyarlaması, temel bileşen analizi ve boyut indirgeme, iyi tanımlanmamış ters problemlerin düzenlileştirilmesi, tavsiye sistemleri ve model sıra indirgemesi gibi alanların arkasındaki itici güçtür; özellikle SVD, yüksek boyutlu verilerin matematiksel olarak optimal düşük ranklı özetini sağlamaktadır.
Tarihçe
Ortogonal ayrıştırmaların sistematik sayısal kullanımı 1950'ler ve 1960'larda Householder yansımaları ve SVD için Golub-Kahan algoritması ile gelişmiştir; bu gelişmeler, tekil değer ayrıştırmasını teorik bir araçtan rutin olarak hesaplanabilir bir araca dönüştürmüş ve en küçük kareler ile veri analizinin merkezine yerleştirmiştir.
Öne çıkan isimler
- Alston S. Householder
- Gene H. Golub
- William Kahan
İlgili konular
Temel eserler
- trefethen1997
- golub2013
Sıkça sorulan sorular
- En küçük kareler için normal denklemler yerine neden QR kullanılır?
- Normal denklemleri oluşturmak, matrisin koşul sayısını karesine alır, bu da doğruluğu bozabilir. QR ayrıştırması, ortogonal dönüşümler aracılığıyla orijinal matrisle çalışır ve geriye doğru kararlıdır, bu nedenle daha güvenilir en küçük kareler çözümleri sunar.
- SVD'yi bu kadar yaygın olarak kullanılan yapan nedir?
- SVD, bir matrisin rankını, normunu, koşul sayısını ve optimal düşük ranklı yaklaşıklığını aynı anda, sayısal olarak iyi davranışlı ortogonal çarpanlar aracılığıyla ortaya koyar; bu nedenle veri sıkıştırma, gürültü giderme ve boyut indirgemenin temelini oluşturur.