ScholarGate
Asisten

Bias-Variansi dan Overfitting

Pertukaran bias-variansi menjelaskan bagaimana kompleksitas model mengontrol kesalahan prediksi, dengan overfitting dan underfitting sebagai dua mode kegagalan yang harus diseimbangkan oleh pembelajar.

Temukan Topik dengan PaperMindSegeraFind papers & topics
Tools & resources
Unduh salindia
Learn & explore
VideoSegera

Definition

Pertukaran bias-variansi adalah prinsip bahwa kesalahan prediksi yang diharapkan terurai menjadi bias, yaitu kesalahan dari model yang terlalu sederhana untuk menangkap kebenaran, dan variansi, yaitu kesalahan dari model yang terlalu sensitif terhadap sampel pelatihan tertentu, dengan kompleksitas model menggeser kesalahan di antara keduanya.

Scope

Topik ini mencakup dekomposisi kesalahan prediksi yang diharapkan menjadi bias, variansi, dan noise yang tidak dapat direduksi; makna overfitting dan underfitting; dan peran regularisasi dalam menggeser keseimbangan. Ini juga mencakup kurva kesalahan berbentuk U klasik dan observasi terbaru tentang double descent pada model yang sangat overparameterized.

Core questions

  • Bagaimana kesalahan yang diharapkan terurai menjadi bias, variansi, dan noise?
  • Apa yang menjadi ciri overfitting versus underfitting?
  • Bagaimana regularisasi menggeser keseimbangan bias-variansi?
  • Mengapa model yang sangat fleksibel terkadang dapat menggeneralisasi meskipun memiliki kapasitas tinggi?

Key theories

Dekomposisi bias-variansi
Untuk kerugian kuadratik (squared-error loss), kesalahan yang diharapkan terbagi menjadi bias kuadrat, variansi, dan noise yang tidak dapat direduksi, menjelaskan bagaimana asumsi penyederhanaan mengurangi variansi dengan mengorbankan bias dan sebaliknya.
Overfitting dan regularisasi
Overfitting terjadi ketika model menangkap noise daripada sinyal; regularisasi memberikan penalti pada kompleksitas untuk mengurangi variansi, menukar peningkatan kecil dalam bias dengan penurunan variansi yang lebih besar.
Melampaui pertukaran klasik
Dalam rezim yang sangat overparameterized, kesalahan dapat menurun lagi melewati titik interpolasi, fenomena double-descent, yang memperumit gambaran klasik dari kurva berbentuk U tunggal.

Clinical relevance

Pertukaran bias-variansi adalah inti praktis dari penyesuaian model, membimbing pilihan ukuran model, kekuatan regularisasi, dan jumlah fitur untuk meminimalkan kesalahan pada data baru; mendiagnosis apakah suatu model mengalami underfitting atau overfitting adalah langkah rutin dan esensial dalam pembelajaran mesin terapan.

History

Dekomposisi bias-variansi diartikulasikan untuk jaringan saraf dan pembelajaran oleh Geman dan rekan-rekannya sekitar tahun 1992 dan menjadi lensa standar dalam statistik dan pembelajaran mesin. Teori regularisasi memformalkan kontrol kompleksitas, dan temuan double-descent baru-baru ini telah mendorong pemeriksaan ulang pertukaran untuk model overparameterized modern.

Key figures

  • Stuart Geman
  • Trevor Hastie
  • Christopher Bishop

Related topics

Seminal works

  • hastie2009
  • bishop2006
  • geman1992

Frequently asked questions

Apa perbedaan antara overfitting dan underfitting?
Underfitting adalah ketika model terlalu sederhana untuk menangkap pola yang mendasari, menghasilkan bias tinggi dan kinerja buruk bahkan pada data pelatihan. Overfitting adalah ketika model sangat fleksibel sehingga sesuai dengan noise dalam data pelatihan, menghasilkan variansi tinggi dan kinerja buruk pada data baru.
Bagaimana regularisasi membantu?
Regularisasi menambahkan penalti pada kompleksitas model, mencegah parameter yang ekstrem atau banyak. Ini mengurangi variansi, biasanya dengan mengorbankan peningkatan kecil dalam bias, dan dengan demikian menurunkan total kesalahan pada data yang tidak terlihat ketika kompleksitas akan terlalu tinggi.

Methods for this concept

Related concepts