Derin Üretken Modeller
Derin üretken modeller, görüntü, ses ve metin gibi karmaşık verilerin dağılımını yakalayarak, bir eğitim kümesine benzeyen yeni veriler üretmeyi öğrenmektedir.
Tanım
Derin üretken model, veriler üzerinde bir olasılık dağılımını temsil eden ve bu dağılımdan yeni örnekler üretebilen bir sinir ağıdır; model ailesine bağlı olarak, olabilirlik maksimizasyonu, çekişmeli eğitim veya bir bozulma sürecini tersine çevirmeyi öğrenme yoluyla eğitilmektedir.
Kapsam
Bu kapsam, veri dağılımlarını modelleyen veya bu dağılımlardan örneklem alan sinir ağ modellerini ele almaktadır: bir kodlayıcı ve kod çözücüyü gizli bir önsel ile eşleştiren varyasyonel otoenkoderler; bir üreticiyi bir ayrıştırıcıya karşı karşıya getiren üretken çekişmeli ağlar; veriyi tek seferde bir eleman halinde tahmin eden otoregresif modeller; ve bir gürültü ekleme sürecini tersine çevirmeyi öğrenen difüzyon modelleri. Bu modellerin nasıl eğitildiği ve değerlendirildiği de incelenmektedir.
Temel sorular
- Bir sinir ağı gerçekçi yeni verileri üretmeyi nasıl öğrenebilir?
- Olabilirlik tabanlı, çekişmeli ve difüzyon yaklaşımlarını birbirinden ayıran nedir?
- Gizli değişkenler, üretimi kontrol etmek ve yapılandırmak için nasıl kullanılmaktadır?
- Üretilen örneklerin kalitesi nasıl değerlendirilmektedir?
Temel kuramlar
- Gizli değişkenli üretim
- Varyasyonel otoenkoderler, veriyi gizli bir dağılıma eşleyen bir kodlayıcıyı ve veriyi yeniden oluşturan bir kod çözücüyü öğrenmektedir; bu sayede, önselden gizli kodlar çekilerek yeni verilerin örneklenmesi mümkün olmaktadır.
- Çekişmeli eğitim
- Üretken çekişmeli ağlar, gerçek veriyi üretilen veriden ayırt etmeye çalışan bir ayrıştırıcıyı kandırmak üzere bir üreticiyi eğitmektedir; bu oyunun denge noktası gerçekçi örnekler sağlamaktadır.
- Otoregresif ve difüzyon modelleme
- Otoregresif modeller bir dağılımı, sırayla tahmin edilen koşulluların bir çarpımı olarak çarpanlarına ayırırken, difüzyon modelleri kademeli bir gürültü ekleme sürecini tersine çevirmeyi öğrenmektedir; her iki yaklaşım da yüksek kaliteli üretim sağlamaktadır.
Klinik önem
Derin üretken modeller, görüntü ve ses sentezi, veri artırımı, ilaç ve malzeme tasarımı ile metin ve görüntü üreten üretken yapay zeka sistemlerine güç vermektedir; ikna edici sentetik içerik oluşturma yetenekleri, kötüye kullanım, özgünlük ve değerlendirme konularında önemli endişeleri de beraberinde getirmektedir.
Tarihçe
Sinir ağları ile üretken modelleme, kısıtlı Boltzmann makinelerinden ve derin inanç ağlarından varyasyonel otoenkoderlere ve 2014 yılında üretken çekişmeli ağlara doğru ilerlemiştir. Otoregresif modeller metin ve ses üretimini geliştirmiş, difüzyon modelleri ise daha sonra önde gelen görüntü sentezi kalitesine ulaşarak üretken modellemeyi modern yapay zekanın merkezi bir teması haline getirmiştir.
Öne çıkan isimler
- Ian Goodfellow
- Diederik Kingma
- Yoshua Bengio
İlgili konular
Temel eserler
- goodfellow2016
- lecun2015
- murphy2012
Sıkça sorulan sorular
- Üretken çekişmeli ağ nedir?
- Birlikte eğitilen bir ağ çiftidir: örnekler oluşturan bir üretici ve gerçek veriyi üretilen veriden ayırt etmeye çalışan bir ayrıştırıcı. Üretici, ayrıştırıcıyı kandırmayı öğrenerek gelişmekte ve ideal dengede gerçekçi örnekler üretmektedir.
- Difüzyon modelleri veriyi nasıl üretmektedir?
- Difüzyon modelleri, verilere kademeli olarak gürültü ekleyen bir süreci tersine çevirmeyi öğrenmektedir. Saf gürültüden başlayarak, model adım adım küçük miktarda gürültüyü tekrar tekrar kaldırmakta, temiz bir örnek ortaya çıkana kadar bu süreci sürdürmektedir; bu yöntem, yüksek kaliteli görüntü üretimi için oldukça etkili olduğu kanıtlanmıştır.