Nesne Tanıma ve Algılama
Nesne tanıma, bir görüntüde neyin bulunduğunu belirlemektedir; nesne algılama ise ek olarak her bir örneği bir sınırlayıcı kutu veya bölge ile konumlandırmaktadır.
Tanım
Nesne tanıma, görüntülere veya bölgelere kategori etiketleri atanmasıdır; nesne algılama ise bir görüntüdeki her nesne örneğini konumlandırma ve etiketleme ortak görevidir.
Kapsam
Bu konu, görüntü sınıflandırmasını, kayan pencere ve bölge önerisi tabanlı algılamayı, klasik güçlendirilmiş basamaklı yüz dedektörünü ve günümüzde tanıma alanına hakim olan evrişimsel sinir ağlarını kapsamakta olup, ilerlemeyi sağlayan büyük etiketli veri kümelerinin ve karşılaştırma testlerinin (benchmark) rolünü de içermektedir.
Temel sorular
- Bir görüntüdeki nesnenin kategorisi nasıl belirlenmektedir?
- Nesneler hem nasıl konumlandırılmakta hem de nasıl sınıflandırılmaktadır?
- Görüş açısı ve görünüm genelinde genellenebilen özellikler ve modeller nelerdir?
- Öğrenilmiş gösterimler neden el yapımı özellikleri geride bırakmıştır?
Anahtar kavramlar
- Görüntü sınıflandırması
- Sınırlayıcı kutu ile algılama
- Bölge önerileri
- Güçlendirilmiş basamaklar
- Evrişimsel sinir ağları
- Karşılaştırma veri kümeleri
Temel kuramlar
- Güçlendirilmiş basamaklı algılama
- Gerçek zamanlı algılama, basit dikdörtgensel özelliklerin, nesne olmayan bölgeleri hızla reddeden bir basamak halinde düzenlenmiş güçlendirilmiş bir sınıflandırıcı ile birleştirilmesiyle elde edilmiştir; buna Viola-Jones yüz dedektörü örnek olarak gösterilebilir.
- Derin evrişimsel tanıma
- Büyük etiketli veri kümeleri üzerinde eğitilen evrişimsel sinir ağları, hiyerarşik görsel özellikleri uçtan uca öğrenerek tanıma doğruluğunu önemli ölçüde artırmakta ve öğrenilmiş gösterimleri baskın yaklaşım olarak yerleştirmektedir.
Klinik önem
Tanıma ve algılama; yüz tanıma, otonom araç ve robotik algılama, tıbbi görüntü teşhisi, içerik denetimi ve görsel arama, perakende ve gözetim analizi ile birçok artırılmış gerçeklik uygulamasını mümkün kılmaktadır.
Tarihçe
Algılama, 2001 civarında el yapımı özelliklerden ve güçlendirilmiş basamaklardan parça tabanlı modellere doğru ilerlemiş; derin evrişimsel ağların ImageNet üzerindeki 2012'deki başarısı ise tanıma ve algılama genelinde öğrenilmiş gösterimlere hızlı bir geçişi tetiklemiştir.
Tartışmalar
- El yapımı özellikler ve öğrenilmiş gösterimler arasındaki tartışma
- Onlarca yıl boyunca tanıma, gradyan histogramları gibi mühendislik ürünü özelliklere dayanmıştır; derin öğrenme bunları verilerden öğrenilen özelliklerle değiştirerek yorumlanabilirlik, veri ve hesaplama gereksinimleri ve sağlamlık hakkında hala aktif olan soruları gündeme getirmiştir.
Öne çıkan isimler
- Paul Viola
- Michael Jones
- Geoffrey Hinton
İlgili konular
Temel eserler
- viola2001
- krizhevsky2012
Sıkça sorulan sorular
- Tanıma ve algılama arasındaki fark nedir?
- Tanıma, bir görüntüde ne olduğunu (örneğin bir kedi içerdiğini) belirtmektedir; algılama ise aynı zamanda nerede olduğunu da söylemekte, her kedinin etrafına bir kutu çizmekte ve etiketlemekte, ve aynı anda birden fazla örneği bulabilmektedir.
- Derin öğrenme tanımayı neden bu kadar çok geliştirmiştir?
- Evrişimsel ağlar, el yapımı özelliklere güvenmek yerine ilgili görsel özellikleri doğrudan büyük etiketli veri kümelerinden öğrenerek, manuel olarak belirtilmesi zor olan kalıpları yakalamakta ve veri ve hesaplama ile ölçeklenebilmektedir.