ScholarGate
Asistan

Nesne Tanıma ve Algılama

Nesne tanıma, bir görüntüde neyin bulunduğunu belirlemektedir; nesne algılama ise ek olarak her bir örneği bir sınırlayıcı kutu veya bölge ile konumlandırmaktadır.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

Nesne tanıma, görüntülere veya bölgelere kategori etiketleri atanmasıdır; nesne algılama ise bir görüntüdeki her nesne örneğini konumlandırma ve etiketleme ortak görevidir.

Kapsam

Bu konu, görüntü sınıflandırmasını, kayan pencere ve bölge önerisi tabanlı algılamayı, klasik güçlendirilmiş basamaklı yüz dedektörünü ve günümüzde tanıma alanına hakim olan evrişimsel sinir ağlarını kapsamakta olup, ilerlemeyi sağlayan büyük etiketli veri kümelerinin ve karşılaştırma testlerinin (benchmark) rolünü de içermektedir.

Temel sorular

  • Bir görüntüdeki nesnenin kategorisi nasıl belirlenmektedir?
  • Nesneler hem nasıl konumlandırılmakta hem de nasıl sınıflandırılmaktadır?
  • Görüş açısı ve görünüm genelinde genellenebilen özellikler ve modeller nelerdir?
  • Öğrenilmiş gösterimler neden el yapımı özellikleri geride bırakmıştır?

Anahtar kavramlar

  • Görüntü sınıflandırması
  • Sınırlayıcı kutu ile algılama
  • Bölge önerileri
  • Güçlendirilmiş basamaklar
  • Evrişimsel sinir ağları
  • Karşılaştırma veri kümeleri

Temel kuramlar

Güçlendirilmiş basamaklı algılama
Gerçek zamanlı algılama, basit dikdörtgensel özelliklerin, nesne olmayan bölgeleri hızla reddeden bir basamak halinde düzenlenmiş güçlendirilmiş bir sınıflandırıcı ile birleştirilmesiyle elde edilmiştir; buna Viola-Jones yüz dedektörü örnek olarak gösterilebilir.
Derin evrişimsel tanıma
Büyük etiketli veri kümeleri üzerinde eğitilen evrişimsel sinir ağları, hiyerarşik görsel özellikleri uçtan uca öğrenerek tanıma doğruluğunu önemli ölçüde artırmakta ve öğrenilmiş gösterimleri baskın yaklaşım olarak yerleştirmektedir.

Klinik önem

Tanıma ve algılama; yüz tanıma, otonom araç ve robotik algılama, tıbbi görüntü teşhisi, içerik denetimi ve görsel arama, perakende ve gözetim analizi ile birçok artırılmış gerçeklik uygulamasını mümkün kılmaktadır.

Tarihçe

Algılama, 2001 civarında el yapımı özelliklerden ve güçlendirilmiş basamaklardan parça tabanlı modellere doğru ilerlemiş; derin evrişimsel ağların ImageNet üzerindeki 2012'deki başarısı ise tanıma ve algılama genelinde öğrenilmiş gösterimlere hızlı bir geçişi tetiklemiştir.

Tartışmalar

El yapımı özellikler ve öğrenilmiş gösterimler arasındaki tartışma
Onlarca yıl boyunca tanıma, gradyan histogramları gibi mühendislik ürünü özelliklere dayanmıştır; derin öğrenme bunları verilerden öğrenilen özelliklerle değiştirerek yorumlanabilirlik, veri ve hesaplama gereksinimleri ve sağlamlık hakkında hala aktif olan soruları gündeme getirmiştir.

Öne çıkan isimler

  • Paul Viola
  • Michael Jones
  • Geoffrey Hinton

İlgili konular

Temel eserler

  • viola2001
  • krizhevsky2012

Sıkça sorulan sorular

Tanıma ve algılama arasındaki fark nedir?
Tanıma, bir görüntüde ne olduğunu (örneğin bir kedi içerdiğini) belirtmektedir; algılama ise aynı zamanda nerede olduğunu da söylemekte, her kedinin etrafına bir kutu çizmekte ve etiketlemekte, ve aynı anda birden fazla örneği bulabilmektedir.
Derin öğrenme tanımayı neden bu kadar çok geliştirmiştir?
Evrişimsel ağlar, el yapımı özelliklere güvenmek yerine ilgili görsel özellikleri doğrudan büyük etiketli veri kümelerinden öğrenerek, manuel olarak belirtilmesi zor olan kalıpları yakalamakta ve veri ve hesaplama ile ölçeklenebilmektedir.

Bu kavram için yöntemler

İlgili kavramlar