ScholarGate
Asistan

Bilgisayar Görüsü

Bilgisayar görüsü, makinelerin görüntü ve videoları yorumlamasını, bu görüntü ve videoları oluşturan sahnelerin geometrisini, hareketini ve içeriğini geri kazanmasını sağlayan bir alandır.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

Bilgisayar görüsü, girdi olarak görüntü veya video alan ve çıktı olarak sahne yapısı, hareket veya anlamsal içerik tanımları üreten yöntemlerin incelenmesidir.

Kapsam

Bu alan, görüntü oluşumunun geometrisini ve kamera kalibrasyonunu, çoklu görünümlerden üç boyutlu yapının ve kamera duruşunun (pose) geri kazanımını, zaman içindeki hareketin ve optik akışın (optical flow) tahminini, nesnelerin ve sahnelerin tanınmasını, tespitini ve konumlandırılmasını kapsamakta olup, bu süreçler giderek artan bir şekilde öğrenilmiş modeller aracılığıyla gerçekleştirilmektedir.

Alt konular

Temel sorular

  • Bir kameranın geometrisi, 3 boyutlu sahneleri 2 boyutlu görüntülerle nasıl ilişkilendirir?
  • Görüntülerden 3 boyutlu yapı ve kamera hareketi nasıl geri kazanılabilir?
  • Bir video dizisinden bir sahnedeki hareket nasıl tahmin edilir?
  • Görüntülerde nesneler ve kategoriler nasıl tanınır ve konumlandırılır?

Anahtar kavramlar

  • Kamera projeksiyonu
  • Çoklu görünüm geometrisi
  • 3 boyutlu yeniden yapılandırma
  • Optik akış
  • Nesne tanıma ve tespiti
  • Öğrenilmiş görsel temsiller

Temel kuramlar

Görüntü oluşumunun izdüşümsel geometrisi
Kameralar, 3 boyutlu noktaları görüntü noktalarına eşleyen izdüşümsel cihazlar olarak modellenmekte olup, çoklu görünümler arasındaki ilişkiler temel (fundamental) ve esas (essential) matrisler gibi yapılarla yakalanmaktadır; bu da yeniden yapılandırmanın geometrik temelini sağlamaktadır.
Sahne yapısının çıkarımı olarak görü
Marr, görüyü, görüntülerden giderek daha açık sahne tanımlamalarını geri kazanan hesaplamalı bir süreç olarak çerçevelemiştir; bu katmanlı kuram, alanın problemi erken özelliklerden nesnelere nasıl ayrıştırdığını şekillendirmiştir.

Klinik önem

Bilgisayar görüsü, otonom araçlar ve robotik, yüz ve biyometrik tanıma, tıbbi görüntü teşhisi, endüstriyel denetim, artırılmış gerçeklik ve görüntü arama gibi alanlara güç vermekte olup, derin öğrenmenin en aktif uygulama alanlarından birini oluşturmaktadır.

Tarihçe

Bilgisayar görüsü, 1960'lı ve 1970'li yıllarda çizgi çizimleri ve gölgelendirmeden şekil çıkarma (shape from shading) ile başlamıştır; Marr'ın hesaplamalı kuramı 1980'lere şekil vermiş, geometrik çoklu görünüm yöntemleri 1990'lı ve 2000'li yıllarda olgunlaşmış ve derin evrişimsel ağlar 2010'lu yıllardan itibaren tanıma alanını dönüştürmüştür.

Tartışmalar

Geometri odaklıya karşı öğrenme odaklı görü
Klasik görü, görüntü oluşumunun açık fiziksel ve geometrik modellerini vurgularken, modern derin öğrenme veri odaklı temsilleri tercih etmektedir; bu alan giderek ikisini birleştirmekte, geometrik yapıyı öğrenilmiş sistemlere gömmektedir.

Öne çıkan isimler

  • David Marr
  • Richard Hartley
  • Andrew Zisserman

İlgili konular

Temel eserler

  • hartley2004
  • marr1982
  • szeliski2022

Sıkça sorulan sorular

Bilgisayar görüsü, görüntü işleme ile aynı mıdır?
Görüntü işleme genellikle görüntüleri başka görüntülere veya düşük seviyeli tanımlamalara dönüştürürken, bilgisayar görüsü görüntüleri yorumlayarak 3 boyutlu yapı, hareket ve nesne kimliği gibi sahne bilgilerini geri kazanmayı amaçlamaktadır; görü, görüntü işleme üzerine inşa edilmektedir.
İnsanlar için kolay olmasına rağmen, görü bilgisayarlar için neden zordur?
Bir görüntü, 3 boyutlu bir dünyanın belirsiz bir izdüşümüdür: birçok sahne aynı görüntüyü üretebilir ve aydınlatma, bakış açısı, örtüşme (occlusion) ve dağınıklık (clutter) muazzam derecede farklılık gösterir; bu nedenle, temel sahneyi geri kazanmak güçlü modeller veya büyük miktarda öğrenilmiş ön bilgi gerektirmektedir.

Bu kavram için yöntemler

İlgili kavramlar