Cuál es la diferencia entre la segmentación semántica y la segmentación de instancias?

La segmentación semántica etiqueta cada píxel con una clase, como carretera o persona, pero no separa a los individuos, mientras que la segmentación de instancias distingue adicionalmente cada objeto separado, de modo que dos personas obtienen etiquetas diferentes.

Por qué se considera difícil la segmentación?

Lo que se considera una región depende de la tarea y a menudo es ambiguo, y las imágenes naturales tienen textura, sombreado y oclusión que difuminan los límites entre objetos, por lo que rara vez hay una única respuesta correcta.

Segmentación de Imágenes

La segmentación de imágenes divide una imagen en regiones que corresponden a objetos o partes significativas, asignando cada píxel a un segmento.

Encontrar tema con PaperMindPróximamenteFind papers & topics

Tools & resources

Descargar diapositivas

Learn & explore

VídeoPróximamente

Definition

La segmentación de imágenes es la asignación de cada píxel a una de un conjunto de regiones o clases, de modo que los píxeles dentro de una región sean coherentes y las regiones correspondan a estructuras de escena distintas.

Scope

Este tema abarca la umbralización y el crecimiento de regiones, la agrupación de píxeles en el espacio de color y características, métodos basados en grafos como los cortes normalizados, formulaciones de minimización de energía y contornos activos, y la segmentación semántica y de instancias moderna que etiqueta cada píxel con una clase de objeto.

Core questions

¿Cómo se agrupan los píxeles en regiones coherentes?
¿Qué criterio distingue una buena segmentación de una deficiente?
¿Cómo se puede optimizar la estructura global de la región en lugar de decidir píxel por píxel?
¿Cómo se extiende la segmentación para etiquetar píxeles con categorías de objetos?

Key concepts

Umbralización y crecimiento de regiones
Agrupación en el espacio de características
Cortes normalizados
Minimización de energía y cortes de grafos
Contornos activos
Segmentación semántica y de instancias

Key theories

Segmentación basada en grafos: Al tratar los píxeles como nodos de un grafo con aristas ponderadas por similitud, el criterio de corte normalizado divide la imagen para maximizar la coherencia dentro de la región en relación con la disimilitud entre regiones, lo que produce segmentaciones globalmente equilibradas.
Minimización de energía para el etiquetado: La segmentación se puede plantear como la minimización de una energía que recompensa la asignación de píxeles a regiones adecuadas, al tiempo que penaliza los cambios de etiqueta entre vecinos similares, lo que se puede resolver de manera eficiente mediante cortes de grafos y optimización relacionada.

Clinical relevance

La segmentación es fundamental para el análisis de imágenes médicas, como la delineación de órganos y tumores; para la comprensión de escenas en la conducción autónoma; para el mapeo de la cobertura terrestre mediante teledetección; y para la edición de imágenes y la extracción de objetos.

History

La segmentación temprana se basó en la umbralización y la fusión de regiones; los métodos basados en grafos, como los cortes normalizados en el año 2000, y los enfoques de minimización de energía, hicieron avanzar el campo, y las redes neuronales convolucionales profundas lograron posteriormente una segmentación semántica y de instancias densa.

Key figures

Jianbo Shi
Jitendra Malik

Seminal works

shi2000
szeliski2022

Frequently asked questions

Cuál es la diferencia entre la segmentación semántica y la segmentación de instancias?: La segmentación semántica etiqueta cada píxel con una clase, como carretera o persona, pero no separa a los individuos, mientras que la segmentación de instancias distingue adicionalmente cada objeto separado, de modo que dos personas obtienen etiquetas diferentes.
Por qué se considera difícil la segmentación?: Lo que se considera una región depende de la tarea y a menudo es ambiguo, y las imágenes naturales tienen textura, sombreado y oclusión que difuminan los límites entre objetos, por lo que rara vez hay una única respuesta correcta.