Segmentación de Imágenes
La segmentación de imágenes divide una imagen en regiones que corresponden a objetos o partes significativas, asignando cada píxel a un segmento.
Definition
La segmentación de imágenes es la asignación de cada píxel a una de un conjunto de regiones o clases, de modo que los píxeles dentro de una región sean coherentes y las regiones correspondan a estructuras de escena distintas.
Scope
Este tema abarca la umbralización y el crecimiento de regiones, la agrupación de píxeles en el espacio de color y características, métodos basados en grafos como los cortes normalizados, formulaciones de minimización de energía y contornos activos, y la segmentación semántica y de instancias moderna que etiqueta cada píxel con una clase de objeto.
Core questions
- ¿Cómo se agrupan los píxeles en regiones coherentes?
- ¿Qué criterio distingue una buena segmentación de una deficiente?
- ¿Cómo se puede optimizar la estructura global de la región en lugar de decidir píxel por píxel?
- ¿Cómo se extiende la segmentación para etiquetar píxeles con categorías de objetos?
Key concepts
- Umbralización y crecimiento de regiones
- Agrupación en el espacio de características
- Cortes normalizados
- Minimización de energía y cortes de grafos
- Contornos activos
- Segmentación semántica y de instancias
Key theories
- Segmentación basada en grafos
- Al tratar los píxeles como nodos de un grafo con aristas ponderadas por similitud, el criterio de corte normalizado divide la imagen para maximizar la coherencia dentro de la región en relación con la disimilitud entre regiones, lo que produce segmentaciones globalmente equilibradas.
- Minimización de energía para el etiquetado
- La segmentación se puede plantear como la minimización de una energía que recompensa la asignación de píxeles a regiones adecuadas, al tiempo que penaliza los cambios de etiqueta entre vecinos similares, lo que se puede resolver de manera eficiente mediante cortes de grafos y optimización relacionada.
Clinical relevance
La segmentación es fundamental para el análisis de imágenes médicas, como la delineación de órganos y tumores; para la comprensión de escenas en la conducción autónoma; para el mapeo de la cobertura terrestre mediante teledetección; y para la edición de imágenes y la extracción de objetos.
History
La segmentación temprana se basó en la umbralización y la fusión de regiones; los métodos basados en grafos, como los cortes normalizados en el año 2000, y los enfoques de minimización de energía, hicieron avanzar el campo, y las redes neuronales convolucionales profundas lograron posteriormente una segmentación semántica y de instancias densa.
Key figures
- Jianbo Shi
- Jitendra Malik
Related topics
Seminal works
- shi2000
- szeliski2022
Frequently asked questions
- Cuál es la diferencia entre la segmentación semántica y la segmentación de instancias?
- La segmentación semántica etiqueta cada píxel con una clase, como carretera o persona, pero no separa a los individuos, mientras que la segmentación de instancias distingue adicionalmente cada objeto separado, de modo que dos personas obtienen etiquetas diferentes.
- Por qué se considera difícil la segmentación?
- Lo que se considera una región depende de la tarea y a menudo es ambiguo, y las imágenes naturales tienen textura, sombreado y oclusión que difuminan los límites entre objetos, por lo que rara vez hay una única respuesta correcta.