Salencia visual y atención
La saliencia visual y la atención se refieren a las áreas de una imagen donde las personas son más propensas a mirar, y los modelos computacionales predicen esto para guiar el diseño gráfico, la visión y la interfaz.
Definition
La saliencia visual es la propiedad que hace que algunas regiones de una imagen destaquen y atraigan la mirada, y el modelado de la saliencia es la predicción computacional de dónde se dirigirá la atención y las fijaciones.
Scope
Este tema abarca la saliencia de abajo hacia arriba (bottom-up) impulsada por el contraste en características como la intensidad, el color y la orientación, la atención de arriba hacia abajo (top-down) guiada por tareas y objetivos, la predicción de la mirada y las fijaciones humanas, y las aplicaciones que dirigen la renderización, la compresión y el diseño hacia las regiones atendidas.
Core questions
- ¿Qué hace que una región de una imagen atraiga la atención?
- ¿Cómo se combinan las influencias de abajo hacia arriba y de arriba hacia abajo en la atención?
- ¿Con qué precisión se puede predecir la mirada humana a partir de una imagen?
- ¿Cómo puede la saliencia guiar los sistemas gráficos y de visión?
Key concepts
- Mapas de saliencia
- Contraste centro-periferia
- Integración de características
- Atención de abajo hacia arriba y de arriba hacia abajo
- Predicción de fijación y mirada
- Puntos de referencia de atención
Key theories
- Modelo de saliencia por integración de características
- La saliencia se calcula extrayendo mapas de características para intensidad, color y orientación, detectando el contraste local centro-periferia en cada uno, y combinándolos en un mapa maestro cuyos picos predicen dónde se dirige la atención.
- Atención de abajo hacia arriba versus de arriba hacia abajo
- La atención es dirigida tanto por la saliencia impulsada por el estímulo como por los objetivos impulsados por la tarea, y los modelos computacionales integran cada vez más ambos, una distinción central para evaluar y mejorar la predicción de la mirada.
Clinical relevance
Los modelos de saliencia guían la renderización y compresión perceptualmente impulsadas que asignan esfuerzo a las regiones atendidas, informan el diseño de interfaces de usuario y publicidad, apoyan el recorte y redimensionamiento automático de imágenes, y contribuyen a la robótica y la visión asistida.
History
Basado en teorías psicológicas de la atención, el modelo de Itti-Koch-Niebur de 1998 proporcionó una influyente explicación computacional de la saliencia de abajo hacia arriba; los puntos de referencia y las encuestas consolidaron el campo, y las redes profundas mejoraron sustancialmente la predicción de la mirada posteriormente.
Key figures
- Laurent Itti
- Christof Koch
- Ali Borji
Related topics
Seminal works
- itti1998
- borji2013
Frequently asked questions
- ¿Qué es un mapa de saliencia?
- Es un mapa del tamaño de una imagen que puntúa la probabilidad de que cada ubicación atraiga la mirada de un espectador, con puntos brillantes que marcan las regiones que se predice que destacarán más.
- ¿Por qué es útil predecir la atención?
- Saber dónde mira la gente permite a los sistemas concentrar la calidad de renderización, los bits de compresión o el énfasis del diseño en las regiones que más importan a los espectadores, ahorrando esfuerzo donde es poco probable que se dirija la atención.