Saliência Visual e Atenção
A saliência visual e a atenção referem-se aos locais numa imagem onde as pessoas são mais propensas a olhar, e os modelos computacionais preveem isso para guiar o design gráfico, de visão e de interface.
Definition
Saliência visual é a propriedade que faz com que algumas regiões da imagem se destaquem e atraiam o olhar, e a modelagem da saliência é a previsão computacional de onde a atenção e as fixações irão recair.
Scope
Este tópico abrange a saliência bottom-up (de baixo para cima) impulsionada pelo contraste em características como intensidade, cor e orientação, a atenção top-down (de cima para baixo) guiada por tarefas e objetivos, a previsão do olhar e das fixações humanas, e aplicações que direcionam a renderização, compressão e design para regiões atendidas.
Core questions
- O que faz com que uma região de uma imagem atraia a atenção?
- Como as influências bottom-up e top-down na atenção são combinadas?
- Com que precisão o olhar humano pode ser previsto a partir de uma imagem?
- Como a saliência pode guiar sistemas gráficos e de visão?
Key concepts
- Mapas de saliência
- Contraste centro-periferia
- Integração de características
- Atenção bottom-up e top-down
- Previsão de fixação e olhar
- Benchmarks de atenção
Key theories
- Modelo de saliência de integração de características
- A saliência é calculada extraindo mapas de características para intensidade, cor e orientação, detectando o contraste local centro-periferia em cada um, e combinando-os em um mapa mestre cujos picos preveem onde a atenção é atraída.
- Atenção bottom-up versus top-down
- A atenção é direcionada tanto pela saliência impulsionada pelo estímulo quanto por objetivos impulsionados pela tarefa, e os modelos computacionais integram cada vez mais ambos, uma distinção central para avaliar e melhorar a previsão do olhar.
Clinical relevance
Modelos de saliência guiam a renderização e compressão perceptual que alocam esforço para regiões atendidas, informam o design de interfaces de usuário e publicidade, apoiam o corte e retargeting automático de imagens, e contribuem para a robótica e visão assistiva.
History
Baseado em teorias psicológicas da atenção, o modelo de Itti-Koch-Niebur de 1998 forneceu uma explicação computacional influente da saliência bottom-up; benchmarks e pesquisas consolidaram o campo, e redes neurais profundas posteriormente melhoraram substancialmente a previsão do olhar.
Key figures
- Laurent Itti
- Christof Koch
- Ali Borji
Related topics
Seminal works
- itti1998
- borji2013
Frequently asked questions
- O que é um mapa de saliência?
- É um mapa do tamanho da imagem que pontua a probabilidade de cada local atrair o olhar de um observador, com pontos brilhantes marcando as regiões que se prevê que se destaquem mais.
- Por que prever a atenção é útil?
- Saber para onde as pessoas olham permite que os sistemas concentrem a qualidade da renderização, os bits de compressão ou a ênfase do design nas regiões que mais importam para os espectadores, economizando esforço onde a atenção é improvável de recair.