Machine learningDeep learning / NLP / CV

Segmentación multimodal de instancias

La segmentación multimodal de instancias extiende la segmentación clásica de instancias —que asigna una máscara por píxel y una etiqueta de clase a cada objeto individual en una imagen— al incorporar flujos de sensores complementarios como mapas de profundidad, nubes de puntos LiDAR o fotogramas infrarrojos. La fusión de estas modalidades ayuda al modelo a manejar apariencias ambiguas, baja luminosidad y oclusiones que dificultan los sistemas basados únicamente en RGB.

Abrir en MethodMindPróximamenteVídeoPróximamenteDownload slides

Leer el método completo

Solo para miembros

Inicia sesión con una cuenta gratuita para leer esta sección.

Iniciar sesión

Method map

The neighbourhood of related methods — select a node to explore.

Segmentación multimodal de instancias

Segmentación de instanci…Detección multimodal de…Multimodal Vision Transf…Detección de objetos Segmentación semántica

Fuentes

He, K., Gkioxari, G., Dollar, P., & Girshick, R. (2017). Mask R-CNN. Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2961–2969. DOI: 10.1109/ICCV.2017.322 ↗
Instance segmentation. Wikipedia. link ↗

Cómo citar esta página

ScholarGate. (2026, June 3). Multimodal Instance Segmentation (Multi-sensor Deep Mask Prediction). ScholarGate. https://scholargate.app/es/deep-learning/multimodal-instance-segmentation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Segmentación de instanciasAprendizaje profundo↔ compare
Detección multimodal de objetosAprendizaje profundo↔ compare
Multimodal Vision TransformerAprendizaje profundo↔ compare
Detección de objetosAprendizaje profundo↔ compare
Segmentación semánticaAprendizaje profundo↔ compare

Compare side by side →

Citado por

Segmentación de instancias

¿Has visto un problema en esta página? Infórmanos o sugiere una corrección →