ScholarGate
Asistente
Machine learningDeep learning / NLP / CV

Segmentación multimodal de instancias

La segmentación multimodal de instancias extiende la segmentación clásica de instancias —que asigna una máscara por píxel y una etiqueta de clase a cada objeto individual en una imagen— al incorporar flujos de sensores complementarios como mapas de profundidad, nubes de puntos LiDAR o fotogramas infrarrojos. La fusión de estas modalidades ayuda al modelo a manejar apariencias ambiguas, baja luminosidad y oclusiones que dificultan los sistemas basados únicamente en RGB.

Abrir en MethodMindPróximamenteVídeoPróximamenteDownload slides

Leer el método completo

Solo para miembros

Inicia sesión con una cuenta gratuita para leer esta sección.

Iniciar sesión

Method map

The neighbourhood of related methods — select a node to explore.

Fuentes

  1. He, K., Gkioxari, G., Dollar, P., & Girshick, R. (2017). Mask R-CNN. Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2961–2969. DOI: 10.1109/ICCV.2017.322
  2. Instance segmentation. Wikipedia. link

Cómo citar esta página

ScholarGate. (2026, June 3). Multimodal Instance Segmentation (Multi-sensor Deep Mask Prediction). ScholarGate. https://scholargate.app/es/deep-learning/multimodal-instance-segmentation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citado por

ScholarGateMultimodal Instance Segmentation (Multimodal Instance Segmentation (Multi-sensor Deep Mask Prediction)). Recuperado el 2026-06-15 de https://scholargate.app/es/deep-learning/multimodal-instance-segmentation · Conjunto de datos: https://doi.org/10.5281/zenodo.20539026