Machine learningDeep learning / NLP / CV

Segmentación Semántica Multimodal

La segmentación semántica multimodal asigna una etiqueta de clase semántica a cada píxel de una escena fusionando información de dos o más modalidades de sensores — comúnmente imágenes RGB emparejadas con mapas de profundidad (RGB-D), nubes de puntos LiDAR, cámaras térmicas o descripciones de texto. Las redes profundas codificador-decodificador aprenden a alinear y fusionar señales complementarias de cada modalidad, produciendo una segmentación más densa y precisa que cualquier enfoque unimodal.

Abrir en MethodMindPróximamenteVídeoPróximamenteDownload slides

Leer el método completo

Solo para miembros

Inicia sesión con una cuenta gratuita para leer esta sección.

Iniciar sesión

Method map

The neighbourhood of related methods — select a node to explore.

Segmentación Semántica Multimodal

Segmentación de instanci…Segmentación semántica Vision Transformer Detección multimodal de…

Fuentes

Hazirbas, C., Ma, L., Domokos, C., & Cremers, D. (2016). FuseNet: Incorporating Depth into Semantic Segmentation via Fusion-based CNN Architecture. In Proceedings of the Asian Conference on Computer Vision (ACCV). Springer. link ↗
Zhang, J., Liu, H., Yang, K., Hu, X., Liu, R., & Stiefelhagen, R. (2023). CMX: Cross-Modal Fusion for RGB-X Semantic Segmentation with Transformers. IEEE Transactions on Intelligent Transportation Systems, 24(12), 14801–14813. DOI: 10.1109/TITS.2023.3300537 ↗

Cómo citar esta página

ScholarGate. (2026, June 3). Multimodal Semantic Segmentation (Multi-Sensor Pixel-Level Scene Understanding). ScholarGate. https://scholargate.app/es/deep-learning/multimodal-semantic-segmentation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Segmentación de instanciasAprendizaje profundo↔ compare
Segmentación semánticaAprendizaje profundo↔ compare
Vision TransformerAprendizaje profundo↔ compare

Compare side by side →

Citado por

Detección multimodal de objetos

¿Has visto un problema en esta página? Infórmanos o sugiere una corrección →