Machine learningDeep learning / NLP / CV

Segmentación Semántica Multimodal

La segmentación semántica multimodal asigna una etiqueta de clase semántica a cada píxel de una escena fusionando información de dos o más modalidades de sensores — comúnmente imágenes RGB emparejadas con mapas de profundidad (RGB-D), nubes de puntos LiDAR, cámaras térmicas o descripciones de texto. Las redes profundas codificador-decodificador aprenden a alinear y fusionar señales complementarias de cada modalidad, produciendo una segmentación más densa y precisa que cualquier enfoque unimodal.

Abrir en MethodMindPróximamenteVídeoPróximamenteDownload slides

Leer el método completo

Solo para miembros

Inicia sesión con una cuenta gratuita para leer esta sección.

Iniciar sesión

Method map

The neighbourhood of related methods — select a node to explore.

Fuentes

  1. Hazirbas, C., Ma, L., Domokos, C., & Cremers, D. (2016). FuseNet: Incorporating Depth into Semantic Segmentation via Fusion-based CNN Architecture. In Proceedings of the Asian Conference on Computer Vision (ACCV). Springer. link
  2. Zhang, J., Liu, H., Yang, K., Hu, X., Liu, R., & Stiefelhagen, R. (2023). CMX: Cross-Modal Fusion for RGB-X Semantic Segmentation with Transformers. IEEE Transactions on Intelligent Transportation Systems, 24(12), 14801–14813. DOI: 10.1109/TITS.2023.3300537

Cómo citar esta página

ScholarGate. (2026, June 3). Multimodal Semantic Segmentation (Multi-Sensor Pixel-Level Scene Understanding). ScholarGate. https://scholargate.app/es/deep-learning/multimodal-semantic-segmentation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citado por

ScholarGateMultimodal Semantic Segmentation (Multimodal Semantic Segmentation (Multi-Sensor Pixel-Level Scene Understanding)). Recuperado el 2026-06-15 de https://scholargate.app/es/deep-learning/multimodal-semantic-segmentation · Conjunto de datos: https://doi.org/10.5281/zenodo.20539026