Machine learningDeep learning / NLP / CV

Daudzmodālu semantiskā segmentācija

Daudzmodālu semantiskā segmentācija piešķir semantiskās klases etiķeti katram ainas pikselim, sapludinot informāciju no divām vai vairākām sensora modalitātēm — visbiežāk RGB attēlus, kas savienoti ar dziļuma kartēm (RGB-D), LiDAR punktu mākoņiem, termokamerām vai teksta aprakstiem. Dziļās kodētāja-dekodētāja tīklošanās apgūst savstarpēji papildinošu signālu no katras modalitātes saskaņošanu un sapludināšanu, radot blīvāku un precīzāku segmentāciju nekā jebkura atsevišķas modalitātes pieeja.

Atvērt MethodMindDrīzumāVideoDrīzumāDownload slides

Lasīt pilno metodes aprakstu

Tikai dalībniekiem

Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.

Pieteikties

Method map

The neighbourhood of related methods — select a node to explore.

Avoti

  1. Hazirbas, C., Ma, L., Domokos, C., & Cremers, D. (2016). FuseNet: Incorporating Depth into Semantic Segmentation via Fusion-based CNN Architecture. In Proceedings of the Asian Conference on Computer Vision (ACCV). Springer. link
  2. Zhang, J., Liu, H., Yang, K., Hu, X., Liu, R., & Stiefelhagen, R. (2023). CMX: Cross-Modal Fusion for RGB-X Semantic Segmentation with Transformers. IEEE Transactions on Intelligent Transportation Systems, 24(12), 14801–14813. DOI: 10.1109/TITS.2023.3300537

Kā citēt šo lapu

ScholarGate. (2026, June 3). Multimodal Semantic Segmentation (Multi-Sensor Pixel-Level Scene Understanding). ScholarGate. https://scholargate.app/lv/deep-learning/multimodal-semantic-segmentation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Uz to atsaucas

ScholarGateMultimodal Semantic Segmentation (Multimodal Semantic Segmentation (Multi-Sensor Pixel-Level Scene Understanding)). Izgūts 2026-06-15 no https://scholargate.app/lv/deep-learning/multimodal-semantic-segmentation · Datu kopa: https://doi.org/10.5281/zenodo.20539026