Machine learningDeep learning / NLP / CV

Monitulkintainen semanttinen segmentointi

Monitulkintainen semanttinen segmentointi kohdistaa semanttisen luokan tunnisteen jokaiselle kohtauskuvan pikselille yhdistämällä tietoa kahdesta tai useammasta anturimodaalisuudesta – yleisimmin RGB-kuvien ja syvyyskarttojen (RGB-D), LiDAR-pistepilvien, lämpökameroiden tai tekstikuvausten yhdistelmän. Syvät enkooderi-dekooderi-verkot oppivat kohdistamaan ja yhdistämään kunkin modaalisuuden täydentäviä vihjeitä, tuottaen tiheämpää ja tarkempaa segmentointia kuin mikään yksittäismodaalinen lähestymistapa.

Avaa sovelluksessa MethodMindTulossaVideoTulossaDownload slides

Lue koko menetelmä

Vain jäsenille

Kirjaudu sisään maksuttomalla tilillä lukeaksesi tämän osion.

Kirjaudu sisään

Method map

The neighbourhood of related methods — select a node to explore.

Lähteet

  1. Hazirbas, C., Ma, L., Domokos, C., & Cremers, D. (2016). FuseNet: Incorporating Depth into Semantic Segmentation via Fusion-based CNN Architecture. In Proceedings of the Asian Conference on Computer Vision (ACCV). Springer. link
  2. Zhang, J., Liu, H., Yang, K., Hu, X., Liu, R., & Stiefelhagen, R. (2023). CMX: Cross-Modal Fusion for RGB-X Semantic Segmentation with Transformers. IEEE Transactions on Intelligent Transportation Systems, 24(12), 14801–14813. DOI: 10.1109/TITS.2023.3300537

Näin viittaat tähän sivuun

ScholarGate. (2026, June 3). Multimodal Semantic Segmentation (Multi-Sensor Pixel-Level Scene Understanding). ScholarGate. https://scholargate.app/fi/deep-learning/multimodal-semantic-segmentation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Tähän viittaavat

ScholarGateMultimodal Semantic Segmentation (Multimodal Semantic Segmentation (Multi-Sensor Pixel-Level Scene Understanding)). Haettu 2026-06-15 osoitteesta https://scholargate.app/fi/deep-learning/multimodal-semantic-segmentation · Aineisto: https://doi.org/10.5281/zenodo.20539026