Daudzmodālu semantiskā segmentācija
Daudzmodālu semantiskā segmentācija piešķir semantiskās klases etiķeti katram ainas pikselim, sapludinot informāciju no divām vai vairākām sensora modalitātēm — visbiežāk RGB attēlus, kas savienoti ar dziļuma kartēm (RGB-D), LiDAR punktu mākoņiem, termokamerām vai teksta aprakstiem. Dziļās kodētāja-dekodētāja tīklošanās apgūst savstarpēji papildinošu signālu no katras modalitātes saskaņošanu un sapludināšanu, radot blīvāku un precīzāku segmentāciju nekā jebkura atsevišķas modalitātes pieeja.
Lasīt pilno metodes aprakstu
Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.
Method map
The neighbourhood of related methods — select a node to explore.
Avoti
- Hazirbas, C., Ma, L., Domokos, C., & Cremers, D. (2016). FuseNet: Incorporating Depth into Semantic Segmentation via Fusion-based CNN Architecture. In Proceedings of the Asian Conference on Computer Vision (ACCV). Springer. link ↗
- Zhang, J., Liu, H., Yang, K., Hu, X., Liu, R., & Stiefelhagen, R. (2023). CMX: Cross-Modal Fusion for RGB-X Semantic Segmentation with Transformers. IEEE Transactions on Intelligent Transportation Systems, 24(12), 14801–14813. DOI: 10.1109/TITS.2023.3300537 ↗
Kā citēt šo lapu
ScholarGate. (2026, June 3). Multimodal Semantic Segmentation (Multi-Sensor Pixel-Level Scene Understanding). ScholarGate. https://scholargate.app/lv/deep-learning/multimodal-semantic-segmentation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Instance segmentācijaDziļā mācīšanās↔ compare
- Semantiskā segmentācijaDziļā mācīšanās↔ compare
- Vision TransformerDziļā mācīšanās↔ compare
Uz to atsaucas
Pamanījāt kļūdu šajā lapā? Ziņojiet vai ierosiniet labojumu →