Machine learningDeep learning / NLP / CV

Segmentarea instanțelor multimodale

Segmentarea instanțelor multimodale extinde segmentarea clasică a instanțelor — care atribuie o mască per-pixel și o etichetă de clasă fiecărui obiect individual dintr-o imagine — prin încorporarea fluxurilor complementare de senzori, cum ar fi hărțile de adâncime, norii de puncte LiDAR sau cadrele în infraroșu. Fuzionarea acestor modalități ajută modelul să gestioneze aparițiile ambigue, lumina slabă și ocluzia care pun în dificultate sistemele bazate doar pe RGB.

Deschide în MethodMindÎn curândVideoÎn curândDownload slides

Citește metoda completă

Doar pentru membri

Autentifică-te cu un cont gratuit pentru a citi această secțiune.

Autentificare

Method map

The neighbourhood of related methods — select a node to explore.

Surse

  1. He, K., Gkioxari, G., Dollar, P., & Girshick, R. (2017). Mask R-CNN. Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2961–2969. DOI: 10.1109/ICCV.2017.322
  2. Instance segmentation. Wikipedia. link

Cum se citează această pagină

ScholarGate. (2026, June 3). Multimodal Instance Segmentation (Multi-sensor Deep Mask Prediction). ScholarGate. https://scholargate.app/ro/deep-learning/multimodal-instance-segmentation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citat de

ScholarGateMultimodal Instance Segmentation (Multimodal Instance Segmentation (Multi-sensor Deep Mask Prediction)). Preluat la 2026-06-15 de pe https://scholargate.app/ro/deep-learning/multimodal-instance-segmentation · Set de date: https://doi.org/10.5281/zenodo.20539026