Machine learningDeep learning / NLP / CV

Segmentarea instanțelor multimodale

Segmentarea instanțelor multimodale extinde segmentarea clasică a instanțelor — care atribuie o mască per-pixel și o etichetă de clasă fiecărui obiect individual dintr-o imagine — prin încorporarea fluxurilor complementare de senzori, cum ar fi hărțile de adâncime, norii de puncte LiDAR sau cadrele în infraroșu. Fuzionarea acestor modalități ajută modelul să gestioneze aparițiile ambigue, lumina slabă și ocluzia care pun în dificultate sistemele bazate doar pe RGB.

Deschide în MethodMindÎn curândVideoÎn curândDownload slides

Citește metoda completă

Doar pentru membri

Autentifică-te cu un cont gratuit pentru a citi această secțiune.

Autentificare

Method map

The neighbourhood of related methods — select a node to explore.

Segmentarea instanțelor multimodale

Segmentare de instanță Detecția multimodală de…Transformer Vizual Multi…Detecția obiectelor Segmentare semantică

Surse

He, K., Gkioxari, G., Dollar, P., & Girshick, R. (2017). Mask R-CNN. Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2961–2969. DOI: 10.1109/ICCV.2017.322 ↗
Instance segmentation. Wikipedia. link ↗

Cum se citează această pagină

ScholarGate. (2026, June 3). Multimodal Instance Segmentation (Multi-sensor Deep Mask Prediction). ScholarGate. https://scholargate.app/ro/deep-learning/multimodal-instance-segmentation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Segmentare de instanțăÎnvățare profundă↔ compare
Detecția multimodală de obiecteÎnvățare profundă↔ compare
Transformer Vizual MultimodalÎnvățare profundă↔ compare
Detecția obiectelorÎnvățare profundă↔ compare
Segmentare semanticăÎnvățare profundă↔ compare

Compare side by side →

Citat de

Segmentare de instanță

Ai observat o problemă pe această pagină? Raportează sau sugerează o corectură →