Machine learningDeep learning / NLP / CV

تقسیم‌بندی معنایی چندوجهی

تقسیم‌بندی معنایی چندوجهی با ادغام اطلاعات حاصل از دو یا چند حسگر — که معمولاً تصاویر RGB همراه با نقشه‌های عمق (RGB-D)، ابر نقاط لایدار (LiDAR)، دوربین‌های حرارتی، یا توصیفات متنی هستند — یک برچسب کلاس معنایی به هر پیکسل در یک صحنه اختصاص می‌دهد. شبکه‌های رمزگذار-رمزگشای عمیق یاد می‌گیرند که نشانه‌های مکمل از هر وجه را هم‌تراز و ادغام کنند و تقسیم‌بندی متراکم‌تر و دقیق‌تری نسبت به رویکردهای تک‌وجهی تولید می‌کنند.

باز کردن در MethodMindبه‌زودیویدیوبه‌زودیDownload slides

مطالعهٔ کامل روش

ویژهٔ اعضا

برای خواندن این بخش با حساب رایگان وارد شوید.

ورود

Method map

The neighbourhood of related methods — select a node to explore.

منابع

  1. Hazirbas, C., Ma, L., Domokos, C., & Cremers, D. (2016). FuseNet: Incorporating Depth into Semantic Segmentation via Fusion-based CNN Architecture. In Proceedings of the Asian Conference on Computer Vision (ACCV). Springer. link
  2. Zhang, J., Liu, H., Yang, K., Hu, X., Liu, R., & Stiefelhagen, R. (2023). CMX: Cross-Modal Fusion for RGB-X Semantic Segmentation with Transformers. IEEE Transactions on Intelligent Transportation Systems, 24(12), 14801–14813. DOI: 10.1109/TITS.2023.3300537

نحوهٔ استناد به این صفحه

ScholarGate. (2026, June 3). Multimodal Semantic Segmentation (Multi-Sensor Pixel-Level Scene Understanding). ScholarGate. https://scholargate.app/fa/deep-learning/multimodal-semantic-segmentation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

ارجاع‌شده در

ScholarGateMultimodal Semantic Segmentation (Multimodal Semantic Segmentation (Multi-Sensor Pixel-Level Scene Understanding)). بازیابی‌شده در 2026-06-15 از https://scholargate.app/fa/deep-learning/multimodal-semantic-segmentation · مجموعه‌داده: https://doi.org/10.5281/zenodo.20539026