Machine learningDeep learning / NLP / CV

Phân đoạn thể hiện đa phương thức

Phân đoạn thể hiện đa phương thức mở rộng phân đoạn thể hiện cổ điển — vốn gán một mặt nạ trên mỗi pixel và một nhãn lớp cho từng đối tượng riêng lẻ trong ảnh — bằng cách kết hợp các luồng cảm biến bổ sung như bản đồ chiều sâu, đám mây điểm LiDAR hoặc khung hồng ngoại. Việc hợp nhất các phương thức này giúp mô hình xử lý các biểu hiện không rõ ràng, ánh sáng yếu và che khuất mà các hệ thống chỉ dùng RGB gặp khó khăn.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Phân đoạn thể hiện đa phương thức

Phân đoạn thực thể (Inst…Phát hiện đối tượng đa p…Transformer Thị giác Đa…Phát hiện đối tượng Phân đoạn ngữ nghĩa

Nguồn tài liệu

He, K., Gkioxari, G., Dollar, P., & Girshick, R. (2017). Mask R-CNN. Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2961–2969. DOI: 10.1109/ICCV.2017.322 ↗
Instance segmentation. Wikipedia. link ↗

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Multimodal Instance Segmentation (Multi-sensor Deep Mask Prediction). ScholarGate. https://scholargate.app/vi/deep-learning/multimodal-instance-segmentation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Phân đoạn thực thể (Instance Segmentation)Học sâu↔ compare
Phát hiện đối tượng đa phương thứcHọc sâu↔ compare
Transformer Thị giác Đa phương thứcHọc sâu↔ compare
Phát hiện đối tượngHọc sâu↔ compare
Phân đoạn ngữ nghĩaHọc sâu↔ compare

Compare side by side →

Được tham chiếu bởi

Phân đoạn thực thể (Instance Segmentation)

Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →