Machine learningDeep learning / NLP / CV

Phân loại ảnh đa phương thức

Phân loại ảnh đa phương thức mở rộng phân loại ảnh tiêu chuẩn bằng cách kết hợp các phương thức bổ sung — chẳng hạn như chú thích văn bản, âm thanh hoặc siêu dữ liệu có cấu trúc — cùng với các đặc trưng ảnh. Các bộ mã hóa riêng biệt xử lý từng phương thức, biểu diễn của chúng được hợp nhất, và một bộ phân loại chung gán nhãn đích. Các mô hình như CLIP chứng minh rằng sự liên kết ảnh-văn bản cho phép phân loại ảnh zero-shot và few-shot trên quy mô lớn.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Phân loại ảnh đa phương thức

Phân loại ảnh tinh chỉnh Phân loại ảnh Phân loại dựa trên BERT…Phát hiện đối tượng đa p…Nhúng câu đa phương thức Transformer Đa phương th…Phân loại hình ảnh đa ng…

Nguồn tài liệu

Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., ... & Sutskever, I. (2021). Learning transferable visual models from natural language supervision. Proceedings of the 38th International Conference on Machine Learning (ICML), PMLR 139, 8748–8763. link ↗
Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal deep learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link ↗

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Multimodal Image Classification (Vision + Auxiliary Modality Fusion). ScholarGate. https://scholargate.app/vi/deep-learning/multimodal-image-classification

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Phân loại ảnh tinh chỉnhHọc sâu↔ compare
Phân loại ảnhHọc sâu↔ compare
Phân loại dựa trên BERT đa phương thứcHọc sâu↔ compare
Phát hiện đối tượng đa phương thứcHọc sâu↔ compare
Nhúng câu đa phương thứcHọc sâu↔ compare
Transformer Đa phương thứcHọc sâu↔ compare

Compare side by side →

Được tham chiếu bởi

Phân loại hình ảnh đa ngôn ngữ Phát hiện đối tượng đa phương thức

Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →

Đọc toàn bộ phương pháp

Method map

Nguồn tài liệu

Cách trích dẫn trang này

Phương pháp liên quan

Which method?

Được tham chiếu bởi