Machine learningDeep learning / NLP / CV

Phân loại hình ảnh đa ngôn ngữ

Phân loại hình ảnh đa ngôn ngữ huấn luyện các mô hình thị giác để nhận diện và gán nhãn hình ảnh khi tên lớp, tín hiệu giám sát hoặc tiêu chuẩn đánh giá trải rộng trên nhiều ngôn ngữ. Được hỗ trợ bởi các mô hình thị giác-ngôn ngữ đa ngôn ngữ như CLIP, nó cho phép một mô hình duy nhất phân loại hình ảnh bằng cách sử dụng các gợi ý (prompt) hoặc nhãn bằng bất kỳ ngôn ngữ nào được hỗ trợ, tạo điều kiện thuận lợi cho việc triển khai các hệ thống thị giác máy tính đa văn hóa và đa ngôn ngữ.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Nguồn tài liệu

  1. Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., ... & Sutskever, I. (2021). Learning transferable visual models from natural language supervision. In Proceedings of the 38th International Conference on Machine Learning (ICML), pp. 8748–8763. PMLR. link
  2. Image classification. Wikipedia. link

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Multilingual Image Classification (Cross-Lingual Vision Model). ScholarGate. https://scholargate.app/vi/deep-learning/multilingual-image-classification

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultilingual Image Classification (Multilingual Image Classification (Cross-Lingual Vision Model)). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/deep-learning/multilingual-image-classification · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026