Machine learningDeep learning / NLP / CV

Nhúng câu đa phương thức

Nhúng câu đa phương thức ánh xạ văn bản và hình ảnh (và đôi khi âm thanh hoặc video) vào một không gian vector liên tục được chia sẻ, sao cho các cặp có liên quan về ngữ nghĩa từ các phương thức khác nhau nằm gần nhau. Được huấn luyện bằng các mục tiêu tương phản trên các tập dữ liệu ghép đôi lớn, các biểu diễn này cung cấp khả năng truy xuất đa phương thức, phân loại zero-shot và suy luận thị giác-ngôn ngữ.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtTải xuống bản trình chiếu

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Bản đồ phương pháp

Lân cận của các phương pháp liên quan — chọn một nút để khám phá.

Nhúng câu đa phương thức

CLIP Multimodal Doc2Vec Mạng nơ-ron đồ thị đa ph…Phân loại ảnh đa phương…Mạng Perceptron Đa lớp Đ…Nhận dạng thực thể có tê…Hỏi đáp đa phương thức Phân loại dựa trên RoBER…Mô hình hóa chủ đề đa ph…Word2Vec Đa phương thức

Nguồn tài liệu

Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., ... & Sutskever, I. (2021). Learning transferable visual models from natural language supervision. In Proceedings of the 38th International Conference on Machine Learning (ICML), pp. 8748–8763. PMLR. link ↗
Frome, A., Corrado, G. S., Shlens, J., Bengio, S., Dean, J., Ranzato, M., & Mikolov, T. (2013). DeViSE: A deep visual-semantic embedding model. In Advances in Neural Information Processing Systems (NeurIPS), Vol. 26. link ↗

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Multimodal Sentence Embeddings (Joint Vision-Language Representation Learning). ScholarGate. https://scholargate.app/vi/deep-learning/multimodal-sentence-embeddings

Phương pháp nào?

Đặt phương pháp này bên cạnh những phương pháp gần gũi nhất với nó và đọc chúng song song — thư viện bày sách lên bàn; lựa chọn là của bạn.

CLIPHọc sâu↔ so sánh

So sánh song song →

Được tham chiếu bởi

Multimodal Doc2Vec Mạng nơ-ron đồ thị đa phương thức Phân loại ảnh đa phương thức Mạng Perceptron Đa lớp Đa phương thức Nhận dạng thực thể có tên đa phương thức Hỏi đáp đa phương thức Phân loại dựa trên RoBERTa Đa phương thức Mô hình hóa chủ đề đa phương thức Word2Vec Đa phương thức

Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →

Đọc toàn bộ phương pháp

Bản đồ phương pháp

Nguồn tài liệu

Cách trích dẫn trang này

Phương pháp liên quan

Phương pháp nào?

Được tham chiếu bởi