Machine learningDeep learning / NLP / CV

Embedding Kalimat Multimodal

Embedding kalimat multimodal memetakan teks dan gambar (dan terkadang audio atau video) ke dalam ruang vektor kontinu bersama, sehingga pasangan yang berhubungan secara semantik dari modalitas yang berbeda berada berdekatan. Dilatih dengan tujuan kontrastif pada korpus berpasangan yang besar, representasi ini memberdayakan pengambilan lintas-modal, klasifikasi zero-shot, dan penalaran visi-bahasa.

Buka di MethodMindSegeraVideoSegeraUnduh salindia

Baca metode selengkapnya

Khusus anggota

Masuk dengan akun gratis untuk membaca bagian ini.

Masuk

Peta metode

Lingkup metode terkait — pilih sebuah simpul untuk menjelajah.

Embedding Kalimat Multimodal

CLIP Multimodal Doc2Vec Jaringan Saraf Graf Mult…Klasifikasi Citra Multim…Perseptron Berlapis Bany…Pengenalan Entitas Berna…Tanya Jawab Multimodal Klasifikasi Multimodal B…Pemodelan Topik Multimod…Word2Vec Multimodal

Sumber

Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., ... & Sutskever, I. (2021). Learning transferable visual models from natural language supervision. In Proceedings of the 38th International Conference on Machine Learning (ICML), pp. 8748–8763. PMLR. link ↗
Frome, A., Corrado, G. S., Shlens, J., Bengio, S., Dean, J., Ranzato, M., & Mikolov, T. (2013). DeViSE: A deep visual-semantic embedding model. In Advances in Neural Information Processing Systems (NeurIPS), Vol. 26. link ↗

Cara menyitasi halaman ini

ScholarGate. (2026, June 3). Multimodal Sentence Embeddings (Joint Vision-Language Representation Learning). ScholarGate. https://scholargate.app/id/deep-learning/multimodal-sentence-embeddings

Metode yang mana?

Letakkan metode ini berdampingan dengan kerabat terdekatnya dan baca secara bersisian — pustaka menata bukunya di atas meja; pilihan ada di tangan Anda.

CLIPPembelajaran Mendalam↔ bandingkan

Bandingkan berdampingan →

Dirujuk oleh

Multimodal Doc2Vec Jaringan Saraf Graf Multimodal Klasifikasi Citra Multimodal Perseptron Berlapis Banyak Multimodal Pengenalan Entitas Bernama Multimodal Tanya Jawab Multimodal Klasifikasi Multimodal Berbasis RoBERTa Pemodelan Topik Multimodal Word2Vec Multimodal

Menemukan masalah di halaman ini? Laporkan atau usulkan perbaikan →

Baca metode selengkapnya

Peta metode

Sumber

Cara menyitasi halaman ini

Metode terkait

Metode yang mana?

Dirujuk oleh