Machine learningDeep learning / NLP / CV

Embëdime të frazave multimodalë

Embëdime të frazave multimodalë i hartëzojnë tekstin dhe imazhet (dhe ndonjëherë audion ose videon) në një hapësirë të përbashkët vektoriale të vazhdueshme, në mënyrë që çiftet me lidhje semantike nga modalitete të ndryshme të bien afër. Të trajnuara me objektiva kontrastivë mbi korpusë të mëdhenj të çiftëzuar, këto përfaqësime fuqizojnë kërkimin ndër-modal, klasifikimin zero-shot dhe arsyetimin vizual-gjuhësor.

Hapeni në MethodMindSë shpejtiVideoSë shpejtiShkarko diapozitivat

Lexoni metodën e plotë

Vetëm për anëtarët

Hyni me një llogari falas për ta lexuar këtë seksion.

Hyni

Harta e metodave

Lagjja e metodave të lidhura — zgjidhni një nyje për të eksploruar.

Embëdime të frazave multimodalë

CLIP Multimodal Doc2Vec Rrjeti Neurale Multimoda…Klasifikimi Multimodal i…Perceptroni Shumemodalës…Njohja e Entiteteve të E…Përgjigjja pyetjeve mult…Klasifikimi Multimodal i…Modelimi i temave multim…Multimodal Word2Vec

Burimet

Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., ... & Sutskever, I. (2021). Learning transferable visual models from natural language supervision. In Proceedings of the 38th International Conference on Machine Learning (ICML), pp. 8748–8763. PMLR. link ↗
Frome, A., Corrado, G. S., Shlens, J., Bengio, S., Dean, J., Ranzato, M., & Mikolov, T. (2013). DeViSE: A deep visual-semantic embedding model. In Advances in Neural Information Processing Systems (NeurIPS), Vol. 26. link ↗

Si ta citoni këtë faqe

ScholarGate. (2026, June 3). Multimodal Sentence Embeddings (Joint Vision-Language Representation Learning). ScholarGate. https://scholargate.app/sq/deep-learning/multimodal-sentence-embeddings

Cila metodë?

Vendoseni këtë metodë pranë të afërmeve të saj më të ngushta dhe lexojini krah për krah — biblioteka i shtron librat mbi tryezë; zgjedhja është e juaja.

CLIPMësimi i thellë↔ krahaso

Krahasoni krah për krah →

Cituar nga

Multimodal Doc2Vec Rrjeti Neurale Multimodal i Grafëve Klasifikimi Multimodal i Imazheve Perceptroni Shumemodalësh Shumështresorë Njohja e Entiteteve të Emërtuara Multimodale Përgjigjja pyetjeve multimodalë Klasifikimi Multimodal i Bazuar në RoBERTa Modelimi i temave multimodal Multimodal Word2Vec

Vutë re një problem në këtë faqe? Raportojeni ose sugjeroni një korrigjim →