Machine learningDeep learning / NLP / CV

Multimodale Beeldclassificatie

Multimodale beeldclassificatie breidt standaard visuele classificatie uit door, naast beeldkenmerken, aanvullende modaliteiten — zoals tekstbijschriften, audio of gestructureerde metadata — te incorporeren. Afzonderlijke encoders verwerken elke modaliteit, hun representaties worden gefuseerd, en een gezamenlijke classificator wijst het doelkenmerk toe. Modellen zoals CLIP tonen aan dat beeld-tekst-uitlijning zero-shot en few-shot beeldclassificatie op schaal mogelijk maakt.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Multimodale Beeldclassificatie

Fijnafgestemde beeldclas…Beeldclassificatie Multimodale BERT-gebasee…Multimodale Objectdetect…Multimodale zinsinbeddin…Multimodale Transformer Meertalige Beeldclassifi…

Bronnen

Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., ... & Sutskever, I. (2021). Learning transferable visual models from natural language supervision. Proceedings of the 38th International Conference on Machine Learning (ICML), PMLR 139, 8748–8763. link ↗
Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal deep learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link ↗

Deze pagina citeren

ScholarGate. (2026, June 3). Multimodal Image Classification (Vision + Auxiliary Modality Fusion). ScholarGate. https://scholargate.app/nl/deep-learning/multimodal-image-classification

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Fijnafgestemde beeldclassificatieDeep learning↔ compare
BeeldclassificatieDeep learning↔ compare
Multimodale BERT-gebaseerde classificatieDeep learning↔ compare
Multimodale ObjectdetectieDeep learning↔ compare
Multimodale zinsinbeddingenDeep learning↔ compare
Multimodale TransformerDeep learning↔ compare

Compare side by side →

Geciteerd door

Meertalige Beeldclassificatie Multimodale Objectdetectie

Een fout op deze pagina gezien? Meld het of stel een correctie voor →

Lees de volledige methode

Method map

Bronnen

Deze pagina citeren

Verwante methoden

Which method?

Geciteerd door