Multimodal Variational Autoencoder
Multimodal Variational Autoencoder (MVAE) er en dyb generativ model, der lærer en delt latent repræsentation på tværs af to eller flere datamodaliteter – såsom billeder og billedtekster – ved hjælp af en produkt-af-eksperter-fusion af modalitetsspecifikke kodere, hvilket muliggør generering og inferens, selv når kun en delmængde af modaliteterne observeres ved testtidspunktet.
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Wu, M., & Goodman, N. (2018). Multimodal Generative Models for Scalable Weakly-Supervised Learning. Advances in Neural Information Processing Systems (NeurIPS), 31. link ↗
- Kingma, D. P., & Welling, M. (2014). Auto-Encoding Variational Bayes. International Conference on Learning Representations (ICLR). link ↗
Sådan citerer du denne side
ScholarGate. (2026, June 3). Multimodal Variational Autoencoder (MVAE). ScholarGate. https://scholargate.app/da/deep-learning/multimodal-variational-autoencoder
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Generativ modstridende netværkDyb læring↔ compare
- Mixture of ExpertsDyb læring↔ compare
- Variational AutoencoderDyb læring↔ compare
Refereret af
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →