Multimodaler Variational Autoencoder
Der Multimodale Variational Autoencoder (MVAE) ist ein tiefes generatives Modell, das eine gemeinsame latente Repräsentation über zwei oder mehr Datenmodalitäten – wie Bilder und Bildunterschriften – lernt, indem es eine Produkt-von-Experten-Fusion modalitätsspezifischer Encoder verwendet. Dies ermöglicht die Generierung und Inferenz, selbst wenn zum Zeitpunkt der Inferenz nur eine Teilmenge der Modalitäten beobachtet wird.
Die vollständige Methode lesen
Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.
Method map
The neighbourhood of related methods — select a node to explore.
Quellen
- Wu, M., & Goodman, N. (2018). Multimodal Generative Models for Scalable Weakly-Supervised Learning. Advances in Neural Information Processing Systems (NeurIPS), 31. link ↗
- Kingma, D. P., & Welling, M. (2014). Auto-Encoding Variational Bayes. International Conference on Learning Representations (ICLR). link ↗
So zitieren Sie diese Seite
ScholarGate. (2026, June 3). Multimodal Variational Autoencoder (MVAE). ScholarGate. https://scholargate.app/de/deep-learning/multimodal-variational-autoencoder
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Generative Adversarial NetworkDeep Learning↔ compare
- Mixture of ExpertsDeep Learning↔ compare
- Variationaler AutoencoderDeep Learning↔ compare
Referenziert von
Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →