ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Multimodaler Variational Autoencoder

Der Multimodale Variational Autoencoder (MVAE) ist ein tiefes generatives Modell, das eine gemeinsame latente Repräsentation über zwei oder mehr Datenmodalitäten – wie Bilder und Bildunterschriften – lernt, indem es eine Produkt-von-Experten-Fusion modalitätsspezifischer Encoder verwendet. Dies ermöglicht die Generierung und Inferenz, selbst wenn zum Zeitpunkt der Inferenz nur eine Teilmenge der Modalitäten beobachtet wird.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

Quellen

  1. Wu, M., & Goodman, N. (2018). Multimodal Generative Models for Scalable Weakly-Supervised Learning. Advances in Neural Information Processing Systems (NeurIPS), 31. link
  2. Kingma, D. P., & Welling, M. (2014). Auto-Encoding Variational Bayes. International Conference on Learning Representations (ICLR). link

So zitieren Sie diese Seite

ScholarGate. (2026, June 3). Multimodal Variational Autoencoder (MVAE). ScholarGate. https://scholargate.app/de/deep-learning/multimodal-variational-autoencoder

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Referenziert von

ScholarGateMultimodal Variational Autoencoder (Multimodal Variational Autoencoder (MVAE)). Abgerufen am 2026-06-15 von https://scholargate.app/de/deep-learning/multimodal-variational-autoencoder · Datensatz: https://doi.org/10.5281/zenodo.20539026