Machine learningDeep learning / NLP / CV
Multimodal Variational Autoencoder
Multimodal Variational Autoencoder (MVAE)는 이미지와 캡션과 같은 두 개 이상의 데이터 양식에 걸쳐 공유 잠재 표현을 학습하는 딥 생성 모델입니다. 이는 양식별 인코더의 전문가 곱 융합(product-of-experts fusion)을 사용하여, 테스트 시점에 양식의 부분집합만 관찰되는 경우에도 생성 및 추론을 가능하게 합니다.
방법 전문 읽기
회원 전용
로그인무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.
Method map
The neighbourhood of related methods — select a node to explore.
출처
- Wu, M., & Goodman, N. (2018). Multimodal Generative Models for Scalable Weakly-Supervised Learning. Advances in Neural Information Processing Systems (NeurIPS), 31. link ↗
- Kingma, D. P., & Welling, M. (2014). Auto-Encoding Variational Bayes. International Conference on Learning Representations (ICLR). link ↗
이 페이지 인용 방법
ScholarGate. (2026, June 3). Multimodal Variational Autoencoder (MVAE). ScholarGate. https://scholargate.app/ko/deep-learning/multimodal-variational-autoencoder
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
Compare side by side →