Machine learningDeep learning / NLP / CV

Multimodal Variational Autoencoder (MVAE)

Hãy tưởng tượng cố gắng hiểu một cảnh chỉ bằng một bức ảnh, chỉ bằng một chú thích, hoặc cả hai cùng nhau. Một VAE tiêu chuẩn xử lý từng loại đầu vào một lần, nhưng MVAE học một mã chung duy nhất nắm bắt cấu trúc kết hợp của tất cả các phương thức. Mỗi phương thức bỏ phiếu cho một vùng không gian tiềm ẩn thông qua bộ mã hóa riêng, và các phiếu bầu này được kết hợp thông qua quy tắc kết hợp theo kiểu tích các chuyên gia (product-of-experts) để mã chung phản ánh tất cả bằng chứng có sẵn. Tại thời điểm kiểm tra, bạn có thể cung cấp bất kỳ tập con nào của các phương thức và vẫn giải mã phần còn lại, cho phép sinh xuyên phương thức và xử lý dữ liệu thiếu mạnh mẽ.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Nguồn tài liệu

  1. Wu, M., & Goodman, N. (2018). Multimodal Generative Models for Scalable Weakly-Supervised Learning. Advances in Neural Information Processing Systems (NeurIPS), 31. link
  2. Kingma, D. P., & Welling, M. (2014). Auto-Encoding Variational Bayes. International Conference on Learning Representations (ICLR). link

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Multimodal Variational Autoencoder (MVAE). ScholarGate. https://scholargate.app/vi/deep-learning/multimodal-variational-autoencoder

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Được tham chiếu bởi

ScholarGateMultimodal Variational Autoencoder (Multimodal Variational Autoencoder (MVAE)). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/deep-learning/multimodal-variational-autoencoder · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026