Wielomodalny GAN
Wielomodalny GAN to generatywna sieć antagonistyczna warunkowana — lub wspólnie ucząca się na podstawie — więcej niż jednej modalności danych (np. opisów tekstowych, obrazów, dźwięku lub danych ustrukturyzowanych). Łącząc informacje z wielu źródeł, generator może syntetyzować realistyczne wyniki, które respektują ograniczenia między modalnościami, umożliwiając zadania takie jak synteza tekstu na obraz, generowanie obrazu na dźwięk oraz wspólna imputacja modalności.
Przeczytaj pełny opis metody
Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.
Method map
The neighbourhood of related methods — select a node to explore.
Źródła
- Reed, S., Akata, Z., Yan, X., Logeswaran, L., Schiele, B., & Lee, H. (2016). Generative adversarial text to image synthesis. Proceedings of the 33rd International Conference on Machine Learning (ICML), PMLR 48, 1060–1069. link ↗
- Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. Advances in Neural Information Processing Systems (NeurIPS), 27. link ↗
Jak cytować tę stronę
ScholarGate. (2026, June 3). Multimodal Generative Adversarial Network. ScholarGate. https://scholargate.app/pl/deep-learning/multimodal-gan
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Generatywna Sieć AntagonistycznaUczenie głębokie↔ compare
- Model dyfuzyjny multimodalnyUczenie głębokie↔ compare
- Transformator multimodalnyUczenie głębokie↔ compare
- Wielomodalny autoenkoder wariacyjnyUczenie głębokie↔ compare
Cytowana przez
Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →