Мултимодална ГАН
Мултимодална ГАН е генеративна състезателна мрежа, обусловена от — или съвместно учеща върху — повече от една модалност данни (напр. текстови описания, изображения, аудио или структурирани данни). Чрез сливане на информация от множество източници, генераторът може да синтезира реалистични резултати, които зачитат междумодалните ограничения, позволявайки задачи като синтез от текст към изображение, генериране от изображение към аудио и съвместна модална импутация.
Прочетете целия метод
Влезте с безплатен профил, за да прочетете този раздел.
Method map
The neighbourhood of related methods — select a node to explore.
Източници
- Reed, S., Akata, Z., Yan, X., Logeswaran, L., Schiele, B., & Lee, H. (2016). Generative adversarial text to image synthesis. Proceedings of the 33rd International Conference on Machine Learning (ICML), PMLR 48, 1060–1069. link ↗
- Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. Advances in Neural Information Processing Systems (NeurIPS), 27. link ↗
Как да цитирате тази страница
ScholarGate. (2026, June 3). Multimodal Generative Adversarial Network. ScholarGate. https://scholargate.app/bg/deep-learning/multimodal-gan
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Генеративна състезателна мрежаДълбоко обучение↔ compare
- Мултимодален дифузионен моделДълбоко обучение↔ compare
- Мултимодален ТрансформерДълбоко обучение↔ compare
- Мултимодален вариационен автоенкодерДълбоко обучение↔ compare
Цитиран в
Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →