Machine learningDeep learning / NLP / CV
멀티모달 GAN
멀티모달 GAN은 하나 이상의 데이터 양식(예: 텍스트 설명, 이미지, 오디오 또는 구조화된 데이터)에 조건화되거나 여러 데이터 양식에 걸쳐 공동으로 학습하는 생성적 적대 신경망입니다. 여러 소스의 정보를 융합함으로써 생성자는 교차 양식 제약 조건을 존중하는 사실적인 출력을 합성할 수 있으며, 이는 텍스트-이미지 합성, 이미지-오디오 생성 및 공동 양식 대체와 같은 작업을 가능하게 합니다.
방법 전문 읽기
회원 전용
로그인무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.
Method map
The neighbourhood of related methods — select a node to explore.
출처
- Reed, S., Akata, Z., Yan, X., Logeswaran, L., Schiele, B., & Lee, H. (2016). Generative adversarial text to image synthesis. Proceedings of the 33rd International Conference on Machine Learning (ICML), PMLR 48, 1060–1069. link ↗
- Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. Advances in Neural Information Processing Systems (NeurIPS), 27. link ↗
이 페이지 인용 방법
ScholarGate. (2026, June 3). Multimodal Generative Adversarial Network. ScholarGate. https://scholargate.app/ko/deep-learning/multimodal-gan
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- 생성적 적대 신경망딥러닝↔ compare
- 다중 양식 확산 모델딥러닝↔ compare
- 다중 모달 트랜스포머딥러닝↔ compare
- Multimodal Variational Autoencoder딥러닝↔ compare