Machine learningDeep learning / NLP / CV

멀티모달 GAN

멀티모달 GAN은 하나 이상의 데이터 양식(예: 텍스트 설명, 이미지, 오디오 또는 구조화된 데이터)에 조건화되거나 여러 데이터 양식에 걸쳐 공동으로 학습하는 생성적 적대 신경망입니다. 여러 소스의 정보를 융합함으로써 생성자는 교차 양식 제약 조건을 존중하는 사실적인 출력을 합성할 수 있으며, 이는 텍스트-이미지 합성, 이미지-오디오 생성 및 공동 양식 대체와 같은 작업을 가능하게 합니다.

MethodMind에서 열기곧 제공동영상곧 제공Download slides

방법 전문 읽기

회원 전용

무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.

로그인

Method map

The neighbourhood of related methods — select a node to explore.

출처

  1. Reed, S., Akata, Z., Yan, X., Logeswaran, L., Schiele, B., & Lee, H. (2016). Generative adversarial text to image synthesis. Proceedings of the 33rd International Conference on Machine Learning (ICML), PMLR 48, 1060–1069. link
  2. Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. Advances in Neural Information Processing Systems (NeurIPS), 27. link

이 페이지 인용 방법

ScholarGate. (2026, June 3). Multimodal Generative Adversarial Network. ScholarGate. https://scholargate.app/ko/deep-learning/multimodal-gan

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

이 방법을 참조하는 항목

ScholarGateMultimodal GAN (Multimodal Generative Adversarial Network). 2026-06-15에 다음에서 검색함: https://scholargate.app/ko/deep-learning/multimodal-gan · 데이터셋: https://doi.org/10.5281/zenodo.20539026