Machine learningDeep learning / NLP / CV
다중 양식 확산 모델
다중 양식 확산 모델은 텍스트, 이미지, 오디오 또는 비디오와 같은 여러 양식의 신호를 동시에 조건으로 하여 콘텐츠를 생성하거나 이해하도록 노이즈 제거 확산 확률 모델을 확장합니다. 이는 교차 양식 컨텍스트에 의해 안내되는 노이즈 프로세스를 역으로 학습하여, 양식 간의 고충실도 합성 및 번역을 가능하게 합니다.
방법 전문 읽기
회원 전용
로그인무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.
Method map
The neighbourhood of related methods — select a node to explore.
출처
- Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022). High-Resolution Image Synthesis with Latent Diffusion Models. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 10684–10695. DOI: 10.1109/CVPR52688.2022.01042 ↗
- Ho, J., Jain, A., & Abbeel, P. (2020). Denoising Diffusion Probabilistic Models. Advances in Neural Information Processing Systems (NeurIPS), 33, 6840–6851. link ↗
이 페이지 인용 방법
ScholarGate. (2026, June 3). Multimodal Diffusion Model (Cross-Modal Conditional Denoising Diffusion). ScholarGate. https://scholargate.app/ko/deep-learning/multimodal-diffusion-model
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- 미세조정 확산 모델딥러닝↔ compare
- 멀티모달 BERT 기반 분류딥러닝↔ compare
- 멀티모달 GAN딥러닝↔ compare
- 다중 모달 트랜스포머딥러닝↔ compare
- Multimodal Variational Autoencoder딥러닝↔ compare
- 멀티모달 비전 트랜스포머딥러닝↔ compare