Machine learningDeep learning / NLP / CV

Modelo de Difusão Multimodal

Um modelo de difusão multimodal estende os modelos probabilísticos de difusão de remoção de ruído para gerar ou compreender conteúdo condicionando em sinais de múltiplas modalidades — como texto, imagem, áudio ou vídeo — simultaneamente. Ele aprende a reverter um processo de ruído guiado por contexto intermodal, permitindo síntese e tradução de alta fidelidade entre modalidades.

Abrir no MethodMindEm breveVídeoEm breveDownload slides

Leia o método completo

Exclusivo para membros

Entre com uma conta gratuita para ler esta seção.

Entrar

Method map

The neighbourhood of related methods — select a node to explore.

Modelo de Difusão Multimodal

Modelo de Difusão Ajusta…Classificação Multimodal…GAN Multimodal Transformer Multimodal Autoencoder Variacional…Multimodal Vision Transf…Modelo de Difusão com Ad…Modelo de Difusão Explic…Aprendizagem por Transfe…

Fontes

Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022). High-Resolution Image Synthesis with Latent Diffusion Models. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 10684–10695. DOI: 10.1109/CVPR52688.2022.01042 ↗
Ho, J., Jain, A., & Abbeel, P. (2020). Denoising Diffusion Probabilistic Models. Advances in Neural Information Processing Systems (NeurIPS), 33, 6840–6851. link ↗

Como citar esta página

ScholarGate. (2026, June 3). Multimodal Diffusion Model (Cross-Modal Conditional Denoising Diffusion). ScholarGate. https://scholargate.app/pt/deep-learning/multimodal-diffusion-model

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Modelo de Difusão Ajustado FinamenteAprendizado profundo↔ compare
Classificação Multimodal Baseada em BERTAprendizado profundo↔ compare
GAN MultimodalAprendizado profundo↔ compare
Transformer MultimodalAprendizado profundo↔ compare
Autoencoder Variacional MultimodalAprendizado profundo↔ compare
Multimodal Vision TransformerAprendizado profundo↔ compare

Compare side by side →

Referenciado por

Modelo de Difusão com Adaptação de Domínio Modelo de Difusão Explicável GAN Multimodal Aprendizagem por Transferência com Modelo de Difusão

Encontrou um problema nesta página? Relate ou sugira uma correção →