Machine learningDeep Learning, Generative Models

Latente diffusionsmodeller

Latente diffusionsmodeller (LDM'er) er en generativ tilgang introduceret af Rombach et al. i 2022, der udfører diffusionsprocessen i et komprimeret latent rum snarere end pixelrum, hvilket muliggør effektiv billedsyntese i høj opløsning. Ved at komprimere billeder til en lavdimensionel latent repræsentation ved hjælp af en variationel autoencoder bliver diffusion beregningsmæssigt håndterbar, samtidig med at den visuelle kvalitet opretholdes.

Åbn i MethodMindSnartVideoSnartDownload slides

Læs hele metoden

Kun for medlemmer

Log ind med en gratis konto for at læse dette afsnit.

Log ind

Method map

The neighbourhood of related methods — select a node to explore.

Latente diffusionsmodeller

DETR (Detection Transfor…GraphRAG Maskerede Autoencoders Segment Anything Model Direkte Præferenceoptime…Mamba (State Space Model)Neural Radiance Fields (…QLoRA TimeGPT

Kilder

Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022). High-resolution image synthesis with latent diffusion models. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10684-10695). DOI: 10.1109/CVPR52688.2022.01042 ↗

Sådan citerer du denne side

ScholarGate. (2026, June 3). High-Resolution Image Synthesis with Latent Diffusion Models. ScholarGate. https://scholargate.app/da/deep-learning/latent-diffusion-models