Latente diffusionsmodeller
Latente diffusionsmodeller (LDM'er) er en generativ tilgang introduceret af Rombach et al. i 2022, der udfører diffusionsprocessen i et komprimeret latent rum snarere end pixelrum, hvilket muliggør effektiv billedsyntese i høj opløsning. Ved at komprimere billeder til en lavdimensionel latent repræsentation ved hjælp af en variationel autoencoder bliver diffusion beregningsmæssigt håndterbar, samtidig med at den visuelle kvalitet opretholdes.
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022). High-resolution image synthesis with latent diffusion models. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10684-10695). DOI: 10.1109/CVPR52688.2022.01042 ↗
Sådan citerer du denne side
ScholarGate. (2026, June 3). High-Resolution Image Synthesis with Latent Diffusion Models. ScholarGate. https://scholargate.app/da/deep-learning/latent-diffusion-models
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- DETR (Detection Transformer)Dyb læring↔ compare
- GraphRAGDyb læring↔ compare
- Maskerede AutoencodersDyb læring↔ compare
- Segment Anything ModelDyb læring↔ compare
Refereret af
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →