Modele dyfuzyjne w przestrzeni utajonej
Modele dyfuzyjne w przestrzeni utajonej (LDM) to podejście generatywne wprowadzone przez Rombacha i wsp. w 2022 r., które realizuje proces dyfuzji w skompresowanej przestrzeni utajonej zamiast w przestrzeni pikseli, umożliwiając efektywną syntezę obrazów o wysokiej rozdzielczości. Kompresując obrazy do niskowymiarowej reprezentacji utajonej za pomocą wariacyjnego autoenkodera, dyfuzja staje się obliczeniowo wykonalna przy zachowaniu jakości wizualnej.
Przeczytaj pełny opis metody
Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.
Method map
The neighbourhood of related methods — select a node to explore.
Źródła
- Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022). High-resolution image synthesis with latent diffusion models. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10684-10695). DOI: 10.1109/CVPR52688.2022.01042 ↗
Jak cytować tę stronę
ScholarGate. (2026, June 3). High-Resolution Image Synthesis with Latent Diffusion Models. ScholarGate. https://scholargate.app/pl/deep-learning/latent-diffusion-models
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- DETR (Detection Transformer)Uczenie głębokie↔ compare
- GraphRAGUczenie głębokie↔ compare
- Zamaskowane autoenkoderyUczenie głębokie↔ compare
- Model Segment AnythingUczenie głębokie↔ compare
Cytowana przez
Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →