Maskerede Autoencoders
Maskerede Autoencoders (MAE) er en selv-superviseret læringsmetode introduceret af He et al. i 2021, som maskerer tilfældige billedfelter (patches) og træner en model til at rekonstruere det manglende indhold. Ved at tilpasse paradigmet for maskeret sprogmodellering fra NLP til vision, lærer MAE rige visuelle repræsentationer ved at løse en udfordrende rekonstruktionsopgave uden behov for labels.
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Method map
The neighbourhood of related methods — select a node to explore.
+2 more
Kilder
- He, K., Chen, X., Xie, S., Li, Y., Dollár, P., & Girshick, R. (2022). Masked autoencoders are scalable vision learners. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 16000-16009). DOI: 10.1109/CVPR52688.2022.01553 ↗
Sådan citerer du denne side
ScholarGate. (2026, June 3). Masked Autoencoders are Scalable Vision Learners. ScholarGate. https://scholargate.app/da/deep-learning/masked-autoencoders
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Latente diffusionsmodellerDyb læring↔ compare
- SimCLRDyb læring↔ compare
- Swin TransformerDyb læring↔ compare
- Vision TransformerDyb læring↔ compare
Refereret af
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →