Masked Autoencoders
Masked Autoencoders (MAE) is een zelf-gesuperviseerde leeraanpak, geïntroduceerd door He et al. in 2021, die willekeurige beeldpatches maskeert en een model traint om de ontbrekende inhoud te reconstrueren. Door het paradigma van masked language modeling uit NLP aan te passen aan de visuele wereld, leert MAE rijke visuele representaties door een uitdagende reconstructietaak op te lossen zonder dat er labels nodig zijn.
Lees de volledige methode
Log in met een gratis account om dit onderdeel te lezen.
Method map
The neighbourhood of related methods — select a node to explore.
+2 more
Bronnen
- He, K., Chen, X., Xie, S., Li, Y., Dollár, P., & Girshick, R. (2022). Masked autoencoders are scalable vision learners. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 16000-16009). DOI: 10.1109/CVPR52688.2022.01553 ↗
Deze pagina citeren
ScholarGate. (2026, June 3). Masked Autoencoders are Scalable Vision Learners. ScholarGate. https://scholargate.app/nl/deep-learning/masked-autoencoders
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Latente DiffusiemodellenDeep learning↔ compare
- SimCLRDeep learning↔ compare
- Swin TransformerDeep learning↔ compare
- Transformator voor Visuele WaarnemingDeep learning↔ compare
Geciteerd door
Een fout op deze pagina gezien? Meld het of stel een correctie voor →