Machine learningDeep Learning, Self-Supervised Learning

Masked Autoencoders

Masked Autoencoders (MAE) is een zelf-gesuperviseerde leeraanpak, geïntroduceerd door He et al. in 2021, die willekeurige beeldpatches maskeert en een model traint om de ontbrekende inhoud te reconstrueren. Door het paradigma van masked language modeling uit NLP aan te passen aan de visuele wereld, leert MAE rijke visuele representaties door een uitdagende reconstructietaak op te lossen zonder dat er labels nodig zijn.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Masked Autoencoders

Latente Diffusiemodellen SimCLR Swin Transformer Transformator voor Visue…DETR (Detection Transfor…Direct Preference Optimi…GraphRAG Kolmogorov-Arnold Networ…Mamba (State Space Model)Neuraale Radiantie Velde…

+2 more

Bronnen

He, K., Chen, X., Xie, S., Li, Y., Dollár, P., & Girshick, R. (2022). Masked autoencoders are scalable vision learners. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 16000-16009). DOI: 10.1109/CVPR52688.2022.01553 ↗

Deze pagina citeren

ScholarGate. (2026, June 3). Masked Autoencoders are Scalable Vision Learners. ScholarGate. https://scholargate.app/nl/deep-learning/masked-autoencoders