Machine learningDeep Learning, Self-Supervised Learning

Masked Autoencoders

Masked Autoencoders (MAE) ist ein selbstüberwachter Lernansatz, der 2021 von He et al. eingeführt wurde. Dabei werden zufällige Bildausschnitte maskiert und ein Modell trainiert, um den fehlenden Inhalt zu rekonstruieren. Durch die Anpassung des Paradigmas des Masked Language Modeling aus der NLP auf die Bildverarbeitung lernt MAE reiche visuelle Repräsentationen, indem es eine anspruchsvolle Rekonstruktionsaufgabe ohne Labels löst.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

Masked Autoencoders

Latent Diffusion Models SimCLR Swin Transformer Vision Transformer DETR (Detection Transfor…Direkte Präferenzoptimie…GraphRAG Kolmogorov-Arnold-Netze Mamba (State Space Model)Neural Radiance Fields (…

+2 more

Quellen

He, K., Chen, X., Xie, S., Li, Y., Dollár, P., & Girshick, R. (2022). Masked autoencoders are scalable vision learners. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 16000-16009). DOI: 10.1109/CVPR52688.2022.01553 ↗

So zitieren Sie diese Seite

ScholarGate. (2026, June 3). Masked Autoencoders are Scalable Vision Learners. ScholarGate. https://scholargate.app/de/deep-learning/masked-autoencoders