Masked Autoencoders
Masked Autoencoders (MAE) ist ein selbstüberwachter Lernansatz, der 2021 von He et al. eingeführt wurde. Dabei werden zufällige Bildausschnitte maskiert und ein Modell trainiert, um den fehlenden Inhalt zu rekonstruieren. Durch die Anpassung des Paradigmas des Masked Language Modeling aus der NLP auf die Bildverarbeitung lernt MAE reiche visuelle Repräsentationen, indem es eine anspruchsvolle Rekonstruktionsaufgabe ohne Labels löst.
Die vollständige Methode lesen
Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.
Method map
The neighbourhood of related methods — select a node to explore.
+2 more
Quellen
- He, K., Chen, X., Xie, S., Li, Y., Dollár, P., & Girshick, R. (2022). Masked autoencoders are scalable vision learners. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 16000-16009). DOI: 10.1109/CVPR52688.2022.01553 ↗
So zitieren Sie diese Seite
ScholarGate. (2026, June 3). Masked Autoencoders are Scalable Vision Learners. ScholarGate. https://scholargate.app/de/deep-learning/masked-autoencoders
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Latent Diffusion ModelsDeep Learning↔ compare
- SimCLRDeep Learning↔ compare
- Swin TransformerDeep Learning↔ compare
- Vision TransformerDeep Learning↔ compare
Referenziert von
Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →