Machine learningDeep Learning, Self-Supervised Learning

Maskerede Autoencoders

Maskerede Autoencoders (MAE) er en selv-superviseret læringsmetode introduceret af He et al. i 2021, som maskerer tilfældige billedfelter (patches) og træner en model til at rekonstruere det manglende indhold. Ved at tilpasse paradigmet for maskeret sprogmodellering fra NLP til vision, lærer MAE rige visuelle repræsentationer ved at løse en udfordrende rekonstruktionsopgave uden behov for labels.

Åbn i MethodMindSnartVideoSnartDownload slides

Læs hele metoden

Kun for medlemmer

Log ind med en gratis konto for at læse dette afsnit.

Log ind

Method map

The neighbourhood of related methods — select a node to explore.

Maskerede Autoencoders

Latente diffusionsmodell…SimCLR Swin Transformer Vision Transformer DETR (Detection Transfor…Direkte Præferenceoptime…GraphRAG Kolmogorov-Arnold Netværk Mamba (State Space Model)Neural Radiance Fields (…

+2 more

Kilder

He, K., Chen, X., Xie, S., Li, Y., Dollár, P., & Girshick, R. (2022). Masked autoencoders are scalable vision learners. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 16000-16009). DOI: 10.1109/CVPR52688.2022.01553 ↗

Sådan citerer du denne side

ScholarGate. (2026, June 3). Masked Autoencoders are Scalable Vision Learners. ScholarGate. https://scholargate.app/da/deep-learning/masked-autoencoders