Machine learningDeep Learning, Self-Supervised Learning

Autoencoders emmascarats

Els autoencoders emmascarats (MAE) són un enfocament d'aprenentatge autosupervisat introduït per He et al. el 2021 que emmascara pegats aleatoris d'una imatge i entrena un model per reconstruir el contingut perdut. Adaptant el paradigma de modelatge de llenguatge emmascarat de PLN a la visió, MAE aprèn representacions visuals riques resolent una tasca de reconstrucció desafiant sense requerir etiquetes.

Obre a MethodMindAviatVídeoAviatDownload slides

Llegeix el mètode complet

Només per a membres

Inicia la sessió amb un compte gratuït per llegir aquesta secció.

Inicia la sessió

Method map

The neighbourhood of related methods — select a node to explore.

Autoencoders emmascarats

Models de difusió latents SimCLR Swin Transformer Vision Transformer DETR (Detection Transfor…Optimització Directa de…GraphRAG Kolmogorov-Arnold Networ…Mamba (Model d'Espai d'E…Neural Radiance Fields (…

+2 more

Fonts

He, K., Chen, X., Xie, S., Li, Y., Dollár, P., & Girshick, R. (2022). Masked autoencoders are scalable vision learners. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 16000-16009). DOI: 10.1109/CVPR52688.2022.01553 ↗

Com citar aquesta pàgina

ScholarGate. (2026, June 3). Masked Autoencoders are Scalable Vision Learners. ScholarGate. https://scholargate.app/ca/deep-learning/masked-autoencoders