Machine learningDeep Learning, Self-Supervised Learning

Maskerte autoenkodere

Maskerte autoenkodere (MAE) er en selv-supervisert læringstilnærming introdusert av He et al. i 2021 som maskerer tilfeldige bildebiter (patches) og trener en modell til å rekonstruere det manglende innholdet. Ved å tilpasse paradigmet for maskert språkmodellering fra NLP til visjon, lærer MAE rike visuelle representasjoner ved å løse en utfordrende rekonstruksjonsoppgave uten å kreve merkelapper.

Åpne i MethodMindSnartVideoSnartDownload slides

Les hele metoden

Kun for medlemmer

Logg inn med en gratis konto for å lese denne delen.

Logg inn

Method map

The neighbourhood of related methods — select a node to explore.

Maskerte autoenkodere

Latente diffusjonsmodell…SimCLR Swin Transformer Vision Transformer DETR (Detection Transfor…Direkte preferanseoptima…GraphRAG Kolmogorov-Arnold-nettve…Mamba (tilstandsromsmode…Neural Radiance Fields (…

+2 more

Kilder

He, K., Chen, X., Xie, S., Li, Y., Dollár, P., & Girshick, R. (2022). Masked autoencoders are scalable vision learners. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 16000-16009). DOI: 10.1109/CVPR52688.2022.01553 ↗

Slik siterer du denne siden

ScholarGate. (2026, June 3). Masked Autoencoders are Scalable Vision Learners. ScholarGate. https://scholargate.app/no/deep-learning/masked-autoencoders