Maskerte autoenkodere
Maskerte autoenkodere (MAE) er en selv-supervisert læringstilnærming introdusert av He et al. i 2021 som maskerer tilfeldige bildebiter (patches) og trener en modell til å rekonstruere det manglende innholdet. Ved å tilpasse paradigmet for maskert språkmodellering fra NLP til visjon, lærer MAE rike visuelle representasjoner ved å løse en utfordrende rekonstruksjonsoppgave uten å kreve merkelapper.
Les hele metoden
Logg inn med en gratis konto for å lese denne delen.
Method map
The neighbourhood of related methods — select a node to explore.
+2 more
Kilder
- He, K., Chen, X., Xie, S., Li, Y., Dollár, P., & Girshick, R. (2022). Masked autoencoders are scalable vision learners. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 16000-16009). DOI: 10.1109/CVPR52688.2022.01553 ↗
Slik siterer du denne siden
ScholarGate. (2026, June 3). Masked Autoencoders are Scalable Vision Learners. ScholarGate. https://scholargate.app/no/deep-learning/masked-autoencoders
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Latente diffusjonsmodellerDyp læring↔ compare
- SimCLRDyp læring↔ compare
- Swin TransformerDyp læring↔ compare
- Vision TransformerDyp læring↔ compare
Referert av
Funnet en feil på denne siden? Rapporter eller foreslå en rettelse →