Masked Autoencoders
Masked Autoencoders (MAE) เป็นแนวทางการเรียนรู้แบบกำกับตนเอง (self-supervised learning) ที่ He และคณะ นำเสนอในปี 2021 โดยทำการปิดบัง (mask) ส่วนของภาพแบบสุ่ม (random patches) และฝึกโมเดลให้สร้างเนื้อหาที่ขาดหายไปขึ้นมาใหม่ MAE ปรับใช้กระบวนทัศน์การเรียนรู้ภาษาแบบปิดบัง (masked language modeling) จากสาขา NLP มาสู่การประมวลผลภาพ (vision) โดยเรียนรู้การนำเสนอภาพ (visual representations) ที่สมบูรณ์ผ่านการทำงานที่ท้าทายในการสร้างภาพขึ้นมาใหม่ โดยไม่จำเป็นต้องใช้ป้ายกำกับ (labels)
อ่านวิธีฉบับเต็ม
เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้
Method map
The neighbourhood of related methods — select a node to explore.
+2 more
แหล่งอ้างอิง
- He, K., Chen, X., Xie, S., Li, Y., Dollár, P., & Girshick, R. (2022). Masked autoencoders are scalable vision learners. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 16000-16009). DOI: 10.1109/CVPR52688.2022.01553 ↗
วิธีอ้างอิงหน้านี้
ScholarGate. (2026, June 3). Masked Autoencoders are Scalable Vision Learners. ScholarGate. https://scholargate.app/th/deep-learning/masked-autoencoders
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- [NEEDS TRANSLATION]การเรียนรู้เชิงลึก↔ compare
- SimCLRการเรียนรู้เชิงลึก↔ compare
- Swin Transformer (โปรแกรมแปลง Swin)การเรียนรู้เชิงลึก↔ compare
- วิชันทรานส์ฟอร์มเมอร์การเรียนรู้เชิงลึก↔ compare