การแบ่งส่วนภาพตามความหมายแบบเรียนรู้ด้วยตนเอง
การแบ่งส่วนภาพตามความหมายแบบเรียนรู้ด้วยตนเอง (Self-supervised semantic segmentation) เรียนรู้ที่จะกำหนดป้ายกำกับคลาสให้กับทุกพิกเซลในภาพโดยไม่ต้องอาศัยหน้ากากการแบ่งส่วนที่ถูกกำกับด้วยตนเองก่อน โดยทั่วไปจะมีการฝึกโครงข่ายพื้นฐาน (backbone network) บนชุดข้อมูลภาพจำนวนมากที่ไม่มีป้ายกำกับโดยใช้เป้าหมายการเรียนรู้ด้วยตนเอง เช่น การเรียนรู้แบบเปรียบต่าง (contrastive learning) หรือการสร้างแบบจำลองภาพที่ถูกปิดบัง (masked image modeling) จากนั้นจึงใช้คุณลักษณะหนาแน่น (dense features) ที่ได้มาเพื่อแบ่งและติดป้ายกำกับบริเวณต่างๆ ในภาพ ซึ่งให้คุณภาพการแบ่งส่วนที่แข่งขันได้โดยมีค่าใช้จ่ายในการกำกับข้อมูลต่ำกว่ามาก
อ่านวิธีฉบับเต็ม
เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้
Method map
The neighbourhood of related methods — select a node to explore.
แหล่งอ้างอิง
- Caron, M., Touvron, H., Misra, I., Jegou, H., Mairal, J., Bojanowski, P., & Joulin, A. (2021). Emerging Properties in Self-Supervised Vision Transformers. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 9650–9660. DOI: 10.1109/ICCV48922.2021.00951 ↗
- Hamilton, M., Zhang, Z., Hariharan, B., Snavely, N., & Freeman, W. T. (2022). Unsupervised Semantic Segmentation by Distilling Feature Correspondences. International Conference on Learning Representations (ICLR). link ↗
วิธีอ้างอิงหน้านี้
ScholarGate. (2026, June 3). Self-supervised Learning for Semantic Segmentation. ScholarGate. https://scholargate.app/th/deep-learning/self-supervised-semantic-segmentation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- การแบ่งส่วนอินสแตนซ์ (Instance Segmentation)การเรียนรู้เชิงลึก↔ compare
- โครงข่ายประสาทเทียมคอนโวลูชันแบบเรียนรู้ด้วยตนเองการเรียนรู้เชิงลึก↔ compare
- Self-supervised Vision Transformerการเรียนรู้เชิงลึก↔ compare
- Semantic Segmentationการเรียนรู้เชิงลึก↔ compare
- วิชันทรานส์ฟอร์มเมอร์การเรียนรู้เชิงลึก↔ compare