Vision Transformer tự giám sát
Vision Transformer tự giám sát (SSL-ViT) áp dụng các mục tiêu tiền huấn luyện tự giám sát — như dự đoán các mảng bị che (MAE) hoặc tự chưng cất không nhãn (DINO) — cho kiến trúc Vision Transformer, cho phép học các biểu diễn hình ảnh mạnh mẽ từ các kho ảnh lớn không nhãn trước khi tinh chỉnh theo tác vụ cụ thể.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
Nguồn tài liệu
- Caron, M., Touvron, H., Misra, I., Jegou, H., Mairal, J., Bojanowski, P., & Joulin, A. (2021). Emerging Properties in Self-Supervised Vision Transformers. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 9650–9660. link ↗
- He, K., Chen, X., Xie, S., Li, Y., Dollar, P., & Girshick, R. (2022). Masked Autoencoders Are Scalable Vision Learners. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 16000–16009. link ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 3). Self-supervised Vision Transformer (SSL-ViT). ScholarGate. https://scholargate.app/vi/deep-learning/self-supervised-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Vision Transformer tinh chỉnhHọc sâu↔ compare
- Transformer Thị giác Đa phương thứcHọc sâu↔ compare
- Mạng nơ-ron tích chập tự giám sátHọc sâu↔ compare
- Transformer Thị giácHọc sâu↔ compare
Được tham chiếu bởi
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →