Machine learningDeep learning / NLP / CV

Vision Transformer tự giám sát

Vision Transformer tự giám sát (SSL-ViT) áp dụng các mục tiêu tiền huấn luyện tự giám sát — như dự đoán các mảng bị che (MAE) hoặc tự chưng cất không nhãn (DINO) — cho kiến trúc Vision Transformer, cho phép học các biểu diễn hình ảnh mạnh mẽ từ các kho ảnh lớn không nhãn trước khi tinh chỉnh theo tác vụ cụ thể.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Vision Transformer tự giám sát

Vision Transformer tinh…Transformer Thị giác Đa…Mạng nơ-ron tích chập tự…Transformer Thị giác Explainable Vision Trans…Phân đoạn ngữ nghĩa tự g…Phân đoạn thực thể bán g…Vision Transformer bán g…

Nguồn tài liệu

Caron, M., Touvron, H., Misra, I., Jegou, H., Mairal, J., Bojanowski, P., & Joulin, A. (2021). Emerging Properties in Self-Supervised Vision Transformers. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 9650–9660. link ↗
He, K., Chen, X., Xie, S., Li, Y., Dollar, P., & Girshick, R. (2022). Masked Autoencoders Are Scalable Vision Learners. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 16000–16009. link ↗

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Self-supervised Vision Transformer (SSL-ViT). ScholarGate. https://scholargate.app/vi/deep-learning/self-supervised-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Vision Transformer tinh chỉnhHọc sâu↔ compare
Transformer Thị giác Đa phương thứcHọc sâu↔ compare
Mạng nơ-ron tích chập tự giám sátHọc sâu↔ compare
Transformer Thị giácHọc sâu↔ compare

Compare side by side →

Được tham chiếu bởi

Explainable Vision Transformer Mạng nơ-ron tích chập tự giám sát Phân đoạn ngữ nghĩa tự giám sát Phân đoạn thực thể bán giám sát Vision Transformer bán giám sát

Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →

Đọc toàn bộ phương pháp

Method map

Nguồn tài liệu

Cách trích dẫn trang này

Phương pháp liên quan

Which method?

Được tham chiếu bởi