Vision Transformer bán giám sát
Vision Transformer bán giám sát (Semi-supervised Vision Transformer) áp dụng kiến trúc tự chú ý dựa trên các mảng vá (patch-based self-attention) của ViT vào các thiết lập chỉ có một phần nhỏ hình ảnh được gán nhãn, khai thác các kho dữ liệu lớn chưa gán nhãn thông qua gán nhãn giả (pseudo-labeling), điều chuẩn nhất quán (consistency regularization), hoặc các tác vụ tiền đề tự giám sát (self-supervised pretext tasks) trước khi tinh chỉnh trên tập dữ liệu nhỏ đã gán nhãn. Phương pháp này đạt được độ chính xác gần như giám sát ngay cả khi hình ảnh được gán nhãn khan hiếm.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
Nguồn tài liệu
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 12104–12113. link ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 3). Semi-supervised Vision Transformer (Semi-supervised ViT). ScholarGate. https://scholargate.app/vi/deep-learning/semi-supervised-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Vision Transformer tinh chỉnhHọc sâu↔ compare
- Phân loại ảnhHọc sâu↔ compare
- Vision Transformer tự giám sátHọc sâu↔ compare
- Phân loại dựa trên BERT bán giám sátHọc sâu↔ compare
- Mạng nơ-ron tích chập bán giám sátHọc sâu↔ compare
- Transformer Thị giácHọc sâu↔ compare
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →