Machine learningDeep learning / NLP / CV

Vision Transformer bán giám sát

Vision Transformer bán giám sát (Semi-supervised Vision Transformer) áp dụng kiến trúc tự chú ý dựa trên các mảng vá (patch-based self-attention) của ViT vào các thiết lập chỉ có một phần nhỏ hình ảnh được gán nhãn, khai thác các kho dữ liệu lớn chưa gán nhãn thông qua gán nhãn giả (pseudo-labeling), điều chuẩn nhất quán (consistency regularization), hoặc các tác vụ tiền đề tự giám sát (self-supervised pretext tasks) trước khi tinh chỉnh trên tập dữ liệu nhỏ đã gán nhãn. Phương pháp này đạt được độ chính xác gần như giám sát ngay cả khi hình ảnh được gán nhãn khan hiếm.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Nguồn tài liệu

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 12104–12113. link

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Semi-supervised Vision Transformer (Semi-supervised ViT). ScholarGate. https://scholargate.app/vi/deep-learning/semi-supervised-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateSemi-supervised Vision Transformer (Semi-supervised Vision Transformer (Semi-supervised ViT)). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/deep-learning/semi-supervised-vision-transformer · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026