ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Semi-supervised Vision Transformer

Semi-supervised Vision Transformer wendet die Patch-basierte Self-Attention-Architektur von ViT auf Szenarien an, in denen nur ein Bruchteil der Bilder gelabelt ist. Dabei werden große ungelabelte Korpora durch Pseudo-Labeling, Konsistenzregularisierung oder selbstüberwachte Prätextaufgaben genutzt, bevor auf dem kleinen gelabelten Datensatz ein Fine-Tuning erfolgt. Dieser Ansatz erreicht eine nahezu überwachte Genauigkeit, selbst wenn gelabelte Bilder rar sind.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

Quellen

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 12104–12113. link

So zitieren Sie diese Seite

ScholarGate. (2026, June 3). Semi-supervised Vision Transformer (Semi-supervised ViT). ScholarGate. https://scholargate.app/de/deep-learning/semi-supervised-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateSemi-supervised Vision Transformer (Semi-supervised Vision Transformer (Semi-supervised ViT)). Abgerufen am 2026-06-15 von https://scholargate.app/de/deep-learning/semi-supervised-vision-transformer · Datensatz: https://doi.org/10.5281/zenodo.20539026