Semi-supervised Vision Transformer
Semi-supervised Vision Transformer wendet die Patch-basierte Self-Attention-Architektur von ViT auf Szenarien an, in denen nur ein Bruchteil der Bilder gelabelt ist. Dabei werden große ungelabelte Korpora durch Pseudo-Labeling, Konsistenzregularisierung oder selbstüberwachte Prätextaufgaben genutzt, bevor auf dem kleinen gelabelten Datensatz ein Fine-Tuning erfolgt. Dieser Ansatz erreicht eine nahezu überwachte Genauigkeit, selbst wenn gelabelte Bilder rar sind.
Die vollständige Methode lesen
Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.
Method map
The neighbourhood of related methods — select a node to explore.
Quellen
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 12104–12113. link ↗
So zitieren Sie diese Seite
ScholarGate. (2026, June 3). Semi-supervised Vision Transformer (Semi-supervised ViT). ScholarGate. https://scholargate.app/de/deep-learning/semi-supervised-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Feinabgestimmter Vision TransformerDeep Learning↔ compare
- BildklassifizierungDeep Learning↔ compare
- Selbstüberwachtes Vision TransformerDeep Learning↔ compare
- Semi-überwachte BERT-basierte KlassifikationDeep Learning↔ compare
- Semi-überwachtes Faltungsneuronales NetzDeep Learning↔ compare
- Vision TransformerDeep Learning↔ compare
Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →