Machine learningDeep learning / NLP / CV

Vizuálny transformátor (Vision Transformer, ViT) so semi-dohľadom

Vizuálny transformátor so semi-dohľadom (Semi-supervised Vision Transformer) aplikuje patchovú architektúru s mechanizmom vlastnej pozornosti (self-attention) z modelu ViT na scenáre, kde je označená len časť obrázkov. Využíva rozsiahle neoznačené korpusy prostredníctvom pseudo-označovania (pseudo-labeling), konzistenčnej regularizácie (consistency regularization) alebo predtréningových úloh so samo-dohľadom (self-supervised pretext tasks) pred doladením (fine-tuning) na malej označenkej množine. Tento prístup dosahuje takmer dohľadovú presnosť (near-supervised accuracy), aj keď označených obrázkov je málo.

Otvoriť v MethodMindČoskoroVideoČoskoroDownload slides

Prečítať celú metódu

Len pre členov

Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.

Prihlásiť sa

Method map

The neighbourhood of related methods — select a node to explore.

Vizuálny transformátor (Vision Transformer, ViT) so semi-dohľadom

Jemne doladený Vision Tr…Klasifikácia obrazu Samoučiaci sa Vision Tra…Polosupervizovaná klasif…Polosúvislé konvolučné n…Vision Transformer

Zdroje

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR 2021). link ↗
Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 12104–12113. link ↗

Ako citovať túto stránku

ScholarGate. (2026, June 3). Semi-supervised Vision Transformer (Semi-supervised ViT). ScholarGate. https://scholargate.app/sk/deep-learning/semi-supervised-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Jemne doladený Vision TransformerHlboké učenie↔ compare
Klasifikácia obrazuHlboké učenie↔ compare
Samoučiaci sa Vision TransformerHlboké učenie↔ compare
Polosupervizovaná klasifikácia založená na modeli BERTHlboké učenie↔ compare
Polosúvislé konvolučné neuronové sieteHlboké učenie↔ compare
Vision TransformerHlboké učenie↔ compare

Compare side by side →

Našli ste na tejto stránke chybu? Nahláste ju alebo navrhnite opravu →