Machine learningDeep learning / NLP / CV

Slabě dohlížený Vision Transformer

Slabě dohlížený Vision Transformer (WS-ViT) trénuje Vision Transformer na obrazových datech, která postrádají přesné anotace na úrovni pixelů, a místo toho využívá levnější a šumivější dohled, jako jsou tagy tříd na úrovni obrazu, ohraničující rámečky nebo text získaný z webu. Globální mechanismus self-attention transformátoru jej činí obzvláště schopným lokalizovat objekty a učit se diskriminační rysy z těchto neúplných popisků.

Otevřít v MethodMindJiž brzyVideoJiž brzyDownload slides

Přečíst celou metodu

Pouze pro členy

Pro přečtení této sekce se přihlaste s bezplatným účtem.

Přihlásit se

Method map

The neighbourhood of related methods — select a node to explore.

Slabě dohlížený Vision Transformer

Destilace znalostí Samoučící se učení Semisupervisední učení Vision Transformer

Zdroje

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An image is worth 16x16 words: Transformers for image recognition at scale. In International Conference on Learning Representations (ICLR). link ↗
Zhou, Z.-H. (2022). A brief introduction to weakly supervised learning. National Science Review, 5(1), 44–53. DOI: 10.1093/nsr/nwx106 ↗

Jak citovat tuto stránku

ScholarGate. (2026, June 3). Weakly Supervised Vision Transformer (WS-ViT). ScholarGate. https://scholargate.app/cs/deep-learning/weakly-supervised-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Destilace znalostíHluboké učení↔ compare
Samoučící se učeníStrojové učení↔ compare
Semisupervisední učeníStrojové učení↔ compare
Vision TransformerHluboké učení↔ compare

Compare side by side →

Našli jste na této stránce chybu? Nahlaste ji nebo navrhněte opravu →