Machine learningDeep learning / NLP / CV

Vision Transformer cu Supraveghere Slabă

Vision Transformer cu Supraveghere Slabă (WS-ViT) antrenează un Vision Transformer pe date imagistice care nu dispun de adnotări precise la nivel de pixel, utilizând în schimb supraveghere mai ieftină și mai zgomotoasă, cum ar fi etichete de clasă la nivel de imagine, casete de delimitare sau text extras de pe web. Mecanismul global de auto-atenție al transformerului îl face deosebit de capabil să localizeze obiecte și să învețe caracteristici discriminative din aceste etichete incomplete.

Deschide în MethodMindÎn curândVideoÎn curândDownload slides

Citește metoda completă

Doar pentru membri

Autentifică-te cu un cont gratuit pentru a citi această secțiune.

Autentificare

Method map

The neighbourhood of related methods — select a node to explore.

Surse

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An image is worth 16x16 words: Transformers for image recognition at scale. In International Conference on Learning Representations (ICLR). link
  2. Zhou, Z.-H. (2022). A brief introduction to weakly supervised learning. National Science Review, 5(1), 44–53. DOI: 10.1093/nsr/nwx106

Cum se citează această pagină

ScholarGate. (2026, June 3). Weakly Supervised Vision Transformer (WS-ViT). ScholarGate. https://scholargate.app/ro/deep-learning/weakly-supervised-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateWeakly supervised vision transformer (Weakly Supervised Vision Transformer (WS-ViT)). Preluat la 2026-06-15 de pe https://scholargate.app/ro/deep-learning/weakly-supervised-vision-transformer · Set de date: https://doi.org/10.5281/zenodo.20539026