ScholarGate
Asistenti
Machine learningDeep learning / NLP / CV

Transformues Vizual me Mbikëqyrje të Dobët

Transformuesi Vizual me Mbikëqyrje të Dobët (WS-ViT) trajnon një Transformues Vizual mbi të dhëna imazhi që nuk kanë shënime të sakta në nivel pikseli, duke përdorur në vend të kësaj mbikëqyrje më të lirë dhe më të zhurmshme, si etiketat e klasave në nivel imazhi, kutitë kufizuese, ose tekstin e marrë nga uebi. Mekanizmi global i vetë-vëmendjes i transformuesit e bën atë veçanërisht të aftë për të lokalizuar objekte dhe për të mësuar veçori diskriminuese nga këto etiketa të paplota.

Hapeni në MethodMindSë shpejtiVideoSë shpejtiDownload slides

Lexoni metodën e plotë

Vetëm për anëtarët

Hyni me një llogari falas për ta lexuar këtë seksion.

Hyni

Method map

The neighbourhood of related methods — select a node to explore.

Burimet

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An image is worth 16x16 words: Transformers for image recognition at scale. In International Conference on Learning Representations (ICLR). link
  2. Zhou, Z.-H. (2022). A brief introduction to weakly supervised learning. National Science Review, 5(1), 44–53. DOI: 10.1093/nsr/nwx106

Si ta citoni këtë faqe

ScholarGate. (2026, June 3). Weakly Supervised Vision Transformer (WS-ViT). ScholarGate. https://scholargate.app/sq/deep-learning/weakly-supervised-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateWeakly supervised vision transformer (Weakly Supervised Vision Transformer (WS-ViT)). Marrë më 2026-06-15 nga https://scholargate.app/sq/deep-learning/weakly-supervised-vision-transformer · Seti i të dhënave: https://doi.org/10.5281/zenodo.20539026