Transformues Vizual me Mbikëqyrje të Dobët
Transformuesi Vizual me Mbikëqyrje të Dobët (WS-ViT) trajnon një Transformues Vizual mbi të dhëna imazhi që nuk kanë shënime të sakta në nivel pikseli, duke përdorur në vend të kësaj mbikëqyrje më të lirë dhe më të zhurmshme, si etiketat e klasave në nivel imazhi, kutitë kufizuese, ose tekstin e marrë nga uebi. Mekanizmi global i vetë-vëmendjes i transformuesit e bën atë veçanërisht të aftë për të lokalizuar objekte dhe për të mësuar veçori diskriminuese nga këto etiketa të paplota.
Lexoni metodën e plotë
Hyni me një llogari falas për ta lexuar këtë seksion.
Method map
The neighbourhood of related methods — select a node to explore.
Burimet
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An image is worth 16x16 words: Transformers for image recognition at scale. In International Conference on Learning Representations (ICLR). link ↗
- Zhou, Z.-H. (2022). A brief introduction to weakly supervised learning. National Science Review, 5(1), 44–53. DOI: 10.1093/nsr/nwx106 ↗
Si ta citoni këtë faqe
ScholarGate. (2026, June 3). Weakly Supervised Vision Transformer (WS-ViT). ScholarGate. https://scholargate.app/sq/deep-learning/weakly-supervised-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Distilimimi i NjohuriveMësimi i thellë↔ compare
- Mësimi i Vetë-MbikëqyrurMësimi i makinës↔ compare
- Mësimi Gjysmë i MbikëqyrurMësimi i makinës↔ compare
- Vision TransformerMësimi i thellë↔ compare
Vutë re një problem në këtë faqe? Raportojeni ose sugjeroni një korrigjim →