Nõrgalt juhendatud visioonitransformaator
Nõrgalt juhendatud visioonitransformaator (WS-ViT) treenib visioonitransformaatorit pildiandmetel, millel puuduvad täpsed pikslitaseme annotatsioonid, kasutades selle asemel odavamat, müralisemat juhendamist, nagu pilditaseme klassisildid, piirkarbid või veebist kraabitud tekst. Transformaatori globaalne enesetähelepanu mehhanism muudab selle eriti võimekaks objektide lokaliseerimisel ja eristavate tunnuste õppimisel nende ebapiisavate siltide põhjal.
Loe meetodi täielikku kirjeldust
Selle osa lugemiseks logi sisse tasuta kontoga.
Method map
The neighbourhood of related methods — select a node to explore.
Allikad
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An image is worth 16x16 words: Transformers for image recognition at scale. In International Conference on Learning Representations (ICLR). link ↗
- Zhou, Z.-H. (2022). A brief introduction to weakly supervised learning. National Science Review, 5(1), 44–53. DOI: 10.1093/nsr/nwx106 ↗
Kuidas sellele lehele viidata
ScholarGate. (2026, June 3). Weakly Supervised Vision Transformer (WS-ViT). ScholarGate. https://scholargate.app/et/deep-learning/weakly-supervised-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Teadmise destilleerimineSüvaõpe↔ compare
- Enesest juhendav õppimineMasinõpe↔ compare
- Poolitatud järelevalvega õppimineMasinõpe↔ compare
- Vision TransformerSüvaõpe↔ compare
Märkasid sellel lehel viga? Teata sellest või paku parandust →