Vision Transformer auto-supervizat
Vision Transformer auto-supervizat (SSL-ViT) aplică obiective de pre-antrenare auto-supervizată — precum predicția patch-urilor mascate (MAE) sau auto-distilarea fără etichete (DINO) — arhitecturii Vision Transformer, permițând învățarea unor reprezentări vizuale puternice din corpusuri mari de imagini neetichetate, înainte de orice reglaj fin specific sarcinii.
Citește metoda completă
Autentifică-te cu un cont gratuit pentru a citi această secțiune.
Method map
The neighbourhood of related methods — select a node to explore.
Surse
- Caron, M., Touvron, H., Misra, I., Jegou, H., Mairal, J., Bojanowski, P., & Joulin, A. (2021). Emerging Properties in Self-Supervised Vision Transformers. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 9650–9660. link ↗
- He, K., Chen, X., Xie, S., Li, Y., Dollar, P., & Girshick, R. (2022). Masked Autoencoders Are Scalable Vision Learners. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 16000–16009. link ↗
Cum se citează această pagină
ScholarGate. (2026, June 3). Self-supervised Vision Transformer (SSL-ViT). ScholarGate. https://scholargate.app/ro/deep-learning/self-supervised-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Vision Transformer (ViT) fin-tunatÎnvățare profundă↔ compare
- Transformer Vizual MultimodalÎnvățare profundă↔ compare
- Rețea neuronală convoluțională auto-supervizatăÎnvățare profundă↔ compare
- Vision TransformerÎnvățare profundă↔ compare
Citat de
Ai observat o problemă pe această pagină? Raportează sau sugerează o corectură →