ScholarGate
Асистент
Machine learningDeep learning / NLP / CV

Трансформер за зрение със самообучение

Трансформерът за зрение със самообучение (SSL-ViT) прилага цели за предварително обучение със самообучение — като предсказване на маскирани части (MAE) или самодестилация без етикети (DINO) — към архитектурата на Трансформер за зрение, което позволява научаването на мощни визуални представяния от големи немаркирани корпуси от изображения преди всяко специфично за задачата фино настройване.

Отворете в MethodMindСкороВидеоСкороИзтегляне на слайдове

Прочетете целия метод

Само за членове

Влезте с безплатен профил, за да прочетете този раздел.

Вход

Карта на методите

Обкръжението на сродните методи — изберете възел, за да го разгледате.

Източници

  1. Caron, M., Touvron, H., Misra, I., Jegou, H., Mairal, J., Bojanowski, P., & Joulin, A. (2021). Emerging Properties in Self-Supervised Vision Transformers. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 9650–9660. link
  2. He, K., Chen, X., Xie, S., Li, Y., Dollar, P., & Girshick, R. (2022). Masked Autoencoders Are Scalable Vision Learners. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 16000–16009. link

Как да цитирате тази страница

ScholarGate. (2026, June 3). Self-supervised Vision Transformer (SSL-ViT). ScholarGate. https://scholargate.app/bg/deep-learning/self-supervised-vision-transformer

Кой метод?

Поставете този метод до най-близките му сродни методи и ги четете едно до друго — библиотеката полага книгите на масата; изборът е ваш.

Сравняване едно до друго

Цитиран в

ScholarGateSelf-supervised Vision Transformer (Self-supervised Vision Transformer (SSL-ViT)). Извлечено на 2026-06-15 от https://scholargate.app/bg/deep-learning/self-supervised-vision-transformer · Набор от данни: https://doi.org/10.5281/zenodo.20539026