Vision Transformer
Vision Transformer (ViT), представен от Dosovitskiy и колеги през 2021 г., разделя изображение на пластини с фиксиран размер, третира тези пластини като последователност и прилага механизма за самонаблюдение (self-attention) на Transformer за класификация на изображения. При достатъчно данни за обучение той надминава конволюционните невронни мрежи (CNN).
Прочетете целия метод
Влезте с безплатен профил, за да прочетете този раздел.
Method map
The neighbourhood of related methods — select a node to explore.
+27 more
Източници
Как да цитирате тази страница
ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/bg/deep-learning/vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Дифузионен моделДълбоко обучение↔ compare
- Генеративна състезателна мрежаДълбоко обучение↔ compare
- Случайна гораМашинно обучение↔ compare
- Методът на опорните вектори (класификация)Машинно обучение↔ compare
- Вариационен автоенкодерДълбоко обучение↔ compare
Цитиран в
Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →