Адаптивний до домену трансформер для зорових даних
Адаптивний до домену трансформер для зорових даних (DA-ViT) застосовує методи адаптації домену — такі як змагальне вирівнювання, самонавчання або вирівнювання на рівні уваги — поверх попередньо навченого трансформера для зорових даних (Vision Transformer, ViT) для передачі візуальних знань з розміченого вихідного домену до нерозміченого або слабо розміченого цільового домену, зменшуючи зсув розподілу, який обмежує стандартне доналаштування ViT.
Читати метод повністю
Увійдіть із безкоштовним обліковим записом, щоб прочитати цей розділ.
Карта методів
Околиця споріднених методів — виберіть вузол, щоб дослідити.
Джерела
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., ... & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR). link ↗
- Yang, L., Balaji, Y., Lim, S. N., & Shrivastava, A. (2023). TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 520-530. link ↗
Як цитувати цю сторінку
ScholarGate. (2026, June 3). Domain-Adaptive Vision Transformer (DA-ViT). ScholarGate. https://scholargate.app/uk/deep-learning/domain-adaptive-vision-transformer
Який метод?
Поставте цей метод поруч із його найближчими спорідненими й читайте їх пліч-о-пліч — бібліотека викладає книги на стіл; вибір за вами.
- Класифікація на основі BERT з адаптацією до предметної областіГлибоке навчання↔ порівняти
- Зго́рнута нейро́нна мере́жа з адаптацією до доменуГлибоке навчання↔ порівняти
- Vision Transformer з доналаштуваннямГлибоке навчання↔ порівняти
- Семантична сегментаціяГлибоке навчання↔ порівняти
- Трансформер для комп'ютерного зоруГлибоке навчання↔ порівняти
Згадується в
Помітили помилку на цій сторінці? Повідомте про неї або запропонуйте виправлення →