Machine learningDeep learning / NLP / CV

领域自适应视觉 Transformer

领域自适应视觉 Transformer (DA-ViT) 在预训练的视觉 Transformer 主干之上应用领域自适应技术——例如对抗性对齐、自训练或注意力层桥接——将视觉知识从标记好的源域迁移到未标记或少量标记的目标域，从而减小限制标准 ViT 微调的分布偏移。

在 MethodMind 中打开即将推出视频即将推出下载幻灯片

阅读完整方法

仅限会员

使用免费账户登录即可阅读本节。

方法图谱

相关方法的邻域——选择一个节点以展开探索。

领域自适应视觉 Transformer

基于领域自适应BERT的分类域自适应卷积神经网络微调视觉Transformer 语义分割 Vision Transformer 域自适应扩散模型域自适应GAN

来源

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., ... & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR). link ↗
Yang, L., Balaji, Y., Lim, S. N., & Shrivastava, A. (2023). TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 520-530. link ↗

如何引用本页

ScholarGate. (2026, June 3). Domain-Adaptive Vision Transformer (DA-ViT). ScholarGate. https://scholargate.app/zh/deep-learning/domain-adaptive-vision-transformer

选用哪种方法？

将本方法与其最相近的同类并置，并排研读——本馆将书籍铺陈于案上，取舍则由您定夺。

并排比较 →

被引用于

域自适应卷积神经网络域自适应扩散模型域自适应GAN

发现本页有问题？报告或提出修改建议 →