Machine learningDeep learning / NLP / CV
ドメイン適応型ビジョン・トランスフォーマー
ドメイン適応型ビジョン・トランスフォーマー(DA-ViT)は、事前学習済みのビジョン・トランスフォーマー(ViT)バックボーン上に、敵対的アラインメント、自己学習、またはアテンションレベルブリッジングなどのドメイン適応技術を適用し、ラベル付きソースドメインからラベルなしまたはラベルが少ないターゲットドメインへ視覚的知識を転移させることで、標準的なViTファインチューニングを制限する分布シフトを低減します。
手法の全文を読む
会員限定
ログイン無料アカウントでログインすると、このセクションを読めます。
手法マップ
関連する手法の近傍 — ノードを選択して探索できます。
出典
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., ... & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR). link ↗
- Yang, L., Balaji, Y., Lim, S. N., & Shrivastava, A. (2023). TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 520-530. link ↗
このページの引用方法
ScholarGate. (2026, June 3). Domain-Adaptive Vision Transformer (DA-ViT). ScholarGate. https://scholargate.app/ja/deep-learning/domain-adaptive-vision-transformer
どの手法を選ぶ?
この手法を最も近い類縁の手法と並べ、両者を見比べてください — ライブラリは本を机の上に並べるだけ。選ぶのはあなたです。
- ドメイン適応型BERTベース分類深層学習↔ 比較
- ドメイン適応型畳み込みニューラルネットワーク深層学習↔ 比較
- ファインチューニングされたVision Transformer深層学習↔ 比較
- セマンティックセグメンテーション深層学習↔ 比較
- ビジョントランスフォーマー深層学習↔ 比較