Machine learningDeep learning / NLP / CV

ドメイン適応型ビジョン・トランスフォーマー

ドメイン適応型ビジョン・トランスフォーマー（DA-ViT）は、事前学習済みのビジョン・トランスフォーマー（ViT）バックボーン上に、敵対的アラインメント、自己学習、またはアテンションレベルブリッジングなどのドメイン適応技術を適用し、ラベル付きソースドメインからラベルなしまたはラベルが少ないターゲットドメインへ視覚的知識を転移させることで、標準的なViTファインチューニングを制限する分布シフトを低減します。

MethodMindで開く近日公開動画近日公開スライドをダウンロード

手法の全文を読む

会員限定

無料アカウントでログインすると、このセクションを読めます。

ログイン

手法マップ

関連する手法の近傍 — ノードを選択して探索できます。

ドメイン適応型ビジョン・トランスフォーマー

ドメイン適応型BERTベース分類ドメイン適応型畳み込みニューラルネットワークファインチューニングされたVision Tran…セマンティックセグメンテーションビジョントランスフォーマードメイン適応型拡散モデルドメイン適応型GAN

出典

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., ... & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR). link ↗
Yang, L., Balaji, Y., Lim, S. N., & Shrivastava, A. (2023). TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 520-530. link ↗

このページの引用方法

ScholarGate. (2026, June 3). Domain-Adaptive Vision Transformer (DA-ViT). ScholarGate. https://scholargate.app/ja/deep-learning/domain-adaptive-vision-transformer

どの手法を選ぶ？

この手法を最も近い類縁の手法と並べ、両者を見比べてください — ライブラリは本を机の上に並べるだけ。選ぶのはあなたです。

並べて比較する →

この手法を参照する項目

ドメイン適応型畳み込みニューラルネットワークドメイン適応型拡散モデルドメイン適応型GAN

このページに誤りを見つけましたか?報告・修正提案 →