Transformer wa Maono unaobadilika na Kikoa
Transformer wa Maono unaobadilika na Kikoa (DA-ViT) hutumia mbinu za uhamishaji wa kikoa — kama vile ulinganifu wa kiushindani, mafunzo binafsi, au daraja la kiwango cha umakini — juu ya uti wa mgongo wa Transformer wa Maono uliopatiwa mafunzo awali ili kuhamisha maarifa ya kuona kutoka kikoa cha chanzo kilicho na lebo hadi kikoa cha lengo kisicho na lebo au chenye lebo kidogo, kupunguza mabadiliko ya usambazaji ambayo hupunguza urekebishaji wa kawaida wa ViT.
Soma mbinu kamili
Ingia kwa akaunti ya bure ili kusoma sehemu hii.
Ramani ya mbinu
Jirani ya mbinu zinazohusiana — chagua nodi ili kuchunguza.
Vyanzo
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., ... & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR). link ↗
- Yang, L., Balaji, Y., Lim, S. N., & Shrivastava, A. (2023). TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 520-530. link ↗
Jinsi ya kunukuu ukurasa huu
ScholarGate. (2026, June 3). Domain-Adaptive Vision Transformer (DA-ViT). ScholarGate. https://scholargate.app/sw/deep-learning/domain-adaptive-vision-transformer
Mbinu ipi?
Weka mbinu hii kando ya jamaa zake wa karibu na uzisome bega kwa bega — maktaba huweka vitabu mezani; uamuzi ni wako.
- Uainishaji wa BERT unaobadilika kulingana na kikoaUjifunzaji wa Kina↔ linganisha
- Mtandao wa Convolutional unaobadilika kwa KikoaUjifunzaji wa Kina↔ linganisha
- Vision Transformer IliyobadilishwaUjifunzaji wa Kina↔ linganisha
- Mgawanyo wa KisemantikiUjifunzaji wa Kina↔ linganisha
- Transformer wa MaonoUjifunzaji wa Kina↔ linganisha
Imerejelewa na
Umeona tatizo kwenye ukurasa huu? Ripoti au pendekeza marekebisho →