Machine learningDeep learning / NLP / CV

ترانسفورمر بینایی قابل توضیح

ترانسفورمر بینایی قابل توضیح (Explainable Vision Transformer) عملکرد قوی تشخیص تصویر ترانسفورمرهای بینایی (ViT) را با تکنیک‌های انتساب — مانند انتشار ارتباط، چرخش توجه، یا توجه وزن‌دار گرادیان — ترکیب می‌کند که نواحی تصویر محرک هر پیش‌بینی را برجسته می‌سازند. این رویکرد به پژوهشگران و دست‌اندرکاران اجازه می‌دهد تا تصمیمات مدل را ممیزی کرده و الزامات شفافیت را بدون قربانی کردن دقت برآورده سازند.

باز کردن در MethodMindبه‌زودیویدیوبه‌زودیDownload slides

مطالعهٔ کامل روش

ویژهٔ اعضا

برای خواندن این بخش با حساب رایگان وارد شوید.

ورود

Method map

The neighbourhood of related methods — select a node to explore.

منابع

  1. Chefer, H., Gur, S., & Wolf, L. (2021). Transformer interpretability beyond attention visualization. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 782–791. DOI: 10.1109/CVPR46437.2021.00084
  2. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., … Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR). link

نحوهٔ استناد به این صفحه

ScholarGate. (2026, June 3). Explainable Vision Transformer (XViT / ViT with Post-hoc Attribution). ScholarGate. https://scholargate.app/fa/deep-learning/explainable-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

ارجاع‌شده در

ScholarGateExplainable Vision Transformer (Explainable Vision Transformer (XViT / ViT with Post-hoc Attribution)). بازیابی‌شده در 2026-06-15 از https://scholargate.app/fa/deep-learning/explainable-vision-transformer · مجموعه‌داده: https://doi.org/10.5281/zenodo.20539026