Machine learning

محوّل الرؤية

يقوم محوّل الرؤية (ViT)، الذي قدمه دوسوفيتسكي وزملاؤه في عام 2021، بتقسيم الصورة إلى رقع ذات حجم ثابت، ويعامل هذه الرقع كسلسلة، ويطبق آلية الانتباه الذاتي للمحوّل على تصنيف الصور. بالنظر إلى بيانات تدريب كافية، فإنه يتفوق على الشبكات العصبية الالتفافية (CNNs).

افتح في MethodMindقريبًافيديوقريبًاDownload slides

اقرأ الطريقة كاملة

للأعضاء فقط

سجّل الدخول بحساب مجاني لقراءة هذا القسم.

تسجيل الدخول

Method map

The neighbourhood of related methods — select a node to explore.

محوّل الرؤية

نموذج الانتشار شبكة الخصومة التوليدية الغابات العشوائية آلة المتجهات الداعمة (ال…المشفّر التلقائي التبايني ضبط نموذج بيرت الدقيق CLIP المحول التكيفي للنطاق محوّل الرؤية المتكيف مع…المحول البصري القابل للت…

+27 more

المصادر

Dosovitskiy, A. et al. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. ICLR. link ↗
Touvron, H. et al. (2021). Training Data-Efficient Image Transformers. ICML. link ↗

كيف تستشهد بهذه الصفحة

ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/ar/deep-learning/vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

نموذج الانتشارالتعلم العميق↔ compare
شبكة الخصومة التوليديةالتعلم العميق↔ compare
الغابات العشوائيةتعلم الآلة↔ compare
آلة المتجهات الداعمة (التصنيف)تعلم الآلة↔ compare
المشفّر التلقائي التباينيالتعلم العميق↔ compare

Compare side by side →

يُستشهد بها في

ضبط نموذج بيرت الدقيق CLIP المحول التكيفي للنطاق محوّل الرؤية المتكيف مع المجال المحول البصري القابل للتفسير (Explainable Vision Transformer)محوّل الرؤية المُحسَّن بدقة ضبط نماذج GPT الدقيق تصنيف الصور شبكات كولموجوروف-أرنولد (KAN)LoRA و PEFT مامبا (نموذج فضاء الحالة)المشفرات التلقائية المقنعة محوّل الرؤية متعدد اللغات التصنيف المعتمد على نموذج BERT متعدد الوسائط معالجة اللغات الطبيعية متعددة الوسائط التجزئة الدلالية متعددة الوسائط المحولات متعددة الوسائط (Multimodal Transformers)المُحوِّل البصري متعدد الوسائط (Multimodal ViT)نموذج تجزئة أي شيء شبكات الخصومة التوليدية ذاتية الإشراف تصنيف الصور ذاتي الإشراف التجزئة الذاتية للإستنساخ التجزئة الدلالية ذاتية الإشراف محول الرؤية ذاتي الإشراف المحوّل البصري شبه المُشرف عليه SimCLR الشبكات الالتفافية الرسومية المكانية-الزمانية محول سوين (Swin Transformer)TimeGPT رؤية مانجاما الكشف عن الكائنات بإشراف ضعيف محوّل الرؤية المُشرف عليه ضعيفًا

هل لاحظت مشكلة في هذه الصفحة؟ أبلغ عنها أو اقترح تصحيحًا →

اقرأ الطريقة كاملة

Method map

المصادر

كيف تستشهد بهذه الصفحة

طرق ذات صلة

Which method?

يُستشهد بها في