Multilingual Image Classification (Cross-Lingual Vision Model)
طبقهبندیکنندههای استاندارد تصویر فرض میکنند که برچسبهای کلاس در یک زبان وجود دارند و مجموعه دادههای آموزش و آزمون، زمینه زبانی یکسانی را به اشتراک میگذارند. در تنظیمات چندزبانه — کاتالوگهای محصولات چندزبانه، تصویربرداری پزشکی بینالمللی، رسانههای اجتماعی متنوع فرهنگی — برچسبها یا پرسوجوهای کاربر ممکن است به دهها زبان ارائه شوند. طبقهبندی تصویر چندزبانه با جفت کردن یک ستون فقرات بصری قدرتمند با فضای متنی یا جاسازی چندزبانه، این مشکل را حل میکند، بهطوریکه «cat»، «chat»، «kedi» و «gato» همگی بدون بازآموزی ماژول بینایی برای هر زبان، به یک مفهوم بصری یکسان نگاشت میشوند.
مطالعهٔ کامل روش
برای خواندن این بخش با حساب رایگان وارد شوید.
Method map
The neighbourhood of related methods — select a node to explore.
منابع
- Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., ... & Sutskever, I. (2021). Learning transferable visual models from natural language supervision. In Proceedings of the 38th International Conference on Machine Learning (ICML), pp. 8748–8763. PMLR. link ↗
- Image classification. Wikipedia. link ↗
نحوهٔ استناد به این صفحه
ScholarGate. (2026, June 3). Multilingual Image Classification (Cross-Lingual Vision Model). ScholarGate. https://scholargate.app/fa/deep-learning/multilingual-image-classification
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- طبقهبندی تصویریادگیری عمیق↔ compare
- تعبیههای چندزبانه جملهیادگیری عمیق↔ compare
- Multilingual vision transformerیادگیری عمیق↔ compare
- طبقهبندی تصاویر چندوجهییادگیری عمیق↔ compare
- یادگیری انتقالی با طبقهبندی تصویریادگیری عمیق↔ compare
در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →