Machine learningDeep learning / NLP / CV

طبقه‌بندی چندوجهی مبتنی بر BERT

طبقه‌بندی چندوجهی مبتنی بر BERT، معماری ترنسفورمر BERT را گسترش می‌دهد تا داده‌ها را از چندین وجه (معمولاً متن همراه با تصاویر) به صورت مشترک کدگذاری و طبقه‌بندی کند. این کار با ادغام نمایش‌های آن‌ها قبل از یک سر طبقه‌بندی نهایی انجام می‌شود. این رویکرد که حدود سال ۲۰۱۹ با مدل‌هایی مانند MMBT و ViLBERT به طور برجسته معرفی شد، به یک روش استاندارد برای وظایفی تبدیل شده است که در آن‌ها نه متن و نه تصویر به تنهایی اطلاعات کافی برای برچسب‌گذاری دقیق را ندارند.

باز کردن در MethodMindبه‌زودیویدیوبه‌زودیDownload slides

مطالعهٔ کامل روش

ویژهٔ اعضا

برای خواندن این بخش با حساب رایگان وارد شوید.

ورود

Method map

The neighbourhood of related methods — select a node to explore.

طبقه‌بندی چندوجهی مبتنی بر BERT

CLIP ترنسفورمر بینایی شبکه عصبی پیچشی چندوجهی مدل انتشار چندوجهی (Mult…داک تو وِک چندوجهی شبکه عصبی گراف چندوجهی گیتد بازگشتی چندوجهی طبقه‌بندی تصاویر چندوجهی مدل موضوعی LDA چندوجهی شناسایی موجودیت نام‌گذار…

+8 more

منابع

Kiela, D., Bhooshan, S., Firooz, H., Perez, E., & Testuggine, D. (2019). Supervised multimodal bitransformers for classifying images and text. arXiv preprint arXiv:1909.02950. link ↗
Lu, J., Batra, D., Parikh, D., & Lee, S. (2019). ViLBERT: Pretraining task-agnostic visiolinguistic representations for vision-and-language tasks. Advances in Neural Information Processing Systems, 32. link ↗

نحوهٔ استناد به این صفحه

ScholarGate. (2026, June 3). Multimodal BERT-based Classification (Transformer Fusion of Text and Non-text Modalities). ScholarGate. https://scholargate.app/fa/deep-learning/multimodal-bert-based-classification

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

CLIPیادگیری عمیق↔ compare
ترنسفورمر بینایییادگیری عمیق↔ compare

Compare side by side →

ارجاع‌شده در

شبکه عصبی پیچشی چندوجهی مدل انتشار چندوجهی (Multimodal Diffusion Model)داک تو وِک چندوجهی شبکه عصبی گراف چندوجهی گیتد بازگشتی چندوجهی طبقه‌بندی تصاویر چندوجهی مدل موضوعی LDA چندوجهی شناسایی موجودیت نام‌گذاری شده چندوجهی پاسخگویی به پرسش‌های چندوجهی شبکه عصبی بازگشتی چندوجهی طبقه‌بندی چندوجهی مبتنی بر RoBERTa خلاصه‌سازی متن چندوجهی مدل‌سازی موضوعی چندوجهی ترانسفورمر چندوجهی ترانسفورمر بینایی چندوجهی Word2Vec چندوجهی

در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →

مطالعهٔ کامل روش

Method map

منابع

نحوهٔ استناد به این صفحه

روش‌های مرتبط

Which method?

ارجاع‌شده در