Machine learning

ভিশন ট্রান্সফরমার

ভিশন ট্রান্সফরমার (ViT), ২০২১ সালে Dosovitskiy এবং সহকর্মীদের দ্বারা প্রবর্তিত, একটি ছবিকে নির্দিষ্ট আকারের প্যাচে বিভক্ত করে, সেই প্যাচগুলিকে একটি ক্রম হিসাবে বিবেচনা করে এবং চিত্র শ্রেণিবিভাগের জন্য ট্রান্সফরমার সেলফ-অ্যাটেনশন মেকানিজম প্রয়োগ করে। পর্যাপ্ত প্রশিক্ষণ ডেটা থাকলে, এটি কনভোলিউশনাল নিউরাল নেটওয়ার্ক (CNN) কে ছাড়িয়ে যায়।

MethodMind-এ খুলুনশীঘ্রইভিডিওশীঘ্রইDownload slides

পুরো পদ্ধতিটি পড়ুন

শুধু সদস্যদের জন্য

এই অংশটি পড়তে বিনামূল্যের অ্যাকাউন্ট দিয়ে সাইন ইন করুন।

সাইন ইন করুন

Method map

The neighbourhood of related methods — select a node to explore.

+27 more

উৎস

  1. Dosovitskiy, A. et al. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. ICLR. link
  2. Touvron, H. et al. (2021). Training Data-Efficient Image Transformers. ICML. link

এই পৃষ্ঠা কীভাবে উদ্ধৃত করবেন

ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/bn/deep-learning/vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

যেখানে উদ্ধৃত

BERT ফাইন-টিউনিংCLIPডোমেইন-অ্যাডাপ্টিভ ট্রান্সফরমারডোমেইন-অ্যাডাপ্টিভ ভিশন ট্রান্সফরমারExplainable Vision Transformerফাইন-টিউনড ভিশন ট্রান্সফরমারGPT ফাইন-টিউনিংচিত্র শ্রেণীকরণKolmogorov-Arnold NetworksLoRA এবং PEFTমাম্বা (স্টেট স্পেস মডেল)মাস্কড অটোএনকোডারবহুভাষিক ভিশন ট্রান্সফরমারমাল্টিমোডাল BERT-ভিত্তিক ক্লাসিফিকেশনমাল্টিমোডাল এনএলপিমাল্টিমোডাল সিম্যান্টিক সেগমেন্টেশনমাল্টিমোডাল ট্রান্সফর্মারমাল্টিমোডাল ভিশন ট্রান্সফরমারসেগমেন্ট এনিথিং মডেলSelf-supervised GANস্ব-শিক্ষিত চিত্র শ্রেণিবিন্যাসস্ব-পর্যবেক্ষিত দৃষ্টান্ত বিভাজনস্ব-শিক্ষিত শব্দার্থিক বিভাজনSelf-supervised Vision Transformerআধা-পর্যবেক্ষণাধীন ভিশন ট্রান্সফরমারসিমসিএলআরস্থানিক-কালিক গ্রাফ কনভল্যুশনাল নেটওয়ার্কসুইন ট্রান্সফরমার (Swin Transformer)TimeGPTভিশন মাম্বাদুর্বলভাবে তত্ত্বাবধানে থাকা বস্তু সনাক্তকরণদুর্বলভাবে তত্ত্বাবধানে থাকা ভিশন ট্রান্সফরমার
ScholarGateVision Transformer (Vision Transformer (ViT)). 2026-06-15 তারিখে সংগৃহীত, উৎস: https://scholargate.app/bn/deep-learning/vision-transformer · ডেটাসেট: https://doi.org/10.5281/zenodo.20539026