Machine learningDeep learning / NLP / CV

আধা-পর্যবেক্ষণাধীন ভিশন ট্রান্সফরমার

আধা-পর্যবেক্ষণাধীন ভিশন ট্রান্সফরমার (Semi-supervised Vision Transformer) ViT-এর প্যাচ-ভিত্তিক স্ব-মনোযোগ (self-attention) স্থাপত্যকে এমন পরিস্থিতিতে প্রয়োগ করে যেখানে ছবির একটি ক্ষুদ্র অংশ লেবেলযুক্ত থাকে। এটি ছদ্ম-লেবেলিং (pseudo-labeling), সামঞ্জস্যপূর্ণ নিয়মিতকরণ (consistency regularization), বা স্ব-পর্যবেক্ষণাধীন পূর্বপ্রস্তুতিমূলক কার্য (self-supervised pretext tasks) ব্যবহার করে বৃহৎ লেবেলবিহীন কর্পোরা থেকে সুবিধা লাভ করে, এবং তারপর অল্প লেবেলযুক্ত সেটের উপর ফাইন-টিউনিং (fine-tuning) করে। এই পদ্ধতিটি লেবেলযুক্ত ছবির অভাব থাকা সত্ত্বেও প্রায়-পর্যবেক্ষণাধীন (near-supervised) নির্ভুলতা অর্জন করে।

MethodMind-এ খুলুনশীঘ্রইভিডিওশীঘ্রইDownload slides

পুরো পদ্ধতিটি পড়ুন

শুধু সদস্যদের জন্য

এই অংশটি পড়তে বিনামূল্যের অ্যাকাউন্ট দিয়ে সাইন ইন করুন।

সাইন ইন করুন

Method map

The neighbourhood of related methods — select a node to explore.

উৎস

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 12104–12113. link

এই পৃষ্ঠা কীভাবে উদ্ধৃত করবেন

ScholarGate. (2026, June 3). Semi-supervised Vision Transformer (Semi-supervised ViT). ScholarGate. https://scholargate.app/bn/deep-learning/semi-supervised-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateSemi-supervised Vision Transformer (Semi-supervised Vision Transformer (Semi-supervised ViT)). 2026-06-15 তারিখে সংগৃহীত, উৎস: https://scholargate.app/bn/deep-learning/semi-supervised-vision-transformer · ডেটাসেট: https://doi.org/10.5281/zenodo.20539026